若是您但愿不错常常碰头海角社区 免费视频,迎接标星储藏哦~
来源:内容编译自nextplatform,谢谢。
凭借其自主研发的 Graviton 4 Arm 作事器搞定器,鸠合作事已将一款可与 AMD X86 CPU、Ampere Computing 和 Nvidia Arm CPU 等统共顶级家具相忘形的 CPU 干预到该鸿沟,况且它正在鼓吹价钱/性能的进步,从而鼓吹亚马逊各个业务部门过火 AWS 上的 IT 基础设施租出客户对其的遴荐。
色吧影院现时,Graviton 4 搞定器的内存得到了进步,这反过来又使它们野蛮承担更多受内存容量和内存带宽截至的任务。
Graviton 4 搞定器于 2023 年 11 月推出,基于Arm Ltd 的“Demeter” Neoverse V2 中枢。对于 Graviton 4 搞定器,咱们还有许多不了解的方位,如本文顶部的特质图片所示,咱们试图将已知的信息对付起来,填补空缺,以更全面地了解这款 Arm CPU 与其前代家具以及数据中心中竞争敌手 X86 和 Arm 芯片比较如何。看一看:
如您所见,AWS 的 Annapurna Labs 部门创造了“Nitro”DPU 以及 Graviton CPU、“Trainium”AI 覆按 XPU 和“Inferentia”AI 推理 XPU,在鼓吹策划达到开端进水平与镌汰这些芯片价钱并使 AWS 仍能盈利的均衡方面依然取得了长足的率先。
注:上表中以红色斜体粗体标记的阵势是The Next Platform的推测值。
与上一代 Graviton 3 比较,Graviton 4 芯片领有更快的内核、更好的内核和更多的内核,而且 AWS 初度创建了双插槽 NUMA 内存集群,以使 192 个以 2.8 GHz 运行的内核承担职责负载。最初的 Graviton 4 芯片配备了 1.5 TB 的 DDR5 主内存,运行频率为 5.6 GHz,而 Graviton 3 使用 4.8 GHz DDR5 内存,唯有 8 个内存通谈,而 Graviton 4 有 12 个,后者芯片从这些突出的通谈中得到了 50% 的容量和带宽进步,并从更快的 DDR5 内存中得到了 16.7 的突出进步。加起来,每个 Graviton 4 插槽可得到 537.6 GB/秒的带宽,这与任何其他 X86 或 Arm CPU 所能提供的相通好,对于许多卡在 CPU 上、无法纯粹移植到 GPU 的 HPC 职责负载来说依然填塞了。
Graviton 4 R8g 实例于 7 月初肃穆上市,那时咱们对其进行了扫视先容。它们涵盖 1 到 96 个 vCPU,每个 Graviton 4 插槽从 8 GB 到 768 GB;每个实例的鸠合带宽最高可达 40 Gb/秒,弹性块存储 (EBS) 也最高可扩张至每个插槽 30 Gb/秒。
正如咱们在 7 月份所说的那样,咱们以为双插槽 Graviton 4 实例是一个很是情况,因为双插槽机器的鸠合带宽唯有 50 Gb/秒,EBS 带宽唯有 40 Gb/秒。此外,莫得实例大小介于 96 到 192 个中枢之间,若是亚马逊基于 Graviton 4 构建的统共物理机器齐使用双插槽主板,那么你就会盼望有这么的实例。或者,也许它仅仅思在客户跨越 NUMA 退却后销售满载的机器。
以下是今天推出的全新 X8g 内存增强型实例与 7 月份推出的现存 R8g 实例的对比情况:
AWS 尚未公布内存增强型 Graviton 4 实例的订价海角社区 免费视频,您知谈,咱们对这类事情很不耐性。因此,咱们参谋了具有不同内存容量的 Graviton 3 实例(准确地说是基本 R7g 和 M7g Graviton 3s 的双倍增强内存),并计较了内存各别和价钱各别。恶果标明,以 4.8 GHz 运行的增量内存每小时每 8 GB 的资本为 0.0031875 好意思元。因此,咱们取这个数字,将其进步了用于 Graviton 4 实例的内存速率的加多(在 5.6 GHz 时性能提高了 16.7%),然后在上表入网算了 X8g 实例的按需租出资本。您不错思象,突出的内存容量并不是免费的,但咱们以为这是推测 AWS 可能对 X8g 实例收取的用度的合理方法。若是您使用这么的内存订价将 R8g 实例上的内存扩张到 X8g 实例的大小(这些机器的统共其他功能齐是调换的),那么您会发现租用 X8g 实例的价钱比租用 R8g 实例的价钱突出 50.5%。
若是咱们是 AWS,咱们就会这么作念。
自 2018 年 11 月 Graviton 1 初度亮相以来,Graviton 搞定器的多样顶级确立如下:
早在 7 月份,咱们就估算了节点中带有腹地闪存的旧例 Graviton 4 实例的年度按需租出资本,该资本以粗体红色斜体夸耀。咱们并不是思清楚客户会以这种姿色购买这些实例,但咱们如实思标明这些每小时用度“确定会加多”,正如演员查理·辛 (Charlie Sheen) 曾在庭审中烦闷地作证时玩笑说的那样。
在粗体蓝色斜体中,咱们夸耀了咱们为新的顶级 X8g 实例估算的年度按需租出资本。这个思法是,大内存不是免费的,您必须有使用 X8g 实例的需求。而且,把柄 AWS 的说法,咱们以为许多使用之前的 Graviton 2 和 Graviton 3 实例的客户将谨慎探讨内存增强型 Graviton 4 实例。无法在 Graviton 2 和 Graviton 3 搞定器上运行的诈欺措施(某些内存密集型 HPC 诈欺措施和内存分析和数据库)将无法在 Graviton 4 实例上运行。
大内存 Graviton 4 搞定器的一个兴致用例是 – 您猜对了 – 由 Annapurna Labs 策划明天的 Graviton CPU。为了好玩,AWS 首席布谈师(一种公关司理)Jeff Barr在秘书内存增强型 Graviton 4 芯片的博客著作中发布了此图表:
该图表夸耀了在 AWS 为 Graviton 4 软件包策划 I/O 芯片和计较芯片霎启动的 Graviton 实例数目。启动基线略低于 2,000 个实例,况且运行平方,逐日和每周的峰值最高可达此基线计较水平的 2 倍。跟着 I/O 芯片和计较芯片的策划冉冉走向流片,虚构测试和策划考据变得越来越蛮横,基线接近 4,000 个实例同期运行,峰值最高可达 8,000 个,无意致使高达 11,000 个并发实例(若是您仔细检察此图表)。
如您所见,Graviton 4 I/O 芯片于 2022 年第四季度流片,计较芯片于 2023 年第一季度流片,这是 AWS 涌现的一个兴致的信息。
然则,AWS 并未涌现 X8g 的突出内存将如何进步 EDA 性能或减少正在运行的实例数目。
据咱们所知,EDA 内容上是一种单核、单任务的令东谈主烦闷的并行职责负载,因此您在一项任务中干预的中枢数目雷同于您不错在可能的策划空间中测试的场景和确立数目。举例,上头的峰值“代表数十万个中枢同期运行”,Barr 说。此外,据咱们所知,EDA 软件是按中枢授权的,因此领有更快的中枢(Graviton 4 中枢确定成绩于 Demeter V2 策划)意味着您不错更快地完成任务,而每个插槽领有更多核情意味着您不错在每个实例中完成更多任务。这便是您在 EDA 职责上有钱无意代的原因。
望望 Graviton 4 实举例何加快 Graviton 6 搞定器的策划将会很兴致。。。也许 AWS 应该就此提供一个案例参谋。咱们很乐意参谋并撰写它。
对于许多使用 Graviton 2 X2gd 实例的 HPC 客户来说,Graviton 4 每个中枢的 L2 缓存是蓝本的两倍(2 MB 对比 1 MB),内存带宽是蓝本的 2.6 倍,每个中枢的计较性能提高了 60%。X8g 实例的内存容量和中枢数目亦然蓝本的 3 倍,EBS 带宽和以太网带宽亦然蓝本的 2 倍。统共这些齐将匡助芯片策划师更快地完成更多的 EDA 职责,况且每个职责单元的资本可能会更低。
https://www.nextplatform.com/2024/09/19/aws-boosts-memory-capacity-on-graviton-4-compute/
半导体佳构公众号保举
专注半导体鸿沟更多原创内容
关心群众半导体产业动向与趋势
*免责声明:本文由作家原创。著作内容系作家个东谈主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或维持,若是有任何异议,迎接关连半导体行业不雅察。
今天是《半导体行业不雅察》为您共享的第3891内容,迎接关心。
『半导体第一垂直媒体』
及时 专科 原创 深度
公众号ID:icbank
心爱咱们的内容就点“在看”共享给小伙伴哦