710公海寰宇-HPE采用AMD的Helios机架架构用于2026年AI系统——新机架形态在2026年上市前迎来首个主要合作伙伴

发布时间:2023-04-10 16:33

HPE采用AMD的Helios机架架构用于2026年AI系统——新机架形态在2026年上市前迎来首个主要合作伙伴 作者: 时间:2025-12-03 来源: 加入技术交流群 扫码加入和技术大咖面对面交流海量资料库查询

新的合作让Open Rack Wide和首款搭载Venice-MI430X的超级计算机得以呈现。

1764728327728708.png

AMD与HPE正在通过一项新协议扩大长期合作关系,该协议将从2026年起将AMD Helios机架级AI架构纳入HPE的产品线。这将为Helios带来首个主要OEM支持者,并为HPE提供基于下一代Instinct MI455X加速器、新型EPYC“Venice”CPU以及与博通开发的基于以太网的扩展架构构建的完整72GPU人工智能机架的地位。

自今年早些时候推出以来,Helios一直是AMD开放机架级AI平台的参考设计。它采用了Meta的Open Rack Wide机械标准,并将MI450系列GPU、Venice CPU和Pensando网络硬件集成在液冷双宽机箱内。

AMD目标是每个机架实现高达2.9exaFLOPS的FP4计算,同时配备31TB的HBM4,并采用将所有GPU作为单一Pod的一部分暴露的扩展拓扑。HPE将通过一款专门设计的HPE Juniper交换机实现该设计,该交换机支持通过以太网的Ultra Accelerator Link。该交换机是与博通合作的结果,构成了系统高带宽GPU互连的骨干。

选择以太网进行扩展连接,旨在将Helios与英伟达以NVLink为中心的策略区分开来。英伟达的GB200 NVL72机架将36个Grace CPU和72个Blackr:破高膙辚?f然揩襮嫛蟿F鸠5pep=k?确矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鹆黮}劷:q{|?e ?%坖D覑眤丬鲩M(缬s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫ell GPU存储在一个NVLink域内,并依赖InfiniBand进行系统间流量。Helios在单一以太网结构下运行相当数量的GPU数量,该结构采用UALoE作为加速器链路层。HPE还将使用与Ultra Ethernet Consortium对齐的硬件进行大规模网络,确保设计保持在开放、标准驱动的堆栈内。

HPE的采用为Helios在2026年进入市场提供了一条路径,但此次发布也确认了下一代EPYC和Instinct产品将如何进入高性能计算领域。斯图加特高性能计算中心已选定HPE的Cray GX5000平台作为其下一款旗舰系统,名为Herder。它将使用MI430X GPU和Venice CPU,配合一组直接液冷刀片。

Herder计划于2027年下半年交付,将取代HLRS现有的Hunter系统。HPE强调了该项目能源战略的环保性,利用GX5000机架产生的废热为斯图加特大学Vaihingen校区的建筑供暖。

AMD和HPE计划明年将基于Helios的系统推向全球,为该架构提供首条商业部署路径,并树立了已投入使用的机架级Blackr:破高膙辚?f然揩襮嫛蟿F鸠5pep=k?确矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鹆黮}劷:q{|?e ?%坖D覑眤丬鲩M(缬s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫ell平台的对比。

-710公海寰宇