
11 月 20 日消息,在 “2024 年超级计算机” 大会上,Top500 组织公布全球最强超算 Top500 榜单。位于美国劳伦斯利弗莫尔国家实验室(LLNL)、由AMD支持的 El Capitan 以 1.742 exaflops 的峰值性能成地球最快超级计算机,这是AMD支持的超算第六次登顶。
El Capitan 位于 LLNL,由AMD Instinct MI300A APU 支持、惠普企业(HPE)打造。系统有 11136 个节点,含 44544 个AMD的 MI300A,主内存 5.4PB,还有近节点存储子系统。MI300A 芯片是AMD最好的 AI 芯片,含 13 个小芯片,GPU 是 CDNA 3 架构,集成 24 个 Zen 4 CPU内核,配置 8 个共 128GB 的 HBM3 内存,基于台积电 5nm 或 6nm 制程(CPU / GPU核心 5nm,HBM 内存和 I/O 等 6nm),共 1460 亿个晶体管。El Capitan 有 11,039,616 个计算内核(CPU + GPU)。
El Capitan 的高性能 Linpack(HPL)得分为 1.742 exaflops,比第二名 Frontier 快 45%。AMD称,El Capitan 是世界最强超算、美国国家核安全管理局(NNSA)首台百万兆级计算机,用于推进科学发现和国家安全,对 NNSA 任务至关重要。
AMD 执行副总裁 Forrest Norrod 表示,很高兴 El Capitan 成为全球第二台突破 exaflop 障碍的超算,展示了AMD Instinct MI300 APU 的性能和效率。LLNL 相关人员表示,El Capitan 对美国国家核安全局核心任务重要,能增强执行大型高保真 3D 仿真能力,还能集成 AI 与传统模拟、建模工作负载。
排名第三的超级计算机是 Aurora,位于美国阿贡国家实验室,完整安装后有 21248 个 Intel Xeon Max 系列CPU、63744 个 Intel Max 系列GPU、20.42PB 内存,峰值性能可达 2 EFlop /s,但美国能源部没为其提交新基准测试,6 月前提交的 HPL 性能是 1.012 exaflop /s,存在硬件等问题,不过它在 HPL - MxP 混合精度基准测试中是世界最快 AI 超级计算机,性能 10.6 AI Exaflops。
El Capitan 基于 HPE 的 Shasta 架构,该架构由高密度液冷 EX4000 机柜和与 Slingshot - 11 网络互连绑定的 EX225a 加速器刀片组成,也为 Frontier 和 Aurora 提供支持,使 HPE 的系统在 Top500 名单前三,且都是 E 级超算。
排名第四的超算是 Eagle,安装在微软 Azure 云服务基础设施,基于英特尔 Xeon Platinum 8480C 处理器和英伟达 H100 加速器,HPL 分数 561 Petaflop /s。排名第五的超算是 HPC6,在意大利 Eni S.p.A 中心,是 HPE Cray EX235a 系统,采用第 3 代AMD EPYC CPU、AMD Instinct 250X 加速器和 Slingshot - 11 互连,性能 477.9 Petaflop /s。
Top500 榜单速度最快前十台超级计算机中,5 台(El Capitan、Frontier、HPC6、LUMI 和 Tuolumne)由AMD芯片支持;3 台(Aurora、Eagle、Leonardo)由英特尔支持;1 台(Alps)由英伟达支持;日本超级计算机 Fugaku 依赖 Arm 处理器富士通 A65FX 48c 2.2GHz。前十台中有 7 台使用 Slingshot - 11 互连,2 台使用 Infiniband,Fugaku 有自己专有的 Tofu 互连。