2022全球超算TOP500 美国E级超算Frontier登顶,中国仍有望逆袭


2022全球超算TOP500 美国E级超算Frontier登顶,中国仍有望逆袭

文章插图
2022年5月30日 。在德国汉堡举行的 ISC 2022公布了第59届的全球超算TOP500榜单 。位于美国橡树岭国家实验室 (ORNL) 的新型超级计算机Frontier以绝对优势 。成功超越日本的Fugaku 。成为了全球最强超级计算机 。同时也是全球首个真正的百亿亿次超级计算机 。中国的神威·太湖之光和天河二号排名下滑至第六和第九 。
百亿亿次超级计算机Frontier:性能最强 。能效最高
据介绍 。Frontier 在美国橡树岭国家实验室的计算设施 (OLCF) 占地 372 平方米 。由 74 个 Cray EX 机柜组成 。拥有 9,408 个节点 。每个节点配备一个 AMD Milan “Trento” 7A53 Epyc CPU 和 四个AMD Instinct MI250X GPU(GPU核心总数达到了37,632) 。每个节点通过 Hewlett Packard Enterprise(HPE)的 200 Gbit/秒的Slingshot-11 互连连接 。每个节点在 CPU 上运行 512GiB DDR4 内存 。在整个节点上运行了 512GiB HMB2e(每个 GPU 128GiB)以及一致的内存 。
[备注:1GiB=(1024*1024*1024)B=1073741824B
1GB(1000*1000*1000)B=1000000000B)]
2022全球超算TOP500 美国E级超算Frontier登顶,中国仍有望逆袭

文章插图
2022全球超算TOP500 美国E级超算Frontier登顶,中国仍有望逆袭

文章插图
2022全球超算TOP500 美国E级超算Frontier登顶,中国仍有望逆袭

文章插图
整个Frontier 系统聚合了8730112个计算核心 。9.2 PB 的内存(包括4.6 PB 的 DDR4 和 4.6 PB 的 HBM2e) 。37 PB 的节点本地存储 。并可访问 716 PB 的中心范围存储 。
凭借强大的硬件配置 。Frontier在 Linpack 基准测试下达到了1.102 exaflops 的峰值实测性能 。是排名第二的日本Fugaku性能(442 petaflops)的两倍 。比TOP500榜单上第2至8名性能的总和还要高 。
2022全球超算TOP500 美国E级超算Frontier登顶,中国仍有望逆袭

文章插图
美国橡树岭国家实验室主任Thomas Zacharia 在昨天举行的媒体预先简报会上说 。“1.1 exaflops的性能 。很容易四舍五入而忽视这个0.1 。但这个 0.1 代表了 100 petaflops的巨大性能 。”
此外 。TOP500榜单上还列出了Frontier的理论最大峰值速度 (rPeak) 。但 HPE 和 美国橡树岭国家实验室 及其他相关者 。希望进一步的进行优化 。以将Frontier的理论峰值速度提高到 2 petaflops 的项目目标 。在这种情况下 。Linpack 得分也将得到提高(Linpack 效率也可能提高 。目前仅为 65.4%)在昨天举行的媒体简报会上 。Thomas Zacharia也证实了这一消息 。
更为值得一提的是 。Frontier功耗仅为21,100KW 。比排名第二的Fugaku的29,899KW功耗还要更低 。同时 。Frontier还以每瓦 52.23 gigaflops 的极高能效比 。超过了日本的 Preferred Networks MN-3 系统 。在 Green500 中也位居榜首 。
“世界上最快的超算也是最节能的 。这一事实简直令人惊叹 。”Thomas Zacharia说到 。
美国优势扩大 。欧洲开始崛起 。中国仍有望逆袭
在2021年5月底公布的全球TOP500超算榜单上 。美国当时仅有四个超算系统位居前十榜单 。分别排在第二、第三、第六和第七的位置 。当时中国的神威·太湖之光和天河2号还占据了第四和第五名 。但是 。时隔一年 。随着美国百亿亿次超算Frontier的登顶 。全球超算格局发生巨变 。美国在超算领域的优势扩大 。在前十榜单当中也已占据了一半 。
2022全球超算TOP500 美国E级超算Frontier登顶,中国仍有望逆袭

文章插图
△2021年5月底公布的全球TOP500超算前十榜单
在最新的全球TOP500超算前十榜单上 。除了排名第一的Frontier之外 。美国橡树岭国家实验室Summit 在HPL 基准测试中 。以 148.8 Pflop/s 的性能排名全球第四 。Summit 有 4,356 个节点 。每个节点包含两个具有 22 个内核的IBM Power9 CPU内核和六个NVIDIA Tesla V100 GPU 。每个都具有 80 个流式多处理器 (SM) 。这些节点通过 Mellanox 双轨 EDR InfiniBand 网络链接在一起 。
位于美国加利福尼亚州劳伦斯利弗莫尔国家实验室的Sierra以94.6 Pflop/s的性能排名第 5 。它的架构与Summit 非常相似 。它由 4,320 个节点 。每个节点两个IBM Power9 CPU 和四个 NVIDIA Tesla V100 GPU 构建而成 。
此外 。美国的超级计算机Perlmutter和Selene分别以64.6 Pflop/s和63.4 Pflop/s的性能 。排名第7和第8 。其中 。Perlmutter基于 HPE Cray“Shasta”平台 。以及一个具有基于 AMD EPYC 的节点和 1536 个 NVIDIA A100 加速节点的异构系统;Selene同样是基于AMD EPYC 处理器和NVIDIA A100节点 。
2022全球超算TOP500 美国E级超算Frontier登顶,中国仍有望逆袭

文章插图
2022全球超算TOP500 美国E级超算Frontier登顶,中国仍有望逆袭

文章插图

推荐阅读