本文将讨论主要供应商在 2022-2023 年使用的主要服务器 CPU 意识形态。到 2022 年,我们认为到现在就会推出的许多芯片反而被推迟了。因此,我们将花一点时间让大家了解市场的发展方向。具体来说,我们将讨论 Arm、Intel 和 AMD 服务器 CPU 意识形态。我们还将讨论为什么从现在开始 18 个月后购买服务器看起来会与现在大不相同。
?
文章图片
简单的 2022-2023 服务器 CPU 框架 在 2022-2023 年,我们将使用一个简单的框架:
- Arm – 更多核心,更好
- 英特尔– 更多加速器,更好
- AMD – 更温和,更好
上述描述只是方便人们记住它,我们还将讨论这种情况最近如何发生了很大变化。
今天的 Arm CPU(公开)扩展到 128 个内核。这是由多达 128 个内核的 Ampere Altra Max 领导的,比 80 核 Ampere Altra 有所改进。Ampere 的 CPU已成为非 CSP 特定 Arm CPU 的事实标准。甚至 Oracle Cloud、 Microsoft Azure和落后的 Google Cloud都在使用 Ampere Altra(非 Max)CPU。 Ampere 做了什么,Marvell- Cavium ThunderX2团队没有设法让 Arm 服务器固件更广泛地可用。Arm 和 x86 之间仍然存在比 Intel 与 AMD 大许多倍的平台差距,但 Ampere 已经完成了显着缩小这一差距的工作。Ampere 正在为云服务提供商构建高核数 Arm CPU。
?
文章图片
顺便说一句,一些分析师喜欢将华为/海思鲲鹏 920作为 PCIe Gen4 Arm 服务器 CPU 的竞争对手。现在两者都使用了,我们可以看到为什么即使是中国国内市场也转向更喜欢安培了。下面的照片将展示我们一直在做的一个项目。
文章图片
2022-2023 年,Ampere 的下一步行动将是随着 Ampere 宣布 5nm Arm Server CPU AmpereOne。我们预计 5nm 工艺技术将带来更高的核心数量采用率,以及新的定制设计核心。
?
文章图片
虽然许多人喜欢将 Arm CPU 直接与 x86 CPU 进行比较,但有一个重要的警告。目前,世界上很多企业软件都只支持 x86,其中大部分是按内核许可的。对于这些市场,实现最高的每核性能是目标,因为软件许可成本相对于硬件而言非常高。面对大量纯 x86 工作负载的企业,最终通过拥有更大的纯 x86 占用空间而不是混合架构来节省成本。有时这甚至意味着只有英特尔,甚至不是英特尔和 AMD。
迄今为止,许多 Arm 服务器 CPU 都采用了不同的方法。他们专注于达到一致的 vCPU 性能,而不是追求最大的每核性能。对于通常是关键价值驱动因素的云服务提供商 (CSP)。客户不需要 AVX-512 来运行 Nginx Web 服务器或 Redis 键值存储。相反,将芯片优先级转移到整数工作负载,然后将 SMT 换成物理内核,这意味着 Arm 供应商可以在整个芯片上提供更一致的性能。对于试图提高利用率的云提供商来说,这是关键指标。我们没有看到更多 128 核心部署的原因之一还归结为内存和 I/O 带宽以及为客户实现这种平衡。
AWS Graviton3更进一步。64 核部分甚至通过将节点限制为单个 CPU 来避免追求最大的每个节点性能。然后,AWS 可以专注于为其安装提供正确的 I/O 和内存组合以及正确的每机架功率指标。
?
文章图片
2023 年,我们预计会看到 NVIDIA Grace 和 Grace Hopper。目前,这些都集中在 HPC 市场。NVIDIA 迫切需要 Arm CPU。NVIDIA 将其大量浮点和 AI 卸载到其 GPU,并将网络处理、加密和压缩卸载到其BlueField DPU。它目前的主要问题是英特尔和 AMD 推迟了他们的 PCIe Gen5 部件。
文章图片
在没有 CPU 和平台的情况下,NVIDIA只能依靠下一代 H100 GPU、下一代 BlueField-3 DPU、ConnectX-7 Infiniband等技术。英伟达可能会说它计划继续与英特尔和 AMD 合作。它也正在经历产品准备就绪,但其主要竞争对手却阻碍了它需要推出的平台。虽然 NVIDIA 表示它计划保持合作伙伴关系充满活力,但人们只能想象,知道自己的竞争对手正在支撑其业务将如何侵蚀这些合作伙伴关系。请在几周后继续关注,因为我们将推出 Ampere 和 A100 服务器内容,因为这是行业趋势。
虽然大部分 Arm 市场都专注于“更多核心,更好”,但将会有一个市场,例如超级计算机,甚至只是提供 Arm 服务器将填补的下一代连接(例如 NVIDIA)。
与“更多核心,更好”相反的是英特尔,“更多加速器,更好”。
英特尔 – 更多加速器 更好 【服务器|Arm、Intel 和 AMD 服务器 CPU未来2年市场发展分析】当人们看到代号为“Sapphire Rapids”的下一代英特尔至强(或第四代英特尔至强可扩展处理器)时,有一个关键主题。这是 SC21 在下一代 Intel Xeons 上的幻灯片:
?
文章图片
这是 2022 年英特尔投资者会议上的更新幻灯片:
?
文章图片
人们很快就会注意到,专门用于加速的滑动量正在增加,提到了QuickAssist和Crypto Acceleration 。在接下来的两周左右,我们将在 Ice Lake 上使用专用硬件 QuickAssist 加速卡。随后将研究集成到Ice Lake D中的技术。
我们认为英特尔在 2022-2023 年不会拥有领先的核心数量。相反,我们确实认为英特尔最终会为许多工作负载提供最高的每核性能。常见基准测试(例如,一种工作负载或一种类型的功能)与使用许多不同功能的实际工作负载之间存在一些差异。这就是为什么我们不仅仅使用 Ice Lake 的加密引擎展示 OpenSSL 的性能,而是使用了一个堆栈,包括数据库、nginx Web 服务器、php-fpm 和 OpenSSL。
?
文章图片
同样,英特尔也有 英特尔 Sapphire Rapids HBM,它将带来海量的高带宽封装内存。对于内存带宽受限且无法适应 Milan-X/Genoa-X 风格的大型 L3 缓存的应用程序,从每个核心的性能来看,这将是一个巨大的性能提升。
文章图片
到目前为止,还没有太多与它相关的谈论,但英特尔也在推进人工智能加速等领域。正如我们在 Ice Lake Xeons 中看到的,如果您的工作负载不是纯 AI,例如服务 WordPress 不是纯加密加速,那么片上 AI 加速可能就足以不需要专用的 PCIe 卸载加速器。这是来自 Ice Lake 的推理示例:
?
文章图片
在 2022-2023 年,我们可能会看到英特尔大量使用加速器,再加上其现有技术,这意味着它在一组异构工作负载上具有出色的每核性能。请记住,单核性能对于高单核软件许可成本至关重要。其中很大一部分将归结为将 AI 推理和加密/压缩等部分工作卸载到板载加速器,而不是使用 CPU 内核。
英特尔最终可能会使用更少的内核,但它认为加速器越多越好。另一方面,AMD 处于中间位置。
AMD – 更适度 更好 如果您看过各种 AMD FAD 2022 文章,您可能了解了 AMD 2022-2023 年的下一代部件:
-Genoa / Genoa-X
-Bergamo
-Siena
这些芯片将增加核心数量,同时提高加速能力。
Genoa 是 AMD 的下一代 EPYC(霄龙)CPU。在新一代产品中,每个插槽我们将获得多达 96 个内核。将支持 PCIe Gen5 和 DDR5,但我们也认为会有一些适度的方面,因为具有 12 通道 DDR5 的 96 核芯片将是一个极端的挑战,以适应常见的 2U 4 节点密集计算外形。
?
文章图片
尽管如此,对于 Zen 4,AMD 所做的不仅仅是“更多核心,更好”。AMD 还在添加 AI 加速、AVX-512 等。我们预计 AMD 不会在加速器方面与英特尔匹敌。相反,AMD 允许在 Intel 上进行开发,然后在有软件基础后提供支持。AVX-512 是一个很好的例子,如果软件支持它可以获得巨大的收益,但必须首先添加该支持。
?
文章图片
AMD 还将 Genoa-X 作为下一代Milan-X部件,用于更大的本地缓存。然后,它拥有 Siena 以实现更低功率和更小尺寸的部件。
?
文章图片
在许多方面,AMD 正试图以“更中间、更好”的方式跨越 Arm 和英特尔的方法。
AMD 和英特尔计划推出更多、更好的内核 随着 Arm 供应商构想提高每核性能并为其 CPU 增加加速的方法,AMD 和英特尔也意识到他们需要在更多核心、更好方面发挥作用。
AMD 的 Bergamo 将于 2023 年推出。这将是一个 128 核/256 线程部件,可在与 Genoa 相同的插槽中增加核心密度。
?
文章图片
就英特尔而言,它知道它需要一个横向扩展的密集核心架构。为此,它计划拥有塞拉森林。基于更类似于 Arm 当前产品的 E 内核,这应该允许英特尔达到大量内核数量,这将使 2022 时代的处理器相形见绌。英特尔的进入定于 2024 年。
?
文章图片
这是市场的有趣部分。主要参与者都在努力解决其他人正在参与的细分市场。
在十年内交换理念英特尔和 Arm 我们想指出的一个小而有趣的点是,从 2012 年到 2022 年,英特尔和 Arm 交换了理念。
在 2011-2013 年,Arm 服务器开始成为一个新想法。Arm 的想法是,它可能没有最好的内核,但带有加速器的低功耗 CPU 将赢得大部分市场。Arm 供应商有两个主要问题。首先,2011-2013年英特尔在制程技术上领先台积电等。这种制造优势使得提高几十个百分点的效率被英特尔更好的工艺所抵消。其次,英特尔使用 QuickAssist 构建了一个“Arm-killer”CPU,有效地将 Arm 服务器倒退了十年。
?
文章图片
带有 Avoton 和 Rangely 的 Intel Atom C2000 系列是 Arm 的直接反击,那是在 2014 年。到 2017 年,我们有了ThunderX2,AWS 有了 Nitro,但很大程度上,这个预测是正确的。现在是 2022 年,Arm 开始进军,尽管是在不同的细分市场。这是必然会发生的事情,只是比我们八年前预期的要长得多,而 Atom C2000 系列确实是造成这种延迟的根源。
不过,这其中最有趣的部分可能是,在 2022 年,英特尔的计划是减少带有加速器的内核,而许多 Arm 供应商正在计划更多内核并在加速器上轻量化。Arm 供应商会采用一些加速器,就像那个时代的 Intel将在 2022 年分配它们。
最后的话 2022-2023 年将充满服务器市场的巨大变化。到 2024-2025 服务器问世时,2021 代 Ice Lake 和 EPYC Milan 服务器将像我们今天看到的 2011 年 Sandy Bridge Intel Xeon E5-2600 V1 服务器一样古朴。这种变化会吓到很多人。我们正在进入一个时代,在三年内我们将看到服务器市场之前需要十年才能发生的巨大变化。
文章图片
这也许是当今市场竞争更加激烈的好处,随着行业的发展,我们现在有机会以更精细的方式解决特定细分市场的解决方案。对于我们这些使用服务器的人来说,这种竞争意味着我们将在不久的将来获得很多有趣的设计,因为参与者将他们的设计理念扩展到新的领域。
推荐阅读
- linux|第三阶段.Linux+arm
- 嵌入式基础|ARM 内核寄存器 和 基本汇编语言讲解
- ARM V8A体系结构-第十三章 内存排序
- ARM V8A体系结构-第十四章 多核处理器
- windows|NSSM - 将任何exe应用封装成windows服务的神器
- webpack|采用 vue+webpack 构建的单页应用——私人博客 MintloG 诞生记
- PostgreSQL|2、PostgreSQL数据库介绍
- 分布式|系统设计.如何设计一个秒杀系统(完整版)
- Linux|Linux网络(应用层HTTP)