芯片|永远不要投资DPU?( 十 )


不仅规模化了,在云的场景中收益还巨大了 。
阿里云在国内云计算厂商技术团队里是最拔尖的 。
亚马逊云在技术上从来没让人失望过(公关广告投入就另说了) 。
他们造DPU的团队,犹如雄师过江,天翻地覆慨而慷 。
自此,云厂商分成两列纵队:有DPU的,没有DPU的 。
中国男足,笑而不语,大比分落后,说的就是那些没有DPU的云厂商 。
亚马逊云和阿里云都是革命者,且心有灵犀,选了相同的技术方向 。
云灿霞铺,同是天涯得意人 。
亚马逊云的SA是解决方案架构师(SolutionsArchitect),很能打,一言不合就秀(show)代码,简直人人都匹敌创业公司CTO 。
一位SA私下里告诉我:“简单来讲,DPU就相当于是把虚拟化不同的工作负载,下放到不同的卡上 。”
留意“下放”这动词,得体会了一阵子,才想通 。这个词,用得妙啊,它背后的专业术语是“任务卸载” 。
“Nitro是一张卡,把负载(Hypervisor虚拟层,存储,网络)都绑上去 。也就是把影响虚拟化安全、性能、稳定性的那些东西都装进板卡里去 。”
“它不是一张卡,是一套卡 。每张卡片有不同的目标 。”
“Nitro System之所以称为是一个系统,它包含三个独立的部分:Nitro 卡、Nitro 安全芯片和Nitro 管理程序 。
以前嘴馋,必须自己会烧两个小菜,但是,现成的API准备好了 。
不仅会烧菜,还会自创新菜 。
学(搞)烧(创)菜(新),没那么难 。
因为Nitro系统是一个“基础组件盒子”,有许多不同的组装方式,从而使AWS能够灵活设计和快速交付(EC2实例类型),计算、存储、内存和网络都可以成为组合的选项 。
选择困难症患者看到后,赶紧喝了一口咖啡,压压惊 。
亚马逊云员工也谈到,这种做法能够将云计算微服务架构扩展到硬件,方便“创新API” 。
2017年的时候,爱看热闹的人,围观神龙MOC卡,但,万万没有想到,围观的就是DPU 。
一位阿里云异构计算团队的员工私下里告诉我:“MOC可以理解为一台小服务器 。物如其名,卡上微系统(Micro-servicer On Chip) 。但是,2021年,我们对外口径统一用神龙芯片,不叫MOC卡 。”
阿里云员工还说:“对于神龙芯片的细节,公司希望对外少谈 。有不少人,在打听 。”
2021年10月20日,神龙推出第四代,江湖人称神龙4.0 。
比起第三代神龙,关键性能指标提升了多少呢?
说两个关键的,网络关键性能指标提升一倍以上,存储关键性能指标提升两倍 。
神龙4.0全球首次搭载大规模弹性RDMA高性能网络,网络延迟整体大幅降低 。
RDMA作为网络通信技术,不是一个新技术,但是,阿里云弹性RDMA,让RDMA这项技术,从高性能计算(HPC)这个小众领域,走向公有云 。
曾经RDMA大规模组网的能力,是整个业界都解决不了的问题 。
弹性RDMA将对云原生微服务、无服务计算应用的性能提升大有帮助,甚至是Java 中用Netty 网络编程框架的应用程序,都会从中受益 。
芯片|永远不要投资DPU?
文章图片

2021年的秋天,张献涛对我说:“神龙芯片是目前业界最出色的DPU,没有之一 。”
DPU要才华有才华,要颜值有颜值,但是还有“两大怪” 。
一大怪,亚马逊云和阿里云的DPU,不外卖 。
DPU作为专用芯片,不要你懂,只要自己懂自己 。
另一大怪,不少云计算厂商,一提自研DPU,就说拜拜 。

推荐阅读