{调取该文章的TAG关键词}|让超算再升级的存储系统,华为凭什么?
文章图片
世界上第一台计算机叫什么?很多人可以不假思索地回答——“埃尼阿克” (ENIAC) 。
那么,“埃尼阿克” 最初被用来干什么呢?少有人知道,1946年,“埃尼阿克” 是为了解决弹道计算问题而生,宾夕法尼亚大学花费40万美元巨资才研制出“埃尼阿克” ,当时的计算机是一种战略物资 。
在很长一段时间后,个人PC的普及才让计算机逐渐进入大众视野,IBM和Apple都是第一代家用电脑厂商,而计算机作为战略物资的属性以另一种名字保留了下来,也就是 HPC (High Performance Computing,高性能计算) 。
HPC成为计算机科学的一个分支,使用超级计算机和并行处理技术解决复杂计算问题,主要瞄准大规模科学问题的计算和海量数据的处理,如科学研究、气象预报、计算模拟、CFD/CAE、生物制药、基因测序、图像处理等等 。每年的全球HPC Top 500高性能计算机排行榜都备受瞩目 。
近年来,大数据和AI等新兴应用催生 HPC 发生另一种变化,不同于上世纪计算机的向下平民化,HPC 向上拥抱更为复杂的业务负载,使得传统HPC开始向 HPDA (High Performance Data Analytics)方向演进 。
文章图片
华为常务董事、ICT产品与解决方案总裁汪涛
在2021年华为全联接大会上,华为常务董事、ICT产品与解决方案总裁汪涛介绍了数字基础设施七大创新与客户实践,其中业界首个面向HPDA的分布式存储OceanStor Pacific引起热议,何谓高性能数据分析HPDA,HPDA又需要什么样的分布式存储?不妨一观 。
HPDA:从数据中攫取价值我们手中智能手机的算力,远超NASA在1969年登月计划中最先进计算机的算力,但相较于手机,HPC所要解决业务的复杂水平,也呈现指数级发展,一大变化就是数据的爆炸式增长,使得原有HPC架构的存储不堪其重 。
传统HPC主要从仿真物理模型中计算价值,需求是无与伦比的大算力,而HPDA泛指利用HPC资源的数据密集型负载,典型特点是数据量大、时效性强以及算法复杂,从数据本身提取价值,两者业务逻辑不同,导致存储需求不同 。
例如地震勘探从二维向三维的演进中,数据量增加了5-10倍;电影渲染从2K升级到8K的革命中,数据量增长16倍;卫星测绘领域,探测精准度由20米缩小到2米,数据量同比增长70倍 。海量的数据,需要高性能的存储,这是HPC向HPDA演进要解决的根本性问题 。
传统HPC的存储主要用来文件共享、Scratch和归档,AI业务负载则涉及到数据收集、输入、清洗、训练、推理和归档一系列复杂操作,原有存储系统并不是为这种存储工作流程而设计的,自然也就无法很好满足新存储的需求 。
在关键性能要求上,传统HPC负载通常基于顺序大I/O型,AI业务负载需要顺序大和随机小I/O型的混合,用于AI训练的数据存取需要快速的随机小I/O型 。
应用场景的变化催生了各种耐用性和弹性解决方案需求 。例如归档需要极具高性价比的解决方案,没有苛刻的性能要求;传统的临时应用需要将临时结果转移到持久存储,需要高性能以防止出现故障;HPDA 解决方案需要混合存储需求同时满足高性能、瞬态存储和持久弹性存储的不同要求 。
此外,当存储系统变得复杂化,内部多种协议发展为另一种壁垒,不同数据采用不同的访问方式,每种访问方式都需要独特的协议支持,横亘在业务负载中消耗通信时间和计算资源 。
推荐阅读
- {调取该文章的TAG关键词}|肯德基、喜茶供应商「宝立食品」要上市;文和友旗下茶饮品牌「MAMACHA」杭州首店开业;中国邮政进军咖啡领域|消研所周报
- 投稿|体量庞大,微软还能突飞猛进吗?
- 投稿|中国企业的冬奥进行时
- 投稿|天猫能否再造一个京东?
- ups|数据中心该如何迎接即将到来的元宇宙未来?
- 投稿|主播围攻星巴克
- 投稿|字节跳动急流勇退,兴趣电商卷土重来
- 宋pro|到底有啥不同?宋Pro DM-i/宋Plus DM-i应该怎么选
- 佣金是谁给谁的 佣金是什么意思
- 战略|小米手机最大战略失误就是LOGO应该选择一粒米