百度|3年完成2款云端AI芯片研发量产,百度造芯为什么这么快()
明敏 发自 凹非寺
量子位 报道 | 公众号 QbitAI 3月完成独立融资、估值130亿元,6月分拆成立昆仑芯科技,8月发布昆仑2.0……
今年,百度在造芯上,都是大动作。
其中最瞩目的莫过于:将智能芯片架构部独立融资、分拆成立昆仑芯(北京)科技有限公司。
从这个动向不难看出,在“如何设计出更好的芯片”这个问题之上,商业化落地也成为了百度要考虑的事情之一。
那么百度的底气来自于哪?
3年量产2款云端AI芯片 这或许从百度研芯、造芯的历程上就能找到答案。
2018年,百度宣布自研中国首个云端AI芯片——百度昆仑1。
它采用14nm工艺,16GB HBM内存,提供512GB/s的内存带宽,每瓦算力达0.43TFlops。
2020年,百度CTO王海峰透露,百度昆仑1量产超过2万片,并已实现应用部署。
今年8月,升级版的昆仑2.0在百度世界大会上亮相。
7nm制程、百度自研2代XPU架构,每瓦算力1.07TFlops,支持NLP、视觉、语音等各种类型算法,能做推理也能做训练;同时支持C和C++编程。
较上一代而言,昆仑2.0在整体性能上提升了2~3倍,而且也已实现量产。
文章图片
3年发布2款自研云端AI芯片,还都实现量产,百度在造芯上的速度可见一斑。
要知道,一款芯片想要实现量产,往往需要经历2~5年。
在前端和后端设计就要耗时1~3年,设计完成后的流片环节需要3~6个月。当然还会有流片失败一切重来的风险;实际过程中,流片失败3~5次都很常见。
如果流片成功后,一般还需要经过3~12个月的测试调优,才能实现最终量产。
据百度昆仑芯商业分析师宋春晓透露,百度昆仑芯两代产品均在一年半左右完成设计,且都是一次流片成功。
文章图片
为什么可以这么顺利呢?
这与百度早早入场造芯、专注FPGA不无关系。
2010年左右,百度就启动了FPGA AI加速器项目。
FPGA是特殊应用集成电路中的一种半定制电路。它的特点就是可以快速成品,内部逻辑可以被设计者反复修改,调试成本相对较低。
2015年,百度部署FPGA已经超过5000片,2017年则超过了12000片。
【百度|3年完成2款云端AI芯片研发量产,百度造芯为什么这么快()】2018年后推出的昆仑系列,也是基于FPGA。
百度AI已经落地 事实上,在昆仑芯的支持下,百度的许多AI技术已经在我们身边悄然落地。
比如东京奥运会上,百度提供的国内首个“3D+AI”跳水辅助训练系统。
云端的3D视觉技术,可以实现运动员三维姿态重建,对跳水动作进行精准量化评估,进而实现智能打分。
教练员和运动员也可以借助AI系统,对训练视频进行高效的回顾、横向对比和纵向评估。
泉州水务大脑也是案例之一,百度通过AI技术手段帮助泉州水务集团整体人员效率提升了5%以上。
并且让制水供水单位能耗下降了8%、分散式污水处理设施运行可靠性提升5%,可以说是实现了良好的经济效益、管理效益和社会效益。
在国网新疆电力,基于百度智能云和国网电力联手建设的“AI中台”,电站巡检机器人能够代替人捕捉巡检过程中的每一处细微差错,既缓解了偏远地区巡检人力紧缺、工作环境恶劣的难题,又有力为西电东送提供保障。
今年百度世界大会上,李彦宏表示,新一代昆仑2.0可以部署的场景非常多,包括互联网核心算法、智慧城市、智慧工业等领域。
未来还将在HPC、生物计算、智能交通、无人驾驶等更广泛空间发挥作用。
在最近的百度AI开放日活动上,宋春晓还透露:未来,昆仑芯科技将会推出昆仑芯3、用于无人驾驶的昆仑芯和昆仑芯4。
推荐阅读
- 2020-12(完成事项)
- 一些杂感(11)
- 作业没有完成仍坚持要开家庭会议|作业没有完成仍坚持要开家庭会议 44
- 这次,我想先完成一个承诺
- 百度云极速下载,来体验飞的感觉,还可以看最新动漫的百度云视频哦
- 阅读《此生未完成》一
- EasyOA|EasyOA 基于SSM的实现 未完成总结与自我批判
- 每日复盘|每日复盘 Day122
- 此生未完成
- 深圳建立强制立体绿化制度|深圳建立强制立体绿化制度 今年将超额完成46万平方米