投稿|阿里平头哥独立传闻背后

投稿|阿里平头哥独立传闻背后
文章图片

图片来源@视觉中国

文| 数智前线 , 作者| 赵艳秋 , 编辑 | 周路平
一两个月前 , 阿里旗下的芯片公司平头哥要从阿里集团独立的消息 , 在芯片界广为流传 。而最近又有消息称 , 平头哥不独立了 。反复的信息背后 , 互联网大厂的芯片业务都怎么样了?
一两个月前 , 阿里旗下的芯片公司平头哥要从阿里集团独立的消息 , 在芯片界广为流传 。而最近又有消息称 , 平头哥不独立了 。
阿里是互联网大厂造芯潮中的一个代表企业 。从2018年开始 , 百度、阿里、腾讯和字节跳动先后官宣芯片业务 , 四年过去了 , 对于复杂的芯片而言 , 这些大厂都还处于曲折的早期阶段 。但业内人士认为 , 大厂速度不算慢 , 但要经历构建生态的艰苦一役 。
01 昆仑芯能独立 , 平头哥为何反复?平头哥独立的传闻一定程度上与团队流动有关 , 其服务器芯片等大芯片团队已经走了一些人 。业界通常把CPU、GPU这些高端复杂芯片称为大芯片 。去年这个市场非常火热 , 人才也很紧俏 。
“阿里股票去年掉了不少 。形成对比的是 , 外部一众芯片公司成功上市 , 股票冲得很高 , 内部有些人可能就有想法了 。”芯片资深人士李易告诉数智前线 , “这件事的关键是芯片业务在内外部的PE差(市盈率) , 纯粹与资本热度有关 。”
根据公开资料 , 过去两年 , 一些上市芯片设计公司市盈率高达100倍以上 , 而阿里市盈率一度掉到了15倍左右 , 形成倒挂 。
所以 , 在平头哥独立与否的同时 , 也出现了平头哥各种估值的猜测 , 其中最高达到100亿美金 , “相当惊人” , 也有估值称是一两百亿元人民币 。
“但最近芯片市场热度也下来了 , 一些不错的芯片设计企业 , 市盈率与阿里相差不多 , 都是30多倍 , 大家可能也就现实一点了 。”上述人士进一步说 , 这可能又有了不独立的传闻 。
一年前 , 昆仑芯宣布从百度独立 , 并且以130亿元的估值对外进行了一轮融资 。这也让平头哥的“独立”看起来更加顺理成章 。
“阿里平头哥跟百度的昆仑芯不一样 。”另一位资深人士刘卓告诉数智前线 , 百度目前的体量跟阿里、腾讯差别较大 , 这也导致百度无论是数据中心规模 , 还是人工智能芯片、GPU芯片的用量 , 都与阿里、腾讯有不小差距 。所以百度自研的昆仑芯片在内部用到一两万片 , 可能就到了一个相对的瓶颈期 , 它需要对外输出 , 才有经济效益 。
另一位从事人工智能芯片的资深人士张炜也告诉数智前线 , 据他所知 , 百度内部给昆仑芯很大支持 , 最大的搜索业务以及小度都用了昆仑芯 。但他观察 , 昆仑芯在内部的用量 , 已接近百度对外采购GPU芯片的量级 。昆仑芯主要用于人工智能场景 , 与GPU芯片类似 。
“而人工智能芯片是随服务器一起更新的 。现在服务器更新周期有些从过去的3年延长到5年 。”张炜称 , “百度内部需求已不足以支撑其发展 。”
互联网大厂自研芯片的一个主要初衷是降低成本 。他们自己有庞大的数据中心 , 一年对芯片的采购量不小 。根据自身业务需求 , 定制开发一些芯片 , 不仅能提高效率 , 还可以节省一大笔钱 。
“但如果我省下的钱和我投入的相比 , 不仅没有赚 , 可能还是亏的 , 我就必须要对外输出 , 才有可能把这块的投入回报最大化 。”刘卓解释 , “而且未来独立上市 , 还能再赚一波钱 。所以 , 我猜阿里也有这个想法 , 把平头哥这块利益要做到最大化 。”
02 大厂造芯尚处早期互联网大厂开始成建制地造芯 , 是从2018年7月百度发布昆仑芯片开始的 。紧随其后 , 阿里在当年9月宣布成立平头哥 , 腾讯和字节跳动也在随后一些年中 , 陆续启动了自研芯片业务 。
【投稿|阿里平头哥独立传闻背后】其中字节跳动造芯的事情被曝出是在2021年3月 。字节随后证实 , 正在组建芯片团队 。“字节的整体风格是偷偷地进村 , 打枪的不要 , 我感觉他们从各家大企业挖了很多人 , 但在公开宣传很少 。这也与张一鸣的风格有关 。”刘卓告诉数智前线 。据他推测 , 字节芯片团队可能已有数百到上千人规模 。
而接近字节的人士告诉数智前线 , 不久前 , 字节的一颗芯片已经流片(试生产)了 。根据此前的公开信息 , 字节自主研发的是云端人工智能芯片和Arm服务器芯片 。
除了字节 , 百度昆仑芯自2021年6月独立之后 , 当年8月就官宣推出昆仑二代人工智能芯片 。
“昆仑的人工智能芯片放到公开市场上 , 它的应用领域是跟英伟达的GPU直接干的 。”资深人士张炜告诉数智前线 。英伟达是目前全球市值最大的芯片公司 , 也是最大的GPU供应商 , 而GPU是人工智能领域应用最广的芯片 。但在张炜看来 , 脱离了百度这家母体 , 昆仑芯在公开市场上面临挑战 。
最大的挑战是研发资源和节奏 。“人工智能是一个高节奏行业 , 每年都有新的网络出来 , 在这个市场上英伟达每年都推出一个新的芯片架构 。”他解释说 , 如果昆仑芯按照当下差不多两年一代的节奏 , 与英伟达的差距会加大 。据悉 , 新一代昆仑芯将于2022年推出 。
这也不是百度昆仑芯一家面临的问题 。刘卓注意到 , 国内有一个“拆大船造舢板”的特点 , 这两年由于资本市场的火热 , 更是涌现出不少小团队 。这些小团队的研发资源 , 比不上推进速度超迅猛的英伟达 , “差距是在拉大的” 。
此外 , 对于昆仑芯而言 , 公开市场也不像内部容忍度那么高 , 可以静心打磨产品 。“他们需要耐力和韧劲 。”接近百度的芯片资深人士说 。
数智前线获悉 , 昆仑二代芯片订单总金额已过亿元 , 其中包括该公司拿下的地方智算中心、法院、司法检务、科研平台等项目 。
但几位业内人士认为 , 昆仑芯应尽力将芯片的最大特色 , 比如百度凤巢广告推荐系统的特色技术 , 落地到二三线互联网商用市场 。“现在昆仑芯公布的政企项目不是不需要 , 但它的管理团队应该有更高的商业价值目标 , 否则是长期不可持续的 。”
阿里平头哥是目前几家互联网大厂造芯潮中 , 最引人注目的 。它先推出人工智能芯片寒光800 。在业界看来 , 寒光800肩负了外部宣传和内部开山的双重任务 。“指标很高”、“内部要求使用了一批 , 应用跑起来的过程挺痛苦” , 在很多业内人士看来 , 并不算成功 。
之后 , 从海思空降的高管 , 在云端人工智能上更看好GPU , 由此对平头哥人工智能芯片的技术路线进行调整 , 不再做类似含光800的专用AI芯片 , 转而设计通用计算的GPU 。目前 , 这个芯片已经投片(设计完成开始制造) , 业界传闻性能高于英伟达A100 。这款芯片预计会在今年秋季云栖大会发布 。
除了人工智能芯片 , 阿里还在去年公布了另一颗大芯片——服务器CPU倚天710 。“服务器CPU是国内最后空缺的一块 , 没有大厂顶上来 。”李易告诉数智前线 。目前 , 倚天710在阿里云业务中使用 , 也有其他内部应用在探讨使用该芯片 。
除了上述大芯片之外 , 阿里平头哥还有一块小芯片业务RISC-V芯片业务 , 侧重于边缘侧和终端 。阿里的天猫精灵在该业务推广中扮演重要角色 。
而外界观察 , “佛系”的腾讯在芯片研发上曾有些摇摆 , 早期在芯片领域主要采用的是投资路线 。例如 , 2018年8月 , 腾讯领投了国内人工智能芯片初创企业燧原科技的Pre-A轮 。
刘卓认为 , 腾讯采用投资路线的一个大背景是 , 它的人工智能用量没有阿里大 , 而游戏场景中的人工智能又比较复杂 , 偏向于深度学习中的强化学习和对抗学习 。“这些偏策略的人工智能难度更大 , 相比于电商等场景的人工智能 , 我觉得不好做 。”
另一位接近腾讯的资深人士则告诉数智前线 , 腾讯核心业务如游戏 , 运行稳定 , 成本问题不是团队考虑的第一要素 , 团队更倾向于选择新功能 , 因此对自研芯片的内驱力并不强 。而腾讯内部一些人也倾向于与外部合作 。
数智前线获悉 , 腾讯AI芯片紫霄和DPU芯片都是腾讯与其投资的公司如燧原科技、云豹智能合作推进的 。其中 , 外部做芯片设计 , 腾讯内部负责软件和工具链开发 。
2021年11月 , 在腾讯数字生态大会上 , 腾讯官宣了自研人工智能芯片紫霄、视频转码芯片沧海、智能网卡芯片(DPU)玄灵 , 其中紫霄已经流片并成功点亮(达到可用 , 后续测试修改后可量产) , DPU芯片玄灵计划在2022年底推出 。
有人认为 , 国内互联网大厂在芯片业务方面 , 比海外的谷歌和亚马逊要慢 。但刘卓认为 , “国内只是起步晚 , 不算慢” 。并且 , 像亚马逊早先做人工智能芯片是通过收购团队 , 而国内几家基本都还是招兵买马自己搞 。
而张庭认为 , 国内互联网企业增速从之前的50%到现在基本持平 , 芯片业务肯定与启动时的预期不同 , 也或多或少受到影响 。
03 建生态是一场更难的战役无论国内还是海外 , 互联网大厂造芯都逃不出几个类别:云端人工智能芯片(AI芯片)、CPU和GPU 。
除了与自身业务密切相关外 , 刘卓告诉数智前线 , 由芯片带动的下游产业 , 也是个庞大的市场 。
以GPU市场上的最大玩家英伟达为例 , 去年全球收入近 270 亿美元 , 中国市场占 1/4 , 大约70亿美元 。其中近一半属于GPU , 也就是30亿美元 。大家都在抢这块蛋糕 。
“这还只是GPU卡 , 用GPU造的服务器市场可能要放大两到三倍 , 而数据中心不可能只是服务器 , 还有存储、网络、运维......最终算下来综合市场可能是芯片的5~10倍 。”所以 , 人们看到大厂并不是单纯造芯 , 他们也造服务器、存储、能源模块、数据中心......
而根据相关报道 , 有投资人认为 , 如果一家 GPU 公司能从中国市场大盘子里切 5% 到 10% , 就足以支撑起 1000 亿元人民币的市值 。在这笔账之后 , 大厂参与争夺也就不足为奇了 。
但互联网大厂要想与传统领头的芯片大厂竞争 , 最难的恐怕是生态之战 。
以GPU为例 , 英伟达用了10年时间 , 建立了CUDA生态 , 获得了一众软件和应用企业的支持 。也因为这个生态 , 商业公司普遍不敢替换掉英伟达 。刘卓透露 , 即便其他GPU卡比英伟达同等性能的卡便宜1/3也没用 , 因为客户要把原来跑在英伟达GPU上的软件迁移到新平台上 , 代价太大 。
“这就类似我原来说英语 , 现在要改说西班牙语了 。”刘卓说 。
此前 , 另一家GPU供应商AMD宣称可以做到与英伟达CUDA生态99%兼容 , 这意味着客户不用迁移就能使用 , 貌似是一条可行之路 。但实际上 , 数据中心的AI设施中 , 还是很少采用AMD的GPU 。刘卓分析 , CUDA天然是为英伟达优化的 , 即便AMD与它兼容 , 也很难发挥出自己的性能 。
而另一个被忽略的关键点是 , 包括全球的科学家或开发者 , 都在英伟达GPU上做原始创新和开发 。“它有源源不断的生态和创新涌现出来 。”这让大家离不开 。
国内企业中 , 华为最早在搭建人工智能芯片的生态 。“你看华为AI芯片昇腾 , 在生态上有几千上万人的团队在推广 , 几十个高校投几百上千万 , 其实挺难的 。”一位资深人士说 , “说实话 , 我觉得这波人工智能潮过后 , 华为可能会发现入不敷出了 , 除非这一波人工智潮还能继续把市场扩大10倍、50倍 。”
阿里的GPU出来以后 , 也面临同样的问题 。现在最现实的途径似乎是靠信息创新市场 , 能从这些做大芯片的企业中 , 成长出一两家 。
当然 , 资深芯片人士吴炜也看到了一些乐观的信息 。“比如在CPU领域 , 原来是英特尔的天下 。这几年Arm生态起来了 , 做Arm服务器CPU , 赶上了好时机 。”他举例称 , 在海外 , 亚马逊Arm服务器CPU已经获得应用 , 虽然很多软件还只支持英特尔的生态 , 但生态迁移的过程已经开始 。
李易和刘卓也关注到 , 由英特尔前总裁Renee James创建的Arm服务器芯片初创公司Ampere , 也打开了商业市场 。不仅在美国 , Ampere的芯片在国内公有云服务商上也获得应用 。它的估值已经达到60亿美元 , 并向美国证券交易委员会(SEC)秘密提交IPO文件 。“而一些国内企业认为 , 他们不比Ampere差 。”李易称 。
国内企业中 , 谁有可能把大芯片生态做起来?
现在看来有些无解 。从芯片投入和执行力上看 , 阿里平头哥排在前面 , 华为保留了大芯片业务 , 但在先进制程受限 , 而很多初创公司或传统公司规模和资源不够 。“阿里的执行力在国内肯定是前三 。”刘卓说 。
不过 , 在生态方面的投入要看阿里对芯片业务的支持力度 。如果它看重芯片 , 就会调动阿里内部的资源做投入 。去年 , 阿里进行了一次低调的组织调整 , 平头哥与阿里云智能、达摩院部门平级 , 已经不仅仅是达摩院下属的部门 。
“大芯片业务是非常烧钱的 , 而且差不多前5年都是没有任何产出 , 因此 , 有足够的资本才能做 。华为海思之所以成功 , 也是一直持续往里砸钱 。”从事多年芯片业务、并经历企业成功上市的李易总结说 , “另外一个就是你在中间阶段能够挺住 , 有钱持续进来 。反正芯片设计企业 , 10年肯定能见分晓 。”

    推荐阅读