人工智能|AI年度总结与展望:超大规模预训练模型爆发,自动驾驶迎商业化前夜( 四 )


从核心技术的驱动看,基础模型改进和自监督技术不断提升着模型性能上限,同时多模态技术融合使得技术方案的能力越来越强,可?持更复杂的场景并带来更好的体验 。
商业化难点主要在于商业模式选择
马泽君认为,现阶段,智能语音商业化的难点主要是商业模式探索和路线选择的问题,具体包括如何更好地满?需求,控制成本以及保证交付质量 。
一方面,AI商业模式探索需要始终围绕需求展开,提升模型效果和在真实场景中解决用户或客户的问题不能等同 。解决实际问题需要AI研发?员深入业务场景,理解需求和条件限制,找到合理的产品技术?案,并不断思考和抽象功能和技术,沉淀通用的技术解决?案,探索验证可规模化的标准产品,降低定制周期和代价 。
另一方面,AI技术研发成本非常高,如何通过优化算法低对领域数据依赖,建设自动化平台降低人力消耗和提升研发流程效率对成本控制非常关键 。
最后还要重视交付质量和售后服务 。只有同时做好上述三个环节,才能完成从需求到交付到服务的整个链路,从而奠定规模商业化的基础 。
端到端和预训练等技术仍然值得关注

  •  端到端序列建模技术
(1)准确率和推理速度更上?层楼的端到端技术值得期待,其中对?机制(alignmentmechanism)是端到端序列建模的关键 。字节跳动AI LAB正在探索的连续整合发放CIF模型(Continuous Integrate-and-Fire)是一种创新的序列端到端建模对齐机制,具有软对齐、计算代价低和容易扩展的特性 。
(2)在端侧设备上的端到端语?识别和合成技术落地值得关注,特别是轻量级、低功耗、?准确度和定制灵活的端到端语?识别和合成技术 。
(3)端到端语?识别技术?向的热词定制和领域?适应技术?常可能有重?进展 。
  • 无监督预训练技术
(1)超?数据规模和模型size的语??监督预训练技术值得关注,语??监督预训练的BERT已经出现 (Wav2vec2.0/Hubert), 语??监督预训练的GPT-3很可能在2022年到来 。
(2)多模态语??监督预训练技术也?常吸引?,该技术可能会极?地提升预训练模型的表征能?,从?带来?监督预训练技术更?范围的落地应? 。
(3)无监督预训练技术在语?合成、?乐分类、?乐识别领域的应?同样值得关注,借助?监督预训练的声学?频表征,可以有效提升下游任务的性能 。
  • 语?对抗攻击与防御技术 。
(1)语?领域的对抗攻击,从攻击?段上来看,将从当前的?盒攻击,进?步进化成?盒攻击;从攻击内容来看,将从当前流?的untarget攻击进化成target攻击 。
04 群雄逐鹿,谁能赢得自动驾驶之战?2021年,自动驾驶领域格外热闹 。
造车热
今年,互联网大厂、新造车势力和传统企业纷纷进场布局自动驾驶,可以说能下场的巨头们基本上都下场造车了,自动驾驶“战场”群雄逐鹿,不知未来谁执牛耳?
在资本市场上,自动驾驶也备受追捧 。据零壹智库分析,继2016-2018年热潮之后,2021年自动驾驶领域迎来第二次投资热潮 。2021年11月,Momenta完成超10亿美元C轮融资,创下年度自动驾驶领域最大规模融资记录 。
商业化前夜
Robotaxi是自动驾驶最有价值的商业模式,现阶段,很多自动驾驶技术公司都在做Robotaxi的尝试 。今年,很多自动驾驶车辆从封闭路测场地走向真实道路 。百度、小马智行、文远知行、等企业已实现面向公众的示范运营,开始探索商业化 。11月,国内首个自动驾驶出行服务商业化试点在北京正式启动,百度和小马智行成为首批获许开展商业化试点的企业 。业内人士认为,这标志着国内自动驾驶领域从测试示范迈入商业化试点探索新阶段 。

推荐阅读