投稿|逐渐破圈后,虚拟主播距产业成熟有多远?( 三 )
文章图片
以科大讯飞为例,去年全球1024开发者节上,董事长刘庆峰透露科大讯飞5分钟就可以生成一个虚拟主播 。今年全球1024开发者节发布业界首个虚拟人交互平台后,刘庆峰表示1分钟就可以定制一个虚拟主播 。
从5分钟到1分钟定制1个虚拟主播,意味着企业、创业者、个人用户都可以通过虚拟人交互系统低门槛定制虚拟形象,从降低生产成本来说无疑是一个重大提升——背后,主要得益于科大讯飞在AI技术上的20多年沉淀,在语音识别、语义理解等多种AI技术上的领先,以及AI技术本身的不断创新、迭代升级 。
02 从1到10,虚拟主播产业成熟挑战随着虚拟主播逐渐破圈,B端品牌合作到C端流量变现的商业模式,最近两年也逐渐清晰,因此成为国内创业风口,出现了不少专门运营、营销虚拟主播的公司 。
比如虚拟艺人厂牌VirtuaReal下属艺人七Nana7mi,今年双11售卖同款外套,当日成交额超过130万 。这意味着,虚拟主播带来新的商业价值有很大可能性 。
不过,迄今为止,“柳夜熙”、洛天依在国内都只有一个,更别说创造出像初音未来、绊爱这样在全球二次元爱好者有极高影响力的虚拟角色 。而在TOB上的应用,大部分也只是停留在播报、主持等初级阶段 。
相比日本早就形成标准化的成熟产业链,目前国内虚拟主播产业整体还在初级阶段,想从1到10走向成熟,在技术、内容、商业化、产业链上都还有很多挑战 。
技术是虚拟主播最底层的逻辑,也是用户体验关键 。尽管现在国内AI虚拟主播一般都能够自行学习,可以通过语音、文字反馈等方式和用户进行交互,但在如何更好凸显人设、性格等方面,比如对细节、生活化等特征的理解和打磨上,让虚拟主播拥有极强偶像效应,以及更强感染力、更交互,还有不少距离 。
这方面技术门槛相当高 。以科大讯飞虚拟人交互平台为例,从建立人物模型开始,要经过原画设定、模型建模、骨骼表情绑定等诸多复杂步骤 。一句语音反馈,不只是将文本“翻译”为语音输出,还要通过算法生成人物五官微表情,动态调整虚拟人的嘴型、眼部细节、面部肌肉等 。还要通过大量训练,AI才能更懂人物表情语言,在说某句话时,根据场景自动预测表情,最终才能呈现出媲美真人的面部特征 。
对于技术而言,最难理解的是人类行为和情感 。科大讯飞相关人士就表示,对于AI交互产品来说,只有综合利用多模态信息才能更准确地理解人类行为 。但现阶段受限于语义鸿沟、异构鸿沟、数据缺失等原因,多模态研究还有一定难度 。
因此,从技术角度来看,未来很长一段时间都需要科大讯飞、阿里这样的技术服务商,加大研发和平台开放力度,提供一站式完整产品服务,面向更广泛领域提供技术支撑,以减少创作者的成本压力 。
文章图片
相比不断迭代升级的技术,更困难的是在新鲜劲后,如何将虚拟主播IP持续推广下去 。
绊爱宣布退圈,就是最好警示 。2018年2月,绊爱出道一年就突破百万粉丝大关,五个月后再次突破了200万大关 。然而,截至2021年12月,绊爱粉丝却停滞在298万 。
一位虚拟主播业内人士分析,论才艺展示,绊爱无法超越初音未来;论偶像号召力,绊爱无法超过AKB48、乃木坂48这样的真人偶像团体——真人偶像团体粉丝有与偶像近距离接触互动机会,绊爱空有一个形象,难以被触及和感知,存在感实在太过单薄 。
推荐阅读
- 投稿|一度超越微信登AppStore榜首,但“元宇宙”社交也难逃“月抛”魔咒
- 投稿|陕旅饭店集团破产重整,昔日“混改模范”为何沦为反面教材?
- 投稿|疫情之下,本土自主设备如何突围?中国制造的投机主义和长期主义
- 投稿|即视角|出海正当时:欧美、东南亚、中东、拉美市场观察
- 投稿|“东南亚小腾讯”跌入谷底:受阻的业务飞轮撑不起千亿市值
- 投稿|员工行为几乎全裸?深信服“监控门”背后
- 投稿|信任危机?一场针对民族企业的商业“阳谋”
- 投稿|体量庞大,微软还能突飞猛进吗?
- 投稿|估值近百亿,从下沉市场走出来的书亦烧仙草,凭什么成黑马?
- 投稿|浑水创始人遭FBI搜查,屠龙者终成恶龙?