投稿|量产人形机器人有多难?

投稿|量产人形机器人有多难?
文章图片

图片来源@视觉中国

文 | 互联网的那些事
‍‍人类对于人形机器人的想象一直在变 。
1984年 , 科幻迷卡梅隆把自己的一个梦境搬进电影 , 开创了《终结者》时代 , 施瓦辛格扮演的人形机器人钢筋铁骨 , 飞天遁地 。
2009年 , 卡梅隆再次圆梦 , 在《阿凡达》中塑造了“脑机接口”的新机器人 , 将人类智力注入遥控的生物身体中 , 下身瘫痪的前海军战士通过头戴式设备 , 操控人造的混血机器人阿凡达 。
他指出了人与机器人 , 在未来世界共存的另一种可能性 。
时间来到2021年 , 特斯拉首次亮相了人形机器人“擎天柱”Optimus , 2022年 , 雷军在个人年度演讲中抛出王炸“全尺寸仿生人形机器人CyberOne” , 它具有聪明的“大脑”、发达的“小脑”、强健的“四肢” 。
投稿|量产人形机器人有多难?
文章图片

事实上 , 人型机器人除了拥有类人的外形外观、感觉系统、智能思维方式以外 , 还具备控制系统和决策能力 , 最终表现“行为类人” 。
在应用场景上 , 除了个人/家庭机器人(辅助吸尘、地板清洁、草坪修剪、游泳池清洁、窗户清洁、家庭安全等)、娱乐休闲机器人(用于满足情感需求、教育、陪伴等) , 还包括商业机器人 , 其应用场景主要包括医疗、物流、农业和其他(包括国防、公共关系等) 。
简单来说 , 主要分为商用场景和个人/家庭应用场景两大类 。
以其中的服务型机器人为例 。
根据中国电子学会的调研 , 其全球市场规模到 2022 年底预计就将达 159.9 亿美元 。而在我国 , 由于人口老龄化趋势的不断发展 , 服务型全尺寸人型机器人在医疗和公共卫生领域的需求 , 也将持续保持旺盛的上升势头 。
在使用场景足够广泛的背景下 , 人型机器人似乎已经成为了当下资本企图涉足的领域 。
但需要注意的是 , 从核心技术来看 , 人型机器人的“攻城略地”才刚刚开始 。
01 人型机器人成熟了吗?在智能领域 , 人型机器人被誉为AI的终极形态 。
在早前的8月份 , 2022世界机器人博览会在北京亦创国际会展中心举办 , 共有130余家企业带来的500余件展品 , 有30余款全球首发新品在现场集中发布 。
而这场博览会主要是以应用需求端为导向 , 采用“机器人+应用场景”的展览模式 , 策划了“机器人+医疗”、“机器人+物流”、“机器人+商用”、“机器人+农业”、“机器人+建筑”、“机器人+制造”、“机器人+矿山”等专区 , 汇聚各类场景下的前沿机器人产品 。
往更具体的方向来说 , 人型机器人分为以高精度、稳定性为核心要素的工业机器人、以人机交互为核心的协作机器人、替代复杂重复性工作的服务机器人 。
就拿Atias、Digit、Walker、Optimus四款机器人分析 。
其中 , Atlas采用的是液压驱动的控制方法 , 追求运动能力上的极致 , 主要作为科研平台 , 长期则期望在军事领域发挥作用 。与Atlas不同的是 , Digit以电机驱动 , 并将重心上移 , 增加机器人负重 , 致力于物流“最后一公里”的配送应用 。
而Walker同样是电机驱动 , 并结合力控 , 让机器人在B端与C端的环境中均能与人安全交互 。就连即将发布的Tesla Bot也将走电机驱动的技术路线 , 拥有由Dojo超级计算机进行神经网络自动训练的“大脑”及人类级别的四肢 , 将在2023-2025年被首先用于造车场景 。
值得注意的是 , 当下各大企业研发的人型机器人 , 整体更偏向于“工业化”方向 。从某种角度来看 , 劳动力短缺的重工业领域 , 在需求量、价格等方面往往接受度更高 。
但需要说明的是 , 人型机器人最后能否成功被不同领域所接受 , 智能化程度以及运动控制技术的发展具有关键的作用 。
目前的人型机器人 , 在诸如生产机械臂装配方面 , 几乎都在使用着传统的位置控制 。
比较典型的就是:机器人沿着事先规划好的轨迹在封闭、确认的空间中运动 。
或者在某些时候 , 机器人得到从视觉系统的反馈 , 这样就能使得位置控制的机器人具备一定适应外界可变环境的能力 。然而通过实际规划轨迹运动的机器人仍然占大部分 。
从长远的角度来看 , 未来的机器人运动控制领域 , 必须引入力控 , 纯位置控制是没有前途的 。
举个例子 , 在重工业领域机器臂纯位置控制是很难精确化的 , 最明显的是在汽车外形不规则抛光、物品使用力度等制造场景上 。
另一方面 , 人型机器人最终仍然需要往与人交互的层面上发展 。也就是说 , 需要确保人型机器人在与人类做物理交互的安全 , 不能仅依靠纯位置控制 。
不过 , 目前国内的人型机器人大多数还处于初级阶段 。
从功能上来看近似于一个会走路的智能音箱 , 象征意义比实用性大 。同时 , 运动控制的价格占比也较高 。
根据未来智库数据显示 , 在整个机器核心零部件生产成本方面 , 人形机器人中运动控制占比接近50% , 其中减速器占比22% , 伺服系统占比16% , 控制器占比11% 。
投稿|量产人形机器人有多难?
文章图片

在运动控制技术之外 , 人型机器人对环境感知系统的要求同样也极高 。
目前市场上的机器人自由度在20-60个左右 , 灵活度相对而言并不算低 。但人型机器人的自由度再高 , 没有结合环境感知技术 , 是很难做到在与人交互时足够的“拟人性” 。
在环境感知技术层面上 , 无论是定位侧重于情感识别与交互的小米CyberOne , 或是偏向于工业化的特斯拉Optimus , 仍然有待突破 。
02 到底需要怎样的机器人? 从扫地机器人一路发展到如今的人型机器人 , 在同样能够做一定家务的前提下 , 人们更需要一个多元化的人型机器人 , 具备陪伴、聊天、导盲、看护、娱乐、教育等能力已经成为了用户对人型机器人的最终想象 。
然而 , 现在的人型机器人领域远不能够达成用户的需求 。
原因在于 , 最终能够起到决定机器人人机交互能力的 , 主要在于AI算法及软件平台能力 。
投稿|量产人形机器人有多难?
文章图片

目前 , 除了运动控制模块受益于自动驾驶、工业机器人等领域的成熟应用外 , 环境感知也同样得益于此 , 于是相关硬件商用化进程较快 。
而在人机交互模块 , 由于算法、算力的限制 , 在实际消费场景中 , 实现高效的人机智能交互还存在不小的难度 。
小米CyberOne就是最好的例子 。
虽然在机器视觉技术上 , 小米CyberOne搭载自研Mi-Sense深度视觉模组 , 结合AI交互算法 , 但小米CyberOne也仅仅是拥有简单的空间感知能力 , 例如人物身份识别、手势识别、表情识别 。
即便是拥有极致运动控制性能的波士顿动力人形机器人Atlas , 在聊天、逛街等方面 , 也仍然无法做得到 。
另外更值得注意的是 , 在机器人领域进程中相对优越的Atlas , 在发展过程中也仍然经历了多次转手 , 首先是被谷歌收购 , 到2017年又被转手卖给日本软银 , 最后被韩国现代收入旗下 。
一家美国军方背景的公司最后硬是变成了全球跨国公司 , 归根结底 , 还是人形机器人短期没法商业化 。
从这个层面讲 , 现实与理想的差距是肉眼可见的 , 人形机器人和元宇宙一样都还是“无源之水 , 无本之木” 。
当然 , 仅是依靠片面的说词并不能证明什么 , 或许从人型机器人在环境感应系统的发展看会更直观一些 。
投稿|量产人形机器人有多难?
文章图片

环境感知系统包括视觉、听觉、触觉 。
因为要模仿人 , 所以感知系统 , 是人形机器人的一个增量环节 , 包含着各类传感器分支 , 对应的如摄像头、激光雷达、温度传感器、气味传感器、听觉传感器等等 。
其中 , 传感器是服务机器人的重要部件 。服务机器人的应用场景相对非标准化 , 要求对环境的感知能力 , 传感器是其重要的部件之一 。
虽然现阶段传感器的成熟度和丰富度已经很高了 , 但由于传感器所输出的信号也在一定程度上影响着视觉感知的识别结果 。
直白一点说 , 在传感器成熟度以外 , 能否实现精密操作执行将决定人形机器人应用前景 。
这也就意味着 , 为了实现精密执行操作 , 机器人视觉感知技术在原来主要满足避障、目标识别、路径规划等功能的基础上 , 机器视觉模块还要配合运动系统实现高精度估计和机械手的伺服控制 。
原因很简单 , 想要知道末端执行器相对于物体的三维位置 , 需要测量每个joint的角度利用正向运动学来计算 , 在一般的应用场景中 , 这个三维的位置被认为是己知的 。
由此带来的问题就是 , 机器人本身需要十分精确 , 这时就需要精确的传感器将joint angle测量值反馈给控制器 , 我们需要很精确的正向运动学模型 , 来根据传感器提供的角度得出此时末端执行器的位置 , 末端执行器的目标也需要被精确的放置在已知的三维位置上 , 以上任何一个环节出问题 , 都会导致误差的出现 。
为了得到精确的三维位置 , 未来多模态视觉感知或许有可能会成为满足机器人视觉感知的不同需求 。
但需要在任何状态下都能够获取正确的正向运动模型 , 机器人就需要通过巨大的样本量来进行深度学习 , 还要有海量的算力支持 。
这不仅短时间内无法实现 , 也很难从价格上让大量用户所接受 , 产商盈利 。
03 用户和厂商之间没有正比 根据方舟投资预计 , 到2025年 , 每台工业机器人的成本将低于11 , 000美元 , 远低于波士顿咨询集团(BCG)的24 , 000美元左右的预期 。
而该机构的分析基础是摩尔定律更具准确性的莱特定律 。
即 , 生产单位数量每增加一倍 , 成本就会以固定百分比下降 。
换个说法也就意味着在没有彻底量产前 , 产品最终在性价比上很难形成竞争力 。
即便假设随着人型机器人技术的不断提升摊薄成本 , 2025年的价格或许如方舟投资所预料一般 。但如果仅仅是以当下分析 , 不到10万元的人型机器人 , 还有一定的难度 。
根据小米推出的CyberOne来看 , 研发涉及包含仿生感知认知技术、生机电融合技术、人工智能技术、大数据云计算技术、视觉导航技术等各领域的尖端技术 , 成本每台大概六七十万元 , 跟波士顿动力一样 , 成本造价高 。
另一方面 , 虽然2020年风险投资公司向机器人公司投入了63亿美元中 , 但不少资金和关注都投掷在单任务机器人上 , 这些机器人是专门任务而设计的 。
而单一任务机器人也可能效率低下 , 短时间内迫使企业不得不面临着提高效率和节省成本的巨大压力 , 而且经济的未来又陷入了供应链挑战和供需失衡等不确定性中 , 这些单一机器人构成的障碍 , 可能会多于其解决的问题 。
诚然 , 这也就说明 , 一组可以做很多事情并灵活适应需求和工作流程的机器人 , 往往比单一用途机器人更有前途 。
投稿|量产人形机器人有多难?
文章图片

此外 , 相对于中小企业来说 , 机器人的成本仍然较高 , 中小企业规模化使用仍然较为困难 。
可以做一个简单的预测 , 人型机器人第一批投入使用更多会偏向于无聊、单一的工业 。
【投稿|量产人形机器人有多难?】因为以目前智能家居让人处于被动服务状态来看 , 能够完成感知用户的状态 , 识别用户的意图 , 学习用户的习惯 , 通过IOT技术获取环境以及设备的信息 , 提供主动服务的机器人时代还远未到来 。‍‍

    推荐阅读