投稿|特斯拉自动驾驶的底层逻辑
文章图片
图片来源@视觉中国
文 | 锦缎如果机器人有大脑,会是什么样?
在科幻电影《机械姬》里,全球最大搜索引擎公司“蓝皮书”CEO纳森向观众展示了自己发明的机器人大脑,并留下这么一句话:“人们认为搜索引擎是人们思考的事物,但其实那是人们思考的方式 。”
文章图片
该影片上映于 2015 年,被誉为人工智能爱好者必看的电影之一,拿下包括奥斯卡金像奖在内等多项国际电影大奖 。但在众多奖项 中,单项之冠是 “ 最佳女配角 ”,艾丽西卡 · 维坎德,也正是影片中智能机器人 “ 艾娃 ” 的扮演者 。
“艾娃”是纳森给“她”取的名字,为制造出能独立思考的人工智能,纳森利用自家搜索引擎“蓝皮书”的算法来构建艾娃大脑的“思维”,使之学会人类思考方式 。
无独有偶,想让机器有人类思维,同样见之于特斯拉打造的自动驾驶AI上 。2019特斯拉自动驾驶日上,安德鲁·卡帕西 (Andrej Karpathy,特斯拉AI总负责人) 曾明确地向大众传达特斯拉自动驾驶是在模仿人类驾驶,因为现行的交通系统是基于人类视觉和认知系统来设计的 。
由此,特斯拉开发出“人工神经网络”,并利用大量有效的行车数据来训练它,在这一过程中不断完善并迭代视觉算法,终于在今年年中拿掉毫米波雷达,而随着超算Dojo浮出水面,长期被诟病只能算辅助驾驶的特斯拉,离真正的自动驾驶又近一步 。
从学会开车,到比人类更懂开车、开得更好,当一名优秀的“老司机”,是特斯拉自动驾驶持续优化的底层逻辑 。
01 “云端司机”的神经网络【投稿|特斯拉自动驾驶的底层逻辑】纯视觉自动驾驶方案是特斯拉的独门绝技,但需建立对计算机视觉深度训练之上 。
计算机视觉是一种研究机器如何“看”的科学,当人类看到一张图片时,能清晰辨析图片里的事物,比如说美丽的风景照、或者一张小狗的照片,然而计算机看到的却是像素 (pixel),像素是指由图像的小方格组成的,这些小方块都有一个明确的位置和相对应的色彩数值,计算机“记住”的就是这堆数字字符,而不是具体事物 。
如果想让计算机能像人类一样快速准确识别出图片里的事物,机器也有了人工大脑,来模拟人脑处理加工图像信息过程,分为输入层、隐藏层、输出层,里面有许多人工神经元,可视作人脑初级视觉皮层中的锥体细胞和中间神经元 。
整个训练过程亦可类比小孩看图识物,通过一次次输入、对比、纠正,完成机器图像认知 。通常在训练初期,人工神经网络识别结果的准确度非常低,输出结果和实际值相似度可能只有10%;为了提高准确度,需要再将两者误差从输出层反向传播至输入层,并在反向传播中,修正神经网络隐藏层的参数值,经过上百万次的训练,误差逐渐将收敛,直至输入和输出端匹配度达到99% 。
推荐阅读
- boost|性能太激进!一加10 Pro发布,不俗产品力拉开竞品差距
- 投稿|一度超越微信登AppStore榜首,但“元宇宙”社交也难逃“月抛”魔咒
- 投稿|陕旅饭店集团破产重整,昔日“混改模范”为何沦为反面教材?
- 投稿|疫情之下,本土自主设备如何突围?中国制造的投机主义和长期主义
- oppo|配置到位设计拉满,OPPO平板爆料提前看!性能和生态适配亮点多多
- 投稿|即视角|出海正当时:欧美、东南亚、中东、拉美市场观察
- 投稿|“东南亚小腾讯”跌入谷底:受阻的业务飞轮撑不起千亿市值
- 投稿|员工行为几乎全裸?深信服“监控门”背后
- 投稿|信任危机?一场针对民族企业的商业“阳谋”
- 摩托罗拉|传小米2亿像素超大底曲面屏新机研发中 价格或不便宜