李开复 李开复为什么

导读6月8日 , 应清华大学交叉信息研究院院长、世界著名计算机科学家姚期智院士邀请 , 创新工场创始人兼董事长李开复博士在清华大学为“姚班”学生做了题为《人工智能的黄金时代》的演讲 。姚班 , 全称“清华学堂计算机科学实验班” , 由姚期智院士于2005年创办 , 致力于培养与美国麻省理工学院、普林斯顿大学同等甚至更高水平的计算机科学人才 。李开复博士在本文中用简单的语言系统地介绍了人工智能和深度学习的概念 , 并指出了人工智能目前面临的瓶颈和克服的方法 。想要全面了解人工智能的朋友们 , 一定不能错过这篇文章 。
(图一:李开复博士与姚期智院士合影)
以下是李开复博士的发言全文:
谢谢大家!我很高兴有机会再次来到清华 , 特别是在我最尊敬的姚期智教授的邀请和介绍下 。姚教授的《姚班》早已名扬天下 。从Google到创新工场 , 我看到了很多成功的工程师 , 他们都是在姚老师的培养下成为计算机领域的顶尖人才 。
在我讲人工智能之前 , 我想先介绍一些我可能不太熟悉的背景:其实我在30多年前就进入了人工智能领域 , 在我加入几个国际大公司之前 。我第一次做自然语言处理是1980年 , 计算机视觉是1982年 , 语音识别是1983年 , 人机游戏是1985年 , VR/AR是1996年...但我们现在知道 , 我当时做的这些选择基本上都是非常“糟糕和错误”的职业选择 , 因为我做的一切都是在它的黄金时代和白银时代之前 。从这个角度来说 , 其实我也想说 , 在计算机研究领域 , 自身的素质和能力当然很重要 , 但是要在合适的时间选择合适的东西 。当我错的时候 , 我太过热情地跳进了人工智能领域 。与此同时 , 人工智能在过去的三四十年里经历了风风雨雨 。一开始很热 , 后来就跌到谷底了 。
但现在是人工智能的黄金时代 。你可能还会问 , 为什么这是人工智能的黄金时代?为了说明这个问题 , 这次我肯定不会只用一些理论来说服大家 。毕竟 , 我在过去做了太多“错误的选择”——今天我也带来一些实际数据 , 与大家分享为什么我对今天的人工智能充满信心 。人工智能有很多分支 , 其中一个是机器学习 , 机器学习中的另一个分支是深度学习 。今天我更多的用深度学习作为案例 。
人工智能是一种工具 。
最近人工智能成为全球热门新闻话题 , 很多都是因为几个月前AlphaGo战胜李世石 。最近 , 网上有消息称 , 它将在年底前挑战杰克 。但在这个新闻的热度下 , 有一件事让我感到可惜:大家对这个话题的关注点是人工智能是不是在模仿人脑 , 是不是“奇点”即将到来 , 却没有人工智能对我们现实的真正影响 。
“奇点”认为 , 在未来 , 机器将拥有各种智能 , 人类必须做一些事情来保护自己 。我们这里没有人能证明或否定“奇点” , 但我个人认为人工智能取代人还是一件非常遥远的事情 。我觉得我们更需要的是人工智能是一个今天可以使用的工具 。它可以帮助人们解决问题 , 取代重复性工作 , 创造商业价值 。正因如此 , 我认为我们今天已经进入了人工智能的黄金时代 。
随便举几个例子:今天的工作 , 未来大部分都会消失 , 比如翻译 。虽然现在还不那么完美 , 但是每年进步都很快 。再过几年 , 人工翻译可能会很难找到工作 。采访人员也是如此 。现在90%的AP文章都是机器写的 。几乎所有思维模式可以被理性计算的工作 , 在有足够数据支持的情况下 , 都会被取代 。有人说十年内会有一半的工作岗位消失 , 也有人说十五年内会有一半的工作岗位消失 。我认为这些都是合理的推测 。
我想你们大多数人都会相信这个理论 , 如果你还对它有疑问 , 你可以想 , AlphaGo为什么这么厉害?是因为它每天可以用几千台机器和自己下几万盘围棋 , 这个人做不到;为什么自动驾驶在未来会如此强大?因为它可以利用它的各种传感器收集道路上的数据 , 这是任何驾驶员都无法比拟的 。所以这些都是一些不可避免的过程 。
什么是人工智能?
人工智能到底是什么?我觉得大体上可能有几个部分 。
【李开复 李开复为什么】首先是感知 , 感知包括视觉、声音和语言;然后就是决策 。只是说做一些预测 , 做一些判断 , 这些都是决策层面的;当然 , 如果你想做一个完整的系统 , 像机器人或者自动驾驶 , 它就需要一个反馈 。
(图2:什么是人工智能)
从这些例子可以看出 , 感知可能更多的是帮助识别图片中沙发上抱着泰迪熊的婴儿 。关于推荐 , 我举的例子是用Google now通过你过去做过的一些事情来猜测你接下来要做什么 。在底部的例子中 , 你会看到有一辆无人驾驶汽车 , 上面有各种传感器 , 它捕捉到的信息可以用来做出最终的决定 , 比如如何操作方向盘、油门、刹车等 。其实这三样东西加起来就是今天总结的人工智能 。
(图3:人工智能的发展里程碑)
然后从博弈、感知决策、反馈四个方面回顾人工智能的发展 。今天的比赛我就不多说了 , 但基本上我能看出来 , 过了很久 , 从我大学时做的奥赛罗 , 到跳棋 , 再到深蓝象棋 , 今天AlphaGo终于打败了围棋世界冠军 。从中我们可以看出 , 这是一个30多年的历程 。
从观感上来说 , 从我的博士论文发表到Nuance成为顶尖公司 , 从HKUST飞到美国的Deep Face、中国的Face等公司 , 这些年做的越来越好 , 进步很多 。有一些特殊的例子 , 比如最近看到一些搞笑的对比 。微软Tay开始在Twitter上和别人交流 , 后来她说了很多很可怕的话 , 被微软撤回 。所以这里有很多成功的例子 , 也有很多有趣的事件 。
在决策方面 , 从早期微软Office中的工具 , 到Google ads的推荐 , 再到金融行业众多智能决策公司的出现 , 进步很快 。Google auto mail可能不是所有人都能看到 , 但是如果你还在用gamil , 你会发现有时候收到邮件 , Google会跳出来问你要不要发回复 。有时候它甚至会帮你写回复 , 而且非常准确 。这也是人工智能的体现 。也许以后我们不用说话 , 助手可以帮我们做 , 人工智能的助手肯定是同一个方向 。
最后 , 反馈 。从早期的CMU Boss无人驾驶到亚马逊用Kiva推动物流 , 再到最近的Pepper和Google car , 我们可以看到这三四年来这个领域特别火 , 很多看起来已经商业化的很好了 。
科普深度学习
在这里 , 我想稍微说一下深度学习 。
深度学习是一种神经网络 。与前一种相比 , 它的特点是使用多层网络 , 能够学习抽象概念 , 集成自学习 , 收敛速度相对较快 。趋同可能是一种技能 , 不一定是一种理论 , 但是有一群人通过它解决了很多重要的问题 。
简单来说 , 如果我们有很多笑脸 , 那么我们就把笑脸的像素输入一个神经网络 。最后 , 你要让机器识别出这是姚明 , 那是马云 。但是因为你的深度学习网络 , 一下子学这么多会比较困难 , 所以你需要用一个相对较快的收敛技能——自学习 。通过自我学习 , 机器会从大量样本中逐层逐步抽象出相关概念 , 然后做出理解 , 最后做出判断和决策 。
例如 , 它可以有几层节点和连接 。通过这些节点和连接 , 它会感知到每一层不同的抽象特征 , 每一层都比另一层更高级 。这些都是通过自学来实现的 , 而不是别人教的 。经过自学习 , 从一张脸输入 , 从同一张脸输出 , 它从中抽象地学习到一个人脸部的重要特征 。
(图4:分层无监督训练)
这次学习结束后 , 我会做监督训练 , 看看机器能不能识别它们 , 如果不能 , 就在训练结束后对它们进行微调 。比如我输入马云的脸 , 但是王出来了 , 训练系统会告诉你的网络这是错的:这不是王 , 这是马云 。下一步就是对它进行微调 , 让机器下次看到这张脸的时候 , 识别马云的概率更高 , 从王包强出来的概率更低 。
(图5:监督培训)
但是这个调不能调的太大 , 否则会有训练过度的问题 。我们会对整个数学公式进行微调 , 使用大量数据 , 反复教授 。经过不断的微调 , 很可能减少多次后的识别误差 。
其实这一整套理论二三十年前就有了 。我在做博士论文的时候 , 很多同事都在做训练神经网络的工作 。
刚开始的时候 , 深度学习的训练速度很慢 , 很难进入产业层面或者应用层面 。比如你的手机就做不到这一点 , 因为速度太慢 。但是这么多年过去了 , 我们的计算机越来越快 , 也有了更多棘手的训练和识别做法 。深度学习的应用可能性也发生了变化 , 可以应用的领域越来越广 。年前 , 我过早地进入了这个领域 , 但现在 , 人工智能大规模应用的时机已经到来 。
你凭什么这么说?一个很简单的评价标准就是我们的深度学习或者任何机器学习是否超出了人类能力的表现 。如果是 , 可能会产生很多应用 。比如在机场 , 如果机器人脸识别的准确率超过人 , 那么我们这些在边境的人可能就不需要那么多了 。这并不是说机器不会出错 , 而是说既然人不能做得比机器更好 , 我还不如用机器来代替 。
深度学习的应用领域
在过去的五年里 , 深度学习的准确率从75%以上提高到了97%左右 , 而人类表现的准确率约为95% 。从95%到97%听起来只有2%的提升 , 但实际上降低了40%的错误率 , 这是一个很大的提升 。如果这种进步持续下去 , 人工智能在未来一定会超越人类的性能 , 也一定能进入一些适用的领域 。这就是我今天讲人工智能黄金时代的证据:在很多领域 , 包括我们在face里面做过的人脸识别 , 包括苹果、谷歌、科大讯飞的语音识别 , 他们的认知水平在未来几年内会超过人类 , 一旦做到 , 他们的应用会迅速增加 。
(图6:深度学习的应用领域示例)
首先 , 深度学习可以应用于识别 , 包括人脸识别和语音识别 , 可以用于安全和安检 。
语音数据来之不易 , 但是BI、业务流程、互联网数据非常丰富 。谷歌和百度已经搜索了很久 , 充分利用广告和推荐系统中的机器学习技术来解决推荐什么产品、如何给产品定价、在哪里卖得最多、应该卖给谁等问题 。这种销售推广可以直接产生经济价值 , 而社会化媒体营销 , 整个互联网广告 , 每个领域都是一个几十亿、几百亿甚至更大的市场 。
用智能炒股其实是个不错的选择 。国内外都有很多人在做这方面的开创性工作 。利用智能 , 我可以计算出一篮子股票和期货应该如何随时对冲 , 以寻求最大利润 。顶级的金融分析师也能做到这一点 , 但他不能考虑股票的所有排列组合 , 但机器可以24小时不睡觉 , 每天都想出如何赚最多的钱 。除此之外 , 深度学习的技术可以整合各种因素 , 比如这家公司的高管有没有变化 , 今天有什么新闻 , 行业有没有变化...你甚至可以告诉一个智能系统 , 如果明天巴西发生地震 , 应该买什么股票 , 甚至你可以说发生了地震 。别问我 , 你可以直接买 。
在保险方面 , 比如贷款要不要审批 , 是银行贷款还是P2P贷款 , 都可以用机器来判断 , 数据不一定要来自银行内部 。
在医学上 , 因为我自己也生过病 , 在这方面深受其害 , 所以也觉得现在的医生的判断真的不是最完美的 。一方面 , 医生有好有坏 , 顶尖的医生少之又少;另一方面 , 比如癌症 , 每年都有新药出来 , 所以每天忙着给病人看病的每一个医生可能都没有时间去研究这些药物 , 那些药物也不是每个国家都有 。还有就是每个人 , 他的各种特性不一定适合用这个药 。其实这些都可以通过机器学习来做 。
前阵子 , 我在美国遇到一些科学家 , 他们正在利用机器学习发明新药 。当然 , 我们的科学研究必须要有聪明的头脑和好的实验 , 但其中一个关键的部分是一定程度上的安排和组合:尝试很多东西 , 先看看这个对老鼠是否有用 , 再试试那个 , 然后在类人猿身上实验 , 再在人类身上实验 。以前整个过程都是人脑来做 , 但是机器来做可能更准确 。甚至有一家公司养了很多小白鼠 , 里面所有的实验都是通过机器学习精准的进行:每天有多少小白鼠活下来 , 多少死了 , 什么药可以进行下一步……这些都是通过机器学习和非常精密的系统来完成的 。
我们发明的很多新材料不是用纯科学的方法推出来的 , 也要试试 。当我们用那个碰这个的时候 , 我们就会制造出具有特殊效果的材料 。这些知识可以输入到我们的信息学习系统中 , 通过它我们可以帮助发明新的东西 。
它在教育方面也有应用 。在学习的过程中 , 如果基础没有打好 , 下一级根本学不会 。智能教育系统会识别你的学习水平 , 然后根据你的水平确定学习内容 。比如你没学好乘法 , 机器就不能让你学除法 。
当然 , 学习外语也是一个很好的例子 。我们今天在语音识别方面做得非常好 。为什么我们学外语还是要找外教?语音识别为什么不能上一个台阶?所以当你的技术先进了 , 语音识别的应用就不仅仅是我的语音输入然后字就出来了 , 还有可能用在教育领域 。
有了这么多的机会 , 这个人工智能将重塑数以亿计的领域 。当然 , 这种情况不会明天就发生 , 因为我觉得人工智能在很多方面还是相当欠缺的...
(人工智能的发展遇到了哪些瓶颈?如何克服目前的瓶颈?人工智能如何商业化?请继续《李开复清华演讲:为什么今天是人工智能的黄金时代》明天)

    推荐阅读