能写论文、编代码、创作小说 爆红的ChatGPT是如何诞生的?


能写论文、编代码、创作小说 爆红的ChatGPT是如何诞生的?

文章插图
“最近开始玩ChatGPT , 的确很惊人 。”一位生物学领域的科学家近日在社交媒体上感慨 。在他展示的向ChatGPT发起的挑战中,提出的问题包括如何运营公司、如何管理孩子、为何生育率下降,再到中国的文化和政策问题,ChatGPT大多能应对流畅 。
这款当今最火爆的AI语言模型,由美国人工智能实验室OpenAI于去年11月底发布,并迅速火遍全球 。人们长期苦于那些智能语音助手的傻瓜回答 , 这次ChatGPT却出乎意料的聪明:它可以用来创作故事、撰写新闻、回答客观问题、聊天、写代码和查找代码问题等 。外媒评论称,ChatGPT会成为科技行业的下一个颠覆者 。
ChatGPT是自然语言处理(NLP)中一项引人瞩目的进展,它阅览了互联网上几乎所有数据,并在超级复杂的模型之下进行深度学习 。因为语言是人类智慧、思维方式的核心体现 , 因此,自然语言处理被称作“AI皇冠上的明珠” 。而ChatGPT的出色表现 , 被认为可能是迈向通用型AI的一种可行路径——作为一种底层模型 , 它再次验证了深度学习中“规模”的意义 。
1月12日 , 在美国一场活动上 , 曾担任微软董事长的比尔·盖茨表示 , 他不认为Web3有那么重要,也不认为元宇宙本身是革命性的,但是人工智能却是颇具颠覆性的 。当被问及如何看待ChatGPT时,他说,“这让我能一窥未来 。整个平台的方法和创新速度都令我印象深刻 。”
文本生成和对话领域,基本要被“洗一遍”
GPT英文全称为Generative Pre-trained Transformer(生成式预训练转换器),是一种基于互联网可用数据训练的文本生成深度学习模型 。ChatGPT“脱胎”于OpenAI在2020年发布的GPT-3 , 后者是目前训练参数量最大的AI模型,当时发布后便引发了广泛的关注 。
此次发布的ChatGPT实际上是GPT-3.5 。在3.0的基础上,ChatGPT在应用层进行了强化训练,提高了对话质量 。
王帅是AI领域从业20多年的一位工程师 , 目前在英伟达工作 。他对《中国新闻周刊》介绍说,首先,OpenAI引入了人类监督员 , 对AI的回答进行打分,使得它在众多可能的回答中选择那些更加符合人类预期的答案;其次,新版本还引入了多轮对话,尤其是在涉及一些有关步骤的问答当中,让这个模型的语言前后逻辑更加明晰、有因果关联 。
创新工场人工智能工程院执行院长王咏刚告诉《中国新闻周刊》,人类处理数学公式时,如果有几十个参数,就已非常之复杂了 。然而,GPT-3却相当于是一个包含1750亿个参数的公式,来处理所有互联网上的数据,以理解人类当今的文本和语言 。因此,他评价,OpenAI的超大规模预训练模型是深度学习诞生以来,AI在行为表现上最接近人类智慧的一个时期 。OpenAI还在不断提升AI训练的规模和复杂度 。
硅谷科技公司PerceptIn创始人刘少山在接受《中国新闻周刊》采访时表示,过去,AI已经能在一些特定任务上做得很出色 , 比如,在图像识别、语音理解方面,计算机正逐渐取代人的眼睛和耳朵行使的功能,但一直无法实现通用 。所谓通用人工智能,即与实现特定任务的AI相对应 。
2020年,在一场业内会议上,美国康奈尔大学计算机教授巴特·塞尔曼谈到,通用人工智能可能还需要20年以上才可以实现,“不过如果我们在未来五到十年能在真正的自然语言理解上获得突破,使得AI可以去阅读图书、从互联网获得知识,那么这个进程可能会被大大加速” 。
ChatGPT有更好的语言理解能力,意味着它可以更像一个通用的任务助理,能够和不同行业结合,衍生出很多应用的场景 。刘少山认为,它可以说是打开了通用人工智能的一扇大门 。
王咏刚指出 , 可以说,互联网的每一个环节,只要涉及文本生成和对话的 , 未来基本上要被ChatGPT“洗一遍” 。也就是说,都需要结合这一语言工具 , 才能得到一个接近于自然人类语言对话的效果 。
以自动驾驶为例 , 刘少山说,目前的自动驾驶还比较“傻”,因为汽车的智能系统与人的交互是比较机械的,比如说 , 前面有一辆车,按照规则,它有可能会无法正确判断什么时候该绕行 。而ChatGPT等人工智能的迭代,未来可能会让机器更接近人的思维模式,学习人的驾驶行为 , 带领自动驾驶进入“2.0时代” 。
近来,据美国硅谷的科技媒体报道,微软已经讨论在Word、PowerPoint、Outlook和其他应用程序中加入ChatGPT 。1月17日举行的达沃斯世界经济论坛《华尔街日报》座谈会上,微软CEO萨提亚·纳德拉表示,微软将迅速采取行动 , 力争让OpenAI的工具快速商业化 。

推荐阅读