姓名测算网站 比较准的姓名测试网( 二 )


熊德意认为,ChatGPT是实现对话式AI的第一步 。
从互联网层面来看,它可以作为信息入口,与搜索引擎相结合;还可与办公软件结合,增强办公效率;从人机交互角度看,它体现的是一种基于自然语言的交互方式,可以与元宇宙、数字人结合 。此外,它还可以充当机器人大脑 。
“如果从人类信息发展的尺度上看,它在人与机器之间的信息接口方面有了很大突破 。”熊德意如是说 。
“十八般武艺”样样精通
ChatGPT使用了GPT-3技术,即第三代生成式预训练Transformer(Generative Pretrained Transformer 3) 。这是一种自回归语言模型,使用深度学习来生成类似人类的文本 。
据英国广播公司《科学焦点》杂志介绍,GPT-3的技术看似简单,例如它接受用户的请求、听取问题或提示并快速回答,但其实这项技术实现起来要复杂得多 。该模型使用来自互联网的文本数据库进行训练,包括从书籍、网络文本、 *** 、文章和互联网其他文本中获得的高达570GB的数据 。更准确地说,它在5000亿个单词组成的训练数据上进行了高强度训练 。
GPT-3.5是GPT-3微调优化后的版本,比后者更强大 。ChatGPT正是由GPT-3.5架构的大型语言模型(LLM)所支持的 。
ChatGPT也可以被描述为一个自然语言处理(NLP)领域的人工智能模型 。这意味着它是一个能够编码、建模和生成人类语言的程序 。
作为一种语言模型,在大规模文本数据上进行自监督预训练后,ChatGPT还需要经过三个阶段的“炼制” 。首先是监督微调阶段,在该阶段,人类AI训练师既充当用户,同时也是AI助理,以自我对话形式生成对话样例,ChatGPT在这些对话样例上进行有监督的训练 。
接着,ChatGPT进入第二个阶段 。该阶段的主要目的是训练一个基于语言模型的奖励模型,对机器生成的回复进行评分,为了训练该奖励模型,需要随机抽取机器生成的文本,并采样出多个不同版本,人类训练师对这些不同版本进行偏好排序,排序的结果用于奖励模型的训练 。
基于训练好的奖励模型,第三个阶段采用强化学习技术进一步微调ChatGPT 。
这项技术与众不同之处在于,它能够基于以上介绍的人类反馈强化学习技术,使生成的文本能够与人类意图和价值观等进行匹配 。
无论懂不懂技术,全球网友都竞相大开“脑洞”,试探ChatGPT到底有多“神” 。据美国有线电视新闻网报道称,有人要求它用《坎特伯雷故事集》的风格重写上世纪90年代热门歌曲《Baby Got Back》;有人写了一封信,要求ChatGPT删除信用报告中的不良账户;还有人询问它以童话为灵感的家装设计方案 。
自然语言处理技术拨云见日
一炮而红后,ChatGPT概念股也跟着一路“狂飙” 。有媒体报道,汉王科技9天收获7个涨停板 。自然语言处理研究是该公司主营业务,而ChatGPT背后的技术就是NLP 。
熊德意告诉采访人员,NLP是人工智能的一个分支,最早诞生于机器翻译,其历史实际上比“人工智能”名字的历史还要悠久,至今已研究了70多年 。简单来说,该技术的目标就是要让计算机或机器人能够实现像人一样具备听、说、读、写、译等方面的语言能力 。
“ChatGPT并非一项技术的一蹴而就,它是多种技术叠加在一起形成质变的产物,是NLP领域的结晶 。”熊德意解释,其底层技术,包括Transformer、自监督学习、微调、人类反馈强化学习(RLHF)、AI对齐等,在自然语言处理和人工智能领域都有广泛的研究和应用 。
“但ChatGPT将这些技术巧妙地结合在一起 。它有效规避了大模型的未对齐行为,利用了大模型规模带来的智能突现能力,增强了大模型的指令学习能力和用户意图捕获能力,解锁了大模型的泛化能力 。这些能力叠加在一起形成了ChatGPT的质变效果 。”熊德意说 。

推荐阅读