为什么自然语言处理很难?( 二 )


而计算机识别语音的时候,计算机也必须要分析他所能接受的声音信号,那些是噪音,那些是有用的知识,并且因此来说,为了生成回答进行反馈,计算机必须要把知识图谱中的回答进行整理组织成词的系列,并且能够生成出能够让人类是识别的语音信号.
当然,为了实现这些,我们就有用到phonetics和phonology的知识,这样的知识能够给帮我们如何建立模型来识别语句中的发音.
如果是处理词,又有很多的问题,比如说处理I’m和I am的这样的缩略词形式,如果要能够产生和识别单词这样那样的变体,其实这就又要需要形态学上的知识,希望能够反应关于上下文中词的形态和行为的有关信息.
另外,除了处理一个个单词以外,我们还要考虑如何生成一句话,并且能够按照我们的需求进行生成,这样我们有需要组词成句的知识,以及词汇语义学和组合语义学的知识
最后一个是最困难的,关于消除歧义:
例如“这房间就是个烤箱”、“这个房间就是个盒子” 。虽然句式相同但都不是字面的意思 。前者表示这个房间很热 。后者则表示这个房间很小 。要让计算机理解这些话的意思 。不是仅仅做词表示甚至句法分析能解决的 。也例如 。语言理解实际是一个多模态过程 。需要综合除语言之外的视觉、听觉甚至触觉等多模态的富语境信息才能实现真正的语言理解 。我个人觉得 。这些应该是自然语言理解/处理比较困难的地方 。
自然语言理解/处理应该是实现通用人工智能的关键挑战 。但似乎不应是最难挑战 。语言能力是人类智能的集中体现 。不过构建在语言等能力基础之上的思辨、决策和创造等能力 。似乎都还没纳入人工智能主要探讨的范围 。也许这些更困难些 。例如 。如何让机器像人一样思考哲学问题 。像人一样指挥战争或运营商业公司 。或像人一样发明创造?这些问题似乎都比自然语言理解/处理更困难 。
即使限定在自然语言处理 。当前关心的问题也更偏重自然语言传递信息的工具属性上 。也就是如何让计算机更准确地理解一句话的字面意思 。人类语言更富魅力的“言有尽而意无穷”的特点 。还远未被探索 。

推荐阅读