人工智能为什么需要大数据

一、一个老问题 二战后期,美军对德国和日本法西斯展开了大规模的战略轰炸,每天都有上千架的战机呼啸而去,但是在返回时往往损失惨重。
对此,美国空军十分头疼,如果想要降低损失,就需要在飞机上焊上防弹钢板。但是,过多的防弹钢板会使飞机的速度、航程、载弹量都受到影响。
这时候,一个人出现了,他就是数学家亚伯拉罕·沃尔德。他的方法十分简单,在一张白纸上画出飞机的轮廓,随后让地勤技师统计飞机上的弹孔,之后在白纸上将弹孔画在相应的位置。
画完之后众人惊呆了,飞机的机身和机翼中弹率这么高,密密麻麻的都是弹孔,于是,有人建议应该在机翼等那些密集中弹的地方加厚装甲。
【人工智能为什么需要大数据】

人工智能为什么需要大数据
文章图片
但沃尔德却建议,在飞行员座舱和尾翼这两个位置焊上钢板,而白纸上这两处几乎是空白的。老飞行员一看就明白其中的道理,如果飞机的座舱中弹,飞行员九死一生;如果尾翼中弹,飞机将会失去平衡而坠毁。这两处一旦中弹,飞机多半就回不来了,因为死人不会说话,白纸上这两处才会一片空白。
这就是一个非常简单的统计学知识,幸存者偏差。
二、一个新解读 这个问题相信大多数人都能够理解了,但是今天我们重新思考一个维度,那就是如果是人工智能来判断,它会不会中幸存者偏差的陷阱呢?我的答案是一定会,因为人工智能只能基于已有的数据进行分析,却不能主动思考那些没有被输入的数据。那这个问题怎么解决呢?方法就是大数据。
我们假设当时那些地勤技师,看到的不只是回来的飞机,那些被击落的飞机也想尽各种方法被收集回来,一起放在他们面前,他们马上就能做出正确的判断,都不需要数学家帮忙。因为出现幸存者偏差的原因在于数据源本身是由缺失的,如果能够看到全部的数据,自然就不会有幸存者偏差这样的问题。这就是为什么人工智能需要大数据的原因了,这其实是人工智能的一个缺陷导致的。
三、人的优势 这缺陷恰恰是人的优势所在,那就是想像力。当时沃尔德其实是这么推断的,飞机各个地方中弹的概率应该是一样的,那么飞回来的飞机中弹多的地方其实是不要命的地方,那些没有中弹的地方才是要命的地方,因为那些飞机被击落没有飞回来。但是我们仔细分析这里的逻辑,它的起点就是“飞机各个地方中弹的概率应该是一样的”,这其实是一个假设,而且其实没有办法验证了,因为那些被击落的飞机没被看到么。所以这个假设其实是沃尔德想像出来的,只不过这个想像比较合理罢了。
所以人在做推断的时候可以从一个不是真实存在的假设开始,我们所有的学科的最底层都是这样的假设开始的,比如经济学的基本假设:理性人假设。为什么要这么做呢,因为人经常不能够看到所有的情况,所以对于那些没有被看到的情况,就需要由想像力去补足。从古时候的神话传说,到现在科学,其实想像力都起到了重要的作用,只不过很多想像最后被事实推翻了,而留下的都是经历的时间的考验还没有被推翻的而已。这是人类得出自己的知识的方式。
但是人工智能不是这样的,他没有想像力,所以只能够收集尽可能多的数据,来得出事实和事实之间的相关关系,但是相关关系并不是因果关系,虽然随着数据量的增加,相关关系会向着因果关系靠近,但是因为没有想象力,所以除非真能弄到全方面的,全维度的全数据,那么人工智能所得出来的永远都是相关关系,而不是因果关系。吴军曾经说过人工智能不可能超越人类,因为人工智能不会犯错。这话其实说的对,但是说的浅了。人工智能真正的弱点在于不会想像,不会想像当然就不会犯错。
四、人工智能一样的人会被淘汰 世间的现象千奇百怪,如果解释每一件事情都要用一个特殊理论,那实在是太麻烦了,就好像你每拧一颗螺丝就要换一把螺丝刀一样。但是这种麻烦对与人工智能其实就不是什么问题,而它本质上就是在通过大量的数据去得出大量的特殊理论。罗胖再一次跨年演讲的时候就说到:人类分析物理问题把问题分解为低速和高速两种情况,但是人工智能就会把从低速到高速分解成3000多种情况,然后每种情况一种理论。这不就是特殊理论么?
人工智能能这么做是因为它的运算速度太快了,但是人如果像人工智能一样做事那就会非常悲剧,因为这样做事的人会被人工智能替代。现实中还真有人是这么做的,其实很多医生其实根本不懂医学,他们只是记住了大量的医学知识而已,然后根据病人的症状给出不同的治疗方案,治病就是查字典。在过去因为没有计算机,这些知识只能全部储存在他们的大脑中,但是也因为没有电脑所以这些医生和真正懂医学的医生区别不出来。我曾经听我的同事说过一次看病的经历,在看病的时候医生根本没有理睬我的同事,只是在电脑上根据病例配药而已。
其实现实生活中大量的人干的都是这样的活,收费站,收银员都是这样的工作。这样的工作就是必然被淘汰的。

    推荐阅读