什么是博奕论(从囚徒困境”说起)

一天,警局接到报案,一位富翁被杀死在自己的别墅中,家中的财物也被洗劫一空。经过多方调查,警方最终将嫌疑人锁定在杰克和亚当身上,因为事发当晚有人看到他们两个神色慌张地从被害人的家中跑出来。警方到两人的家中进行搜查,结果发现了一部分被害人家中失窃的财物,于是将二人作为谋杀和盗窃嫌疑人拘留。

但是到了拘留所里面,两人都矢口否认自己杀过人,他们辩称自己只是路过那里,想进去偷点东西,结果进去的时候发现主人已经被人杀死了,于是他们便随便拿了点东西就走了。这样的解释不能让人信服,再说,谁都知道在判刑方面杀人要比盗窃严重得多。警察决定将两人隔离审讯。
隔离审讯的时候,警察告诉杰克:“尽管你们不承认,但是我知道人就是你们两个杀的,事情早晚会水落石出的。现在我给你一个坦白的机会,如果你坦白了,亚当拒不承认,那你就是主动自首,同时协助警方破案,你将被立即释放,亚当则要坐10年牢;如果你们都坦白了,每人坐8年牢;都不坦白的话,可能以入室盗窃罪判你们每人1年,如何选择你自己想一想吧。”同样的话,警察也说给了亚当。
一般人可能认为杰克和亚当都会选择不坦白,这样他们只能以入室盗窃的罪名被判刑,每人只需坐1年牢。这对于两人来说是最好的一种结局。可结果会是这样的吗?答案是否定的,两人都选择了招供,结果各被判了8年。
事情为什么会这样呢?杰克和亚当为什么会做出这样“不理智”的选择呢?其实这种结果正是两人的理智造成的。
当警察把坦白与否的后果告诉杰克的时候,杰克心中就会开始盘算坦白对自己有利,还是不坦白对自己有利。杰克会想,如果选择坦白,要么当即释放,要么同亚当一起坐8年牢;要是选择不坦白,虽然可能只坐1年牢,但也可能坐10年牢。虽然(1,1)对两人而言是最好的一种结局,但是由于是被分开审讯,信息不通,所以谁也没法保证对方是否会选择坦白。选择坦白的结局是8年或者0年,选择不坦白的结局是10年或者1年,在不知道对方选择的情况下,选择坦白对自己来说是一种优势策略。于是,杰克会选择坦白。同时,亚当也会这样想。最终的结局便是两个人都选择坦白,每人都要坐8年牢。
上面这个案例就是著名的“囚徒困境”模式,是博弈论中最出名的一个模式。为什么杰克和亚当都选择了对自己最有利的策略,最后得到的却是最差的结果呢?这其中便蕴涵着博弈论的道理。
博弈论是指双方或者多方在竞争、合作、冲突等情况下,充分了解各方信息,并依此选择一种能为本方争取最大利益的最优决策的理论。
【什么是博奕论(从囚徒困境”说起)】“囚徒困境”中杰克和亚当便是参与博弈的双方,也称为博弈参与者。两人之所以陷入困境,是因为他们没有选择对两人来说最优的决策,也就是同时不坦白。而根本原因则是两人被隔离审讯,无法掌握对方的信息。所以,看似每个人都做出了对自己最有利的策略,结果却是两败俱伤。

    推荐阅读