纳什与博弈论 约翰 纳什

约翰·纳西(纳什和博弈论)
假设两个国家威胁要炸对方 , 其中一个国家装备了瞄准敌人的导弹,另一个国家也会这么做 。每个国家都试图通过购买武器来获得优势,结果就是“军备竞赛” 。后两个国家都有大量的导弹瞄准对方 。军备竞赛是“博弈论”的一个例子,它诞生于20世纪40年代至50年代的数学和经济学领域 。博弈论研究的是国家、公司和个人在一定情境下的行为 , 即一方的行为会影响另一方获得的结果 。当你的敌人购买导弹时,它使你处于不利地位,威胁到你的国家安全;如果买导弹,对敌国也是一样的效果 。考虑到敌人的行为 , 每一方都需要决定自己的行为 。博弈论者称之为“战略互动”:我们相互影响(我们互动),所以我们会根据敌人的行动来决定我们的行动(我们有“战略”) 。博弈论研究无处不在的战略互动,从剪刀石头布的游戏到经济中的利益追求和国家之间的战争 。
二战结束后,美国和苏联成为死敌 。这个时代就是著名的冷战:双方都卷入了一场轰轰烈烈的军备竞赛,并以致命的核武器威胁对方 。1964年,一部名为《奇异之爱博士》的电影对这场竞赛进行了嘲讽,同时其扣人心弦的故事情节展现了当时的游戏时代和博弈论的基本观点 。冷战时期,美国军方在有助于国家安全的领域投入了大量研究经费,其中就包括对博弈论的研究 。许多博弈论专家为军事研究机构兰德公司工作 。在电影中,艾琦博士是美国总统武器研究的负责人 。他是一个古怪的天才,戴着墨镜,带着可笑的口音为军事战略出谋划策 。据说他的原型受到了一位真正天才的启发——匈牙利数学家约翰·冯尼曼(1903-1957),他是博弈论的提出者之一,曾供职于兰德公司,并成为艾森豪威尔总统的国防战略顾问 。诺曼很有天赋,也很聪明 。他8岁的时候就能心算8位数除法了 。成年后,他撰写了关于冲击波、空空气动力学和地球毁灭的论文,在业余时间,他创立了博弈论 。
冯·诺依曼
想象自己是一名将军,需要决定是否购买更多炸弹 。你知道敌人的将军们也必须做出同样的选择 。你将如何做出实际的决定?决策的很大一部分在于搞清楚敌人可能会做什么 。一旦知己知彼,我们说结果可能是——双方都买导弹,或者都不买导弹,或者其他可能 。诺曼迈出了一大步,他找到了获得结果的方法 。然而,这种方法只适用于某些特定的情况,例如,参与者可以谈判并达成坚定的协议 。两个敌国的将军做不到这一点,所以他们需要可以适用于其他情况的方法(包括参与者可能不遵守承诺的情况) 。
约翰·纳西
1950年,数学家约翰·纳西(1928-2015)提出了一个解决方案 。纳什在普林斯顿大学读书时就有了这个想法 。他决定带着自己的观点去拜访当时在普林斯顿教书的诺依曼 。虽然诺伊曼已经是大名鼎鼎的人物,但纳什并没有退缩 。在此之前,他突然拜访了爱因斯坦 , 讨论了他关于宇宙膨胀的一些新观点 。)著名的诺伊曼把纳什送出门外 , 告诉他,他的观点毫无意义 。
事实上,纳什的观点后来成为博弈论中最重要的部分,并被广泛应用到今天 。他认为,游戏的结果——它的“均衡”——是每个玩家的策略,也是其他玩家策略的最好反映 。当每个人都这样做时,任何人都没有理由改变自己的行动 。这是博弈中的均衡 。纳什证明了大部分博弈都有均衡 。就我和我的敌人而言,既然敌人已经买了导弹,我最好的反应就是采取同样的行动,最坏的就是面对敌人没有武器的威胁 。同样的道理也适用于敌人 。如果我买武器 , 他们肯定也会这么做 。我们建立了导弹储备,这是博弈的均衡 。
军备竞赛是博弈论中著名的“囚徒困境”的一个版本,是兰德公司的数学家发明的 。在这个游戏中 , 两个抢劫犯因抢劫银行被捕 。警方证据不足 , 但他们知道至少可以判抢劫犯逃税罪 。劫匪是分开审问的 , 大家可以坦白也可以拒绝坦白 。警方告诉劫匪,如果其中一人招供,另一人拒不招供,他们将把不招供者视为主犯,招供者视为证人 。拒绝坦白者将被判处20年监禁,坦白者将被释放 。如果两人都拒不承认抢劫罪,将以逃税罪判处有期徒刑四年 。如果两人都认罪 , 将以抢劫罪判处10年监禁 。
劫匪会怎么做?假设其中一个劫匪认为他的同伙会招供 , 拒绝招供会导致他悲惨的入狱20年,那么他肯定会招供 。另一方面,即使他不相信他的伴侣会坦白,他也应该坦白,因为那样他就自由了 。当两个人都做出相同的推理时,他们都会坦白 。“囚徒困境”显然是平衡的:两个强盗都会招供 。

推荐阅读