纳什与博弈论 约翰 纳什

约翰·纳西(纳什和博弈论)
假设两个国家威胁要炸对方,其中一个国家装备了瞄准敌人的导弹,另一个国家也会这么做 。每个国家都试图通过购买武器来获得优势,结果就是“军备竞赛” 。后两个国家都有大量的导弹瞄准对方 。军备竞赛是“博弈论”的一个例子,它诞生于20世纪40年代至50年代的数学和经济学领域 。博弈论研究的是国家、公司和个人在一定情境下的行为,即一方的行为会影响另一方获得的结果 。当你的敌人购买导弹时,它使你处于不利地位,威胁到你的国家安全;如果买导弹,对敌国也是一样的效果 。考虑到敌人的行为,每一方都需要决定自己的行为 。博弈论者称之为“战略互动”:我们相互影响(我们互动),所以我们会根据敌人的行动来决定我们的行动(我们有“战略”) 。博弈论研究无处不在的战略互动,从剪刀石头布的游戏到经济中的利益追求和国家之间的战争 。
二战结束后,美国和苏联成为死敌 。这个时代就是著名的冷战:双方都卷入了一场轰轰烈烈的军备竞赛,并以致命的核武器威胁对方 。1964年,一部名为《奇异之爱博士》的电影对这场竞赛进行了嘲讽,同时其扣人心弦的故事情节展现了当时的游戏时代和博弈论的基本观点 。冷战时期,美国军方在有助于国家安全的领域投入了大量研究经费,其中就包括对博弈论的研究 。许多博弈论专家为军事研究机构兰德公司工作 。在电影中,艾琦博士是美国总统武器研究的负责人 。他是一个古怪的天才,戴着墨镜,带着可笑的口音为军事战略出谋划策 。据说他的原型受到了一位真正天才的启发——匈牙利数学家约翰·冯尼曼(1903-1957),他是博弈论的提出者之一,曾供职于兰德公司,并成为艾森豪威尔总统的国防战略顾问 。诺曼很有天赋,也很聪明 。他8岁的时候就能心算8位数除法了 。成年后,他撰写了关于冲击波、空空气动力学和地球毁灭的论文,在业余时间,他创立了博弈论 。
冯·诺依曼
想象自己是一名将军,需要决定是否购买更多炸弹 。你知道敌人的将军们也必须做出同样的选择 。你将如何做出实际的决定?决策的很大一部分在于搞清楚敌人可能会做什么 。一旦知己知彼,我们说结果可能是——双方都买导弹,或者都不买导弹,或者其他可能 。诺曼迈出了一大步,他找到了获得结果的方法 。然而,这种方法只适用于某些特定的情况,例如,参与者可以谈判并达成坚定的协议 。两个敌国的将军做不到这一点,所以他们需要可以适用于其他情况的方法(包括参与者可能不遵守承诺的情况) 。
约翰·纳西
1950年,数学家约翰·纳西(1928-2015)提出了一个解决方案 。纳什在普林斯顿大学读书时就有了这个想法 。他决定带着自己的观点去拜访当时在普林斯顿教书的诺依曼 。虽然诺伊曼已经是大名鼎鼎的人物,但纳什并没有退缩 。在此之前,他突然拜访了爱因斯坦,讨论了他关于宇宙膨胀的一些新观点 。)著名的诺伊曼把纳什送出门外,告诉他,他的观点毫无意义 。
事实上,纳什的观点后来成为博弈论中最重要的部分,并被广泛应用到今天 。他认为,游戏的结果——它的“均衡”——是每个玩家的策略,也是其他玩家策略的最好反映 。当每个人都这样做时,任何人都没有理由改变自己的行动 。这是博弈中的均衡 。纳什证明了大部分博弈都有均衡 。就我和我的敌人而言,既然敌人已经买了导弹,我最好的反应就是采取同样的行动,最坏的就是面对敌人没有武器的威胁 。同样的道理也适用于敌人 。如果我买武器,他们肯定也会这么做 。我们建立了导弹储备,这是博弈的均衡 。
军备竞赛是博弈论中著名的“囚徒困境”的一个版本,是兰德公司的数学家发明的 。在这个游戏中,两个抢劫犯因抢劫银行被捕 。警方证据不足,但他们知道至少可以判抢劫犯逃税罪 。劫匪是分开审问的,大家可以坦白也可以拒绝坦白 。警方告诉劫匪,如果其中一人招供,另一人拒不招供,他们将把不招供者视为主犯,招供者视为证人 。拒绝坦白者将被判处20年监禁,坦白者将被释放 。如果两人都拒不承认抢劫罪,将以逃税罪判处有期徒刑四年 。如果两人都认罪,将以抢劫罪判处10年监禁 。
劫匪会怎么做?假设其中一个劫匪认为他的同伙会招供,拒绝招供会导致他悲惨的入狱20年,那么他肯定会招供 。另一方面,即使他不相信他的伴侣会坦白,他也应该坦白,因为那样他就自由了 。当两个人都做出相同的推理时,他们都会坦白 。“囚徒困境”显然是平衡的:两个强盗都会招供 。
然而,在上述均衡中有一些奇怪的东西 。参与者对自己做出最好的回应,但得到的结果对双方都不是最好的 。两个人都不认罪更好,但这不是一个均衡:任何一个劫匪背叛搭档的结果总是更好,认罪是因为对被释放的预期 。在囚徒困境中,劫匪采取了理性的行动,但得到了更糟糕的结果 。军备竞赛也是如此 。博弈的结果是,两国都储备了导弹 。最后双方都压制不住对方,但都在武器上投入了大量资金 。如果一开始双方都没有购买导弹,结果会更好 。
经济学中总是会突然出现囚徒困境 。以电站用的大型汽轮发电机为例 。20世纪60年代,美国两大制造商通用电气和西屋电气希望他们的发电机能有个好价钱 。一种方法是彼此联合起来,同意减少发电机的销售,提高价格 。问题是,当价格上涨时,其中一家公司可能会受到利益的诱惑,稍微降低价格,以压倒竞争对手,销售更多的发电机 。危险在于价格暴跌,导致两家公司利润下降 。这两家公司的情况和劫匪有没有认罪一模一样 。产油国也面临同样的问题 。上世纪60年代,这些国家为了提高油价,互相承诺减少石油供应 。但是一旦价格上涨,一些国家会想要生产更多适销对路的石油 。
在商业、政治和日常生活中,人们有时竞争,有时合作 。博弈论提供了一种方法来帮助我们思考这种复杂性 。人们什么时候会倾向于一起合作,什么时候会激烈竞争?比如囚徒困境,合作总是面临破裂的风险 。
有些游戏会考虑更特殊更复杂的策略,尤其是在决策一个接一个的时候 。你可以看清楚别人做了什么再做决定 。你可以说,如果你的竞争对手采取不受欢迎的行动,你会惩罚他们 。20世纪70年代,两家美国咖啡公司Maxwell和Fujue争夺美国市场 。富爵正在向东扩张,希望控制麦斯威尔为主要供应商的地区 。麦斯威尔发动价格战,降低咖啡价格,以便将富爵赶出自己的市场 。结果就是:如果你进入我的市场,那我就有大买卖了 。希望这能先阻止你进入我的市场 。然而,这种威胁的问题是它们并不总是可靠的 。你可能认为我不会遵循你的策略,因为低价会让我花很多钱 。幸运的是,在Maxwell和Fujue的案例中,威胁起了作用:Maxwell挫败了Fujue进入纽约市场的企图 。
然而,奇异之爱博士的故事表明,实施有效的威胁是多么困难 。为了阻碍一次核攻击,你会告诉敌人,你一定会以牙还牙 。但是,一旦敌人真的发射导弹,他们肯定你不会报复,因为两枚导弹就足以毁灭地球上的生命 。电影中,暴躁的美国将军下令向苏联发射核弹 。美国总统试图取消攻击,但是将军切断了与总统的通讯 。总统召见苏联大使,大使告诉他,苏联已经建立了一个“末日机器” 。这颗巨大的炸弹一旦被引爆,就会毁灭所有的生命 。如果对苏联发动攻击,就会自动发动,无法关闭 。艾博士向总统解释了机器的逻辑:通过自动化和不可逆,这台机器已经成为一个可靠的威胁,因此它应该能够打消敌人的攻击想法 。这部电影通过艾格博士对苏联大使的咆哮告诉我们,只有当每个人都知道它时,它才会起作用 。
末日机器揭示了博弈论的一个基本策略:关键是影响对手对你的想法 。当一家公司威胁要报复竞争对手时,它需要显得咄咄逼人,而不是软弱无力 。末日机器在经济上的体现就是建一个远大于市场需求的工厂 。一旦成立,甚至不惜血本横扫市场 。只有这样,我们才能收回一部分建厂投资 。在20世纪40年代,美国铝业控制了该行业90%的产能,这是为了排挤竞争对手而采取的策略 。
《美丽心灵》
纳什年轻时通过几篇数学文章介绍他的观点,后来就销声匿迹了 。他一直患有严重的精神疾病,并在医院度过了几十年,但他的思想引起了经济学的一场革命 。(2001年的电影《美丽心灵》讲述了纳什传奇的一生 。经济中的战略互动经常发生,但在博弈论诞生之前,这部分一直被经济学家忽略 。经济中有很多买家和卖家,没有人能单独影响价格 。当成千上万的苹果销售商服务于成千上万的消费者时,如果他们以市场价格销售苹果,那么无论他们销售多少,他们都不必担心竞争对手的行动或想法,也不必为了生存而试图压倒对方 。博弈论使经济学家能够分析更复杂、更现实的人与人竞争、企业与企业竞争的情况 。后来,纳什逐渐康复,并因其开创性的思想获得了1944年的诺贝尔经济学奖 。如今,这一理论几乎应用于经济学的所有领域 。
【纳什与博弈论 约翰 纳什】

    推荐阅读