博弈是什么意思 经典博弈教学

生活处处皆博弈 。囚徒困境带给我们的启示
关于博弈 。很多的人都了解也听说过 。生活中处处有博弈 。那么到底什么是博弈呢?
博弈原意是指下棋 。引申义则对比丰盛多样:在一定的外在条件下 。参加项目的人们齐心全力遵守相同规则 。选择并实施各自不一样的行为或策略 。并获取相应结果的过程 。一些时候 。博弈也作为一个动词 。表示一种动态的过程 。
往往一般 。一个完美的博弈会包括五个要素:第一 。参加者 。它合适是博弈过程中独立决定并承担后果的个体或者团队;
第二 。博弈消息 。只是参加博弈者学会的对策略有帮助的外界消息资料;
第三 。策略集合;
第四 。博弈次序 。只是博弈参加者做策略选择的先后顺序;
第五 。博弈收获 。只是博弈方做出策略选择后的得与失 。

博弈是什么意思 经典博弈教学

文章插图
此外 。如果从博弈的详细应用来划分的话 。还可将博弈分为静态博弈和动态博弈 。
所谓静态博弈 。只是指在博弈中 。两个参加者同一时间做出选择 。或者两人做选择的时间或者秩序不一样 。而且靠后的动作者 。不了解先动作者会采取什么样的详细动作 。
也只是说 。在同一件事件的争论和推进中 。参加双方都容易造成行为上的重组重复 。
动态博弈则是指在博弈中 。两个参加人的动作是有先后顺序的 。而且 。靠后的动作者合适研究到最先动作者所选择的是哪种动作和策略 。
博弈在我们的生活中无处不在 。而在博弈理论中有一个古典的举例 。那么是“囚徒困境” 。
博弈是什么意思 经典博弈教学

文章插图
【囚徒困境博弈论】一个富翁被发现死在家中 。一部分财物也被盗走 。警方经历过侦讯逮捕了强盗A和强盗B 。但两人都矢口否认杀死过富翁 。只承认入室盗窃偷东西的罪名 。案件陷入困境 。于是警方将两人隔离关押 。由地方检察官分别与两个体进行一对一的谈话 。
检察官对A说:“偷盗罪证据确凿 。所以365天刑期是肯定会一些 。但是 。我这里有一个交易 。如果你承认杀人罪行 。我就只判你三个月监禁 。但你的同伙就要被判刑十年;现在如果你拒不坦白认罪而被你的同伙检举你的杀人罪行 。你就会被判刑十年 。而他则只判监禁三个月 。另外 。如果你们俩同一时间承认了杀人罪行 。那么 。你们就同一时间被判刑5年 。”
这只是著名的“囚徒困境” 。
那么强盗A和强盗B该怎么样选择呢?
博弈是什么意思 经典博弈教学

文章插图
显然 。他们只有两种选择:承认杀人或否认杀人 。
旁观者清 。貌似对于2个体最好的选择策略是各位都不承认杀人罪行 。之后都被判1年 。但是 。我们不要忘记 。两人被分别关押 。并且缺乏相信和了解 。所以不会了解对面会做出什么样的选择 。
根据经济学家亚当斯密的理论 。所有人思考策略都是从利己的角度去做选择的 。所以 。从对个体最为有利的角度讲 。选择承认杀人才是个体的最好策略 。因为承认杀人后 。只会被监禁3个月 。很显然 。这要比自己不承认杀人而坐10年牢好得多 。
可是 。这种策略能够实现的前提是 。另一方抵赖 。所以 。承认自己杀人这种策略 。其实是个损人利己的策略 。
博弈是什么意思 经典博弈教学

文章插图
不仅如此 。承认自己的杀人罪行还有很多的好处 。例如 。如果对面坦白而自己抵赖 。那自己就得坐牢10年 。因此 。在双方被隔离不合适互通消息的状态下 。最好的策略其实是两人同一时间坦白 。这样两人至多分别只被判5年 。总体也比被判10年好 。
强盗A和强盗B最为适合的选择 。是同一时间向检察官承认杀人罪行 。这种两人都选择承认杀人罪行的策略 。以及同一时间被判5年 。
这样的博弈结果 。我们称之为“纳什均衡” 。而它的正式学术名称叫做“非合作均衡” 。
这一囚徒困境选择 。有着广泛而深刻的辐射意义 。因为 。当个体在选择策略时 。如果没有“共谋”或者窜供 。每一个体都会选择对自己最有利的策略 。肯定不会思考社会福祉 。或很多的对手的利益 。
这就说明着 。个体与集体之间即便有冲突 。但是个体追求利己行为 。最终会导致的结局是一个“纳什均衡” 。也是对全部人都有利的结局 。
从“纳什均衡”中我们还合适悟出一个道理:合作 。才是超级有利的“利己策略” 。但是 。合作一定符合一个黄金律:一定是双方都根据一样的方法行事才行 。

推荐阅读