马哥高端Go语言百万并发高薪班/微服务/分布式高可用/Go高并发fdfdsg

download:马哥高端Go语言百万并发高薪班/微服务/分布式高可用/Go高并发
问题描绘
囚徒窘境是博弈论中经典问题,有两个囚徒有坦白未报的盗窃案件,在审问过程中每个囚徒能够选择抗拒不供认或者坦白供认。局势就是两个囚徒给出本人战略算一个局势,那么依据排列组合局势有
抗拒,抗拒
坦白,抗拒
抗拒,坦白
坦白,坦白
假如两个人都抗拒不供认每人会被判 1 年,假如两个人都坦白每个人会被判 3 年,假如一方坦白另一方抗拒,抗拒一方会被判 5 年而坦白会被释放。
局中人:
两个囚徒
【马哥高端Go语言百万并发高薪班/微服务/分布式高可用/Go高并发fdfdsg】战略
抗拒或者坦白
功效函数矩阵
抗拒 坦白
抗拒 -1,-1 -5,0
坦白 0,-5 -3,-3
每个人都会选择最大化本人受益的最大化战略,那么关于囚徒最大化受益就是服刑时间最短,为了这个目的怎样的战略才是理性的呢?
关于囚徒(A 囚徒)做出战略时还需求思索到另一个囚徒(B 囚徒)的战略选择,那么 B 囚徒选择有两种可能分别是抗拒或者是坦白,这里就称为 B 囚徒,假如 B 囚徒坦白的前提,A 囚徒假如坦白将服刑 3 年假如抗拒则服刑 5 年,所以 A 最佳选择是认罪。
假定前面战略 A 囚徒选择了抗拒状况,B 囚徒选择坦白收益为 0,当 A 囚徒选择坦白状况,B 囚徒也会选择坦白获取去收益最大。
关于 A 囚徒无论 B 囚徒做出什么战略,坦白都是 A 囚徒的占优战略。两个囚徒都不能经过双方面改动战略来增加本人的效益,因而谁都没有游离这个战略组合的动机。
占优战略
在选择战略时,有一个战略的功效总是大于其他一切战略功效时,我们就把这类战略称为占优战略(Dominant Strategy)
占优战略纳什平衡
当一切参与者的最优回应是选择他们的占优战略时,这时到达的纳什平衡称为占优战略纳什平衡。

    推荐阅读