JAVA进阶训练营(2021最新版)sesae java

download:JAVA进阶训练营(2021最新版)
问题描述
囚徒困境是博弈论中经典问题，有两个囚徒有隐瞒未报的偷盗案件，在审问过程中每个囚徒可以选择抗拒不承认或者坦白承认。局势就是两个囚徒给出自己策略算一个局势，那么根据排列组合局势有
抗拒,抗拒
坦白,抗拒
抗拒,坦白
坦白,坦白
如果两个人都抗拒不承认每人会被判 1 年，如果两个人都坦白每个人会被判 3 年，如果一方坦白另一方抗拒，抗拒一方会被判 5 年而坦白会被释放。
局中人:
两个囚徒
策略
抗拒或者坦白
效用函数矩阵
每个人都会选择最大化自己受益的最大化策略，那么对于囚徒最大化受益就是服刑时间最短，为了这个目的怎样的策略才是理性的呢?
对于囚徒(A 囚徒)做出策略时还需要考虑到另一个囚徒(B 囚徒)的策略选择，那么 B 囚徒选择有两种可能分别是抗拒或者是坦白，这里就称为 B 囚徒，如果 B 囚徒坦白的前提，A 囚徒如果坦白将服刑 3 年如果抗拒则服刑 5 年，所以 A 最佳选择是认罪。
假设前面策略 A 囚徒选择了抗拒情况，B 囚徒选择坦白收益为 0，当 A 囚徒选择坦白情况，B 囚徒也会选择坦白获取去收益最大。
对于 A 囚徒无论 B 囚徒做出什么策略，坦白都是 A 囚徒的占优策略。两个囚徒都不能通过单方面改变策略来增加自己的效益，因此谁都没有游离这个策略组合的动机。
占优策略
在选择策略时，有一个策略的效用总是大于其他所有策略效用时，我们就把这类策略称为占优策略(Dominant Strategy)
【JAVA进阶训练营(2021最新版)sesae】占优策略纳什均衡
当所有参与者的最优回应是选择他们的占优策略时，这时达到的纳什均衡称为占优策略纳什均衡。

JAVA进阶训练营(2021最新版)sesae

推荐阅读

iqoo|手机性价比我只服小米Redmi，7月份无论低中高机型都拿第一

造梦西游3流石碎片8 造梦西游3牛魔王的怒吼

超广角|拍照不行了？华为P50 Pro对比三星S21 Ultra，谁更胜一筹？

为什么有些人寂寞的时候想喝酒？

心力衰竭|天气转凉，警惕心衰复发的6个常见诱因！都是您常常忽略的

大枣枸杞养颜茶——美容养颜开胃

枸杞羊肾粥的营养价值

好看又不贵的手表卡西欧的表怎么样

王者荣耀战队赛有段位限制吗王者荣耀战队赛有段位限制吗

吃西洋参的好处居然有这么多请问吃西洋参有什么好处

内存|发布不到一个月下跌400元，12GB+256GB，顶配旗舰沦为标准中档机

关于vue3|关于vue3 compositionAPI

崇明国瑞瀛台怎么样，有地铁么

欲加之罪何患无辞的意思是什么欲加之罪何患无辞的意思

喇叭花的格言

新款宝马x3全系没有大灯清洗宝马x3大灯清洗开关在哪

中药茶疏肝解郁好心情

泛函分析国立交通大学,国立交通大学现在叫什么

比武招亲中木桑老道技能有哪些

固定资产清查报告模板3篇