火树科普博弈论-扑克中的数学

复习下上次学习的内容。
在混合策略的纳什均衡下,对手无法通过自己的行为增加收益,即无论对手选择策略A还是策略B都无法增加自己的收益。因此,对手选择A策略的收益等于B策略的收益,这个等式就可以用来进行纳什均衡的计算。
今天说火树博弈论最后一帕-扑克游戏
火树科普博弈论-扑克中的数学
文章图片
The Mathematics of Poker 拓展阅读《The Mathematics of Poker》本书算是德州扑克划时代的一本书,是把德州扑克的游戏行为用数学方式进行了解释。
先看下游戏规则:
火树科普博弈论-扑克中的数学
文章图片
规则介绍: Pot 2,指底池里已经有2个金币。先手有选择下注的权利,要么下注一个金币(bet),或者放弃(check)。后手可以跟注一个金币(call),或者弃牌(fold)。Y为先手,X为后手。游戏一共只有3张牌,分别是A,K ,Q。A最大,Q最小。两个玩家,你拿一张我拿一张比大小。获胜的人就拿走所有的钱。

去牌效应(card removal)
游戏中只有3张牌,两个人不存在相同的牌。就是说我拿了A,你就肯定拿不到A了。虽然是废话,但是很重要!特此说明!
收益矩阵如下: 火树科普博弈论-扑克中的数学
文章图片
分析: Y是先手当拿到A时一定会下注(Bet),后手X拿到K如果跟注(call),那Y就赢了3个金币。如果X的K弃牌(fold),那Y就赢2个金币。
当Y拿到Q时假如也下注(Bet),后手X手里的如果拿到A一定会跟注,那么A就损失1个金币。如果X拿到的是K,有可能跟注(call),那么A也损失1个金币,如果弃牌(fold),那么A就赢得2个金币。
问题来了:
为什么没有显示X拿到Q的情况呢?因为一定是会弃牌嘛!最小的扔掉!
为什么没有显示Y拿到K的情况呢?因为先手Y拿到K一定弃牌(check)。对方要么A,赢我一个金币,要么Q,直接弃牌。结果已知。
好了,那么按照这个收益矩阵,如果Y在拿到的A的时候一直下注会有什么结果呢?结果就是X就会知道Y下注一定是拿到了A,X就会把K全部扔掉,让损失从3个金币减少到2个金币。Y就不能获得最大收益。
所以,Y的策略就是让Q参与到下注里,这样,当X再扔K的时候,Y就从损失1个金币变成了赢得2个金币。这时候X发现Q也下注了,那就会继续跟注,Y就又会损失1个金币。然后Y就只下注A,X又会把K扔掉,如此循环往复下去。此时,就需要用混合策略让两个人达到一个纳什均衡。
如果纯策略没有一个纳什均衡,那就在混合策略里面。 游戏中需要解决的问题是:对于先手Y,Q需要用多少频率用来下注,后手X,K需要用多少频率来跟注。 换句话说,Q的下注频率要使得K弃牌和跟注的收益相等。K的跟注频率也要使Q下注和弃牌的收益相等。 X的K计算频率如下:(计算过程省略100字) 火树科普博弈论-扑克中的数学
文章图片
计算结果是K的跟注频率=1/3时,达到纳什均衡。
当K跟注>1/3,Y用Q下注的收益就<0, 所有的Q都弃牌(check),达到最大收益。
当K跟注<1/3,Y用Q下注的收益就>0, 所有的Q都会下注(bet),达到最大收益。
对X来说,保证K跟注的频率在1/3,Y用Q下不下注的收益都是0。
同理可得Y的Q频率如下:(计算过程省略100字) 火树科普博弈论-扑克中的数学
文章图片
结论:
双方的行为都达到了纳什均衡,没有一方通过改变行为会带来更大的收益。双方收益均为0。
一切的策略游戏在达到了均衡之后,在规则公平的条件下,是没有人收益的,即零和游戏。
运用纳什均衡的意义
对方无法从我们这里获得更大的利益,无法被剥削;
【火树科普博弈论-扑克中的数学】面对非理性对手,当对方没有找到这个均衡点时,我们选择收益更高的策略,剥削对方;
纳什均衡不是一个【赢】的方法,而是一个【不输】的方法。
最后科普一下 Who is 火树 火树科普博弈论-扑克中的数学
文章图片
清华博士 火树科普博弈论-扑克中的数学
文章图片
B站截图 火树科普博弈论-扑克中的数学
文章图片
B站截图 火树科普博弈论完结。谢谢大家!

    推荐阅读