剪刀石头布的获胜秘诀来了!如何用博弈论来玩游戏

作者:大神团·张通
作者介绍:张通 , 新东方智慧学堂授课老师 , 北京大学力学系理论与应用力学专业学士 。
石头剪刀布 , 这个游戏相信大家都玩过 , 比赛一局肯定是运气做主 , 但是多次对局 , 则是一个策略游戏 。 那么问题来了 , 两人重复多次石头剪刀布的对局 , 且两人都绝对“聪明” , 那么是否存在一种最优策略 , 使得胜率最高?
剪刀石头布的获胜秘诀来了!如何用博弈论来玩游戏
文章图片
游戏 , 又叫博弈 。 研究游戏的学科 , 在数学中叫博弈论GameTheory 。 本文不用去管博弈论的定义 , 只需要知道什么情况下的游戏可以用博弈论来解决 。
就是说 , 石头剪刀布这个游戏必须满足以下几个特点:
1、参与游戏的主体完全理性 。
最大化自己的收益 , 即能赢绝不输 , 能多赚绝不少赚 。 若参与游戏的主体是两个人 , 各自仅代表自己为战 , 这种博弈可称为“双人博弈” 。
2、完全理性是共同认识 。
即两个人都知道对方是理性的 , 也知道对方知道我是理性的 , 也知道对方知道我知道对方是理性的……直到无穷 。
3、参与者每局都有自己的策略选择权及收益信息且能做出正确选择 。
比如能出石头、剪刀或布中的任意一个 , 且知道规则:石头战胜剪刀战胜布战胜石头 , 如果知道对方出布 , 自己一定出剪刀 。
从上面三点可以看出 , 石头剪刀布均满足 , 所以该问题可称石头剪刀布博弈问题 。
博弈论的种类很多 。
第一 , 如果游戏状态信息(包括双方的偏好、策略、游戏规则、双方的收益信息)对双方完全可见 , 则称完全信息博弈;反之 , 只要有任一个信息对任一方不可见 , 则称不完全信息博弈 。
第二 , 游戏是两个人同时(包括逻辑同时 , 即一方行动后另一方完全不知 , 等同于同时行动)决策并行动 , 则称静态博弈;反之 , 决策一先一后 , 就像下棋一样 , 则称动态博弈 。
第三 , 游戏中有有限个参与者且每位参与者的策略选择只有有限种 , 则称有限博弈;反之 , 则称无限博弈 。
剪刀石头布的获胜秘诀来了!如何用博弈论来玩游戏
文章图片
剪刀石头布的获胜秘诀来了!如何用博弈论来玩游戏
文章图片
本文研究的问题均为完全信息静态有限双人博弈 , 石头剪刀布博弈正是其中的一种 。 但它的策略选择较为复杂 , 故先看一些简单的例子 。
著名的“囚徒困境”是博弈论中最经典也是最简单的例子 。
问题描述如下:两个罪犯 , 被警察分别关在两个独立的不能互通信息的牢房里进行审讯 。 他俩都可以做出自己的选择:供出另一个人 , 或保持沉默 。 这两个罪犯都知道 , 如果他俩都能保持沉默 , 均会只被判一个月;但如果有一个人先供出他的同伙 , 那么这个人就可以被无罪释放 , 但被他供出来的那个会被判十八个月;如果他俩都招供了 , 则两个人都会被判十二个月 。
剪刀石头布的获胜秘诀来了!如何用博弈论来玩游戏】如果你是罪犯 , 你会如何行动?
本文研究的这类博弈的策略和收益信息是完全公开的 , 故可以用收益矩阵来表示 。 即:
剪刀石头布的获胜秘诀来了!如何用博弈论来玩游戏
文章图片
表头第一列是A的行动策略 , 第一行是B的行动策略 , 表中的数字分别表示在该组合行动下的A的收益和B的收益 。
对A来说 , 若B供出同伙 , 则A供出同伙比沉默要少判六个月 , 所以A选供出同伙;若B沉默 , 则A供出同伙比沉默要少判一个月 , 所以A选供出同伙 。 于是尽管A不知道B做何种选择 , 但他知道无论B选择什么 , 他选择供出同伙总是最优的 。 显然 , 根据对称性 , B也会选择供出同伙 。

相关经验推荐