当前位置：文档之家› 博弈论中的几个经典问题.doc

博弈论中的几个经典问题.doc

几个博弈论中的经典问题博弈论（ GameTheory ），亦名“对策论”、“赛局理论”，属应用数学的一个分支，博弈论已经成为经济学的标准分析工具之一。

目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论主要研究公式化了的激励结构间的相互作用。

是研究具有斗争或竞争性质现象的数学理论和方法。

也是运筹学的一个重要学科。

博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。

生物学家使用博弈理论来理解和预测进化论的某些结果。

几个重要的概念1、策略 (strategies) ：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。

如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。

2、得失 (payoffs) ：一局博弈结局时的结果称为得失。

每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。

所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff ）函数。

3、次序（ orders ）：各博弈方的决策有先后之分，且一个博弈方要作不止一次的决策选择，就出现了次序问题；其他要素相同次序不同，博弈就不同。

4、博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。

在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。

5、纳什均衡 (Nash Equilibrium) ：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。

也就是说，此时如果他改变策略他的支付将会降低。

在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。

纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。

所谓“均衡偶”是在二人零和博弈中，当局中人 A 采取其最优策略a*, 局中人 B 也采取其最优策略 b*, 如果局中人 B 仍采取b*, 而局中人 A 却采取另一种策略a，那么局中人 A 的支付不会超过他采取原来的策略a* 的支付。

这一结果对局中人 B 亦是如此。

经典的博弈问题1、“囚徒困境”“囚徒困境”是博弈论里最经典的例子之一。

讲的是两个嫌疑犯（Ａ和Ｂ）作案后被警察抓住，隔离审讯；警方的政策是 " 坦白从宽，抗拒从严 " ，如果两人都坦白则各判８年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判１０年；如果都不坦白则因证据不足各判１年。

在这个例子里，博弈的参加者就是两个嫌疑犯Ａ和Ｂ，他们每个人都有两个策略即坦白和不坦白，判刑的年数就是他们的支付。

可能出现的四种情况：Ａ和Ｂ均坦白或均不坦白、Ａ坦白Ｂ不坦白或者Ｂ坦白Ａ不坦白，是博弈的结果。

Ａ和Ｂ均坦白是这个博弈的纳什均衡。

这是因为，假定Ａ选择坦白的话，Ｂ最好是选择坦白，因为Ｂ坦白判８年而抵赖却要判十年；假定Ａ选择抵赖的话，Ｂ最好还是选择坦白，因为Ｂ坦白判不被判刑而抵赖确要被判刑１年。

即是说，不管Ａ坦白或抵赖，Ｂ的最佳选择都是坦白。

反过来，同样地，不管Ｂ是坦白还是抵赖，Ａ的最佳选择也是坦白。

结果，两个人都选择了坦白，各判刑８年。

在（坦白、坦白）这个组合中，Ａ和Ｂ都不能通过单方面的改变行动增加自己的收益，于是谁也没有动力游离这个组合，因此这个组合是纳什均衡。

囚徒困境反映了个人理性和集体理性的矛盾。

如果Ａ和Ｂ都抵，各判刑１年，然比都坦白各判刑８年好得多。

当然，Ａ和Ｂ可以在被警察抓到之前立一个" 攻守同盟" ，但是可能不会有用，因它不构成什均衡，没有人有极性遵守个定。

2、海盗分金在一座座荒上，有 5 个盗掘出了 100 非常珍的金。

他商定了一个分配金的：首先抽决定每个人的次序，排列成盗一至五。

然后由盗一先提出分配方案，5 人表决，如多数人同意，方案就被通，否盗一将被扔入大海喂。

如果盗一被扔入大海，就由盗二接着提出分配方案，如多数人同意方案就被通，否盗二也要被扔入大海。

以下依次推。

假定每个盗都足明, 都能做出理性的，那么，盗一提出什么的分配方案，能使自己得到最大的收益？于个要采用方向推方法：如果 1 至 3 号盗都喂了，只剩 4 号和 5 号的，5 号一定投反票 4 号喂，以独吞全部金。

所以， 4 号惟有支持 3 号才能保命。

3 号知道一点，就会提出“100， 0，0”的分配方案，4 号、5 号一毛不拔而将全部金已有，因他知道 4 号一无所但是会投成票，再加上自己一票，他的方案即可通。

不， 2 号推知 3 号的方案，就会提出“ 98， 0，1，1”的方案，即放弃 3 号，而予 4 号和 5 号各一枚金。

由于方案于 4 号和 5 号来比在 3 号分配更有利，他将支持他而不希望他出局而由 3 号来分配。

， 2 号将拿走98 枚金。

同， 2 号的方案也会被 1 号所洞悉， 1 号并将提出（ 97，0，1，2，0）或（ 97，0， 1，0， 2）的方案，即放弃 2 号，而 3 号一枚金，同 4 号（或 5 号） 2 枚金。

由于 1 号的一方案于 3 号和 4 号（或 5 号）来，相比 2 号分配更，他将投 1 号的成票，再加上 1 号自己的票， 1 号的方案可通，97 枚金可松落入囊中。

无疑是 1 号能取最大收益的方案了！答案是： 1 号盗分 3 号 1 枚金，分 4 号或 5 号盗 2 枚，自己独得 97 枚。

分配方案可写成（ 97，0， 1， 2， 0）或（ 97， 0， 1， 0， 2）。

1号看起来最有可能喂，但他牢牢地把握住先，果不但消除了死亡威，收益最大。

而5 号，看起来最安全，没有死亡的威，甚至能坐收人之利，却因不得不看人色行事而只能分得一小杯羹。

在“海盗分金”中，任何“分配者”想自己的方案得通的关是，事先考清楚“挑者”的分配方案是什么，并用最小的代价取最大收益，拉“挑者”分配方案中最不得意的人。

3、旅行者困境两个旅行者从一个以出瓷花瓶著称的地方旅行回来，他都了花瓶。

提取行李的候，花瓶被摔坏了，于是他向航空公司索。

航空公司知道花瓶的价格大概在八九十元的价位浮，但是不知道两位旅客的候的确切价格是多少。

于是，航空公司两位旅客在 100 元以内自己写下花瓶的价格。

如果两人写的一，航空公司将他真，就按照他写的数；如果两人写的不一，航空公司就定写得低的旅客的是真，并且原上按个低的价格，同，航空公司真的旅客励 2 元，假的旅客款 2 元。

了取最大而言，本来甲乙双方最好的策略，就是都写100 元，两人都能100 元。

可是不，甲很明，他想：如果我少写 1 元成 99 元，而乙会写100 元，我将得到101 元。

何而不？所以他准写99 元。

可是乙更明，他算到甲要算他写 99 元，于是他准写98 元。

想不到甲要更明一个次，估到乙要写98 元来坑他，于是他准写97 元⋯⋯大家知道，下象棋的候，不是要多“看”几步，“看”得越远，胜算越大。

你多看两步，我比你更强多看三步，你多看四步，我比你更老谋深算多看五步。

在花瓶索赔的例子中，如果两个人都“彻底理性”，都能看透十几步甚至几十步上百步，那么上面那样“精明比赛”的结果，最后落到每个人都只写一两元的地步。

事实上，在彻底理性的假设之下，这个博弈唯一的纳什均衡。

4、枪手博弈彼此痛恨的甲、乙、丙三个枪手准备决斗。

甲枪法最好，十发八中；乙枪法次之，十发六中；丙枪法最差，十发四中。

如果三人同时开枪，并且每人只发一枪；第一轮枪战后，谁活下来的机会大一些？一般人认为甲的枪法好，活下来的可能性大一些。

但合乎推理的结论是，枪法最糟糕的丙活下来的几率最大。

我们来分析一下各个枪手的策略。

枪手甲一定要对枪手乙先开枪。

因为乙对甲的威胁要比丙对甲的威胁更大，甲应该首先干掉乙，这是甲的最佳策略。

同样的道理，枪手乙的最佳策略是第一枪瞄准甲。

乙一旦将甲干掉，乙和丙进行对决，乙胜算的概率自然大很多。

枪手丙的最佳策略也是先对甲开枪。

乙的枪法毕竟比甲差一些，丙先把甲干掉再与乙进行对决，丙的存活概率还是要高一些。

我们计算一下三个枪手在上述情况下第一轮枪战中的存活几率：甲： 24%（被乙丙合射40% X 60% = 24%）乙： 20%（被甲射100% - 80% = 20% ）丙： 100%（无人射丙）第二轮枪战中甲乙丙存活的几率粗算如下：(1) 假设甲丙对决：甲的存活率为60%，丙的存活率为20%。

(2) 假设乙丙对决：乙的存活率为60%，丙的存活率为40%。

第一轮：甲射乙，乙射甲，丙射甲。

甲的活率为 24%（ 40% X 60%），乙的活率为 20%(100% - 80%) ，丙的活率为 100%（无人射丙）。

第二轮：情况 1：甲活乙死（ 24% X 80% = % ）甲射丙，丙射甲──甲的活率为60%，丙的活率为20%。

情况 2：乙活甲死（ 20% X 76% = % ）乙射丙，丙射乙──乙的活率为60%，丙的活率为40%。

情况 3：甲乙皆活（ 24% X 20% = % ）重复第一轮。

情况 4：甲乙皆死（ 76% X 80% = % ）枪战结束。

甲的活率为 %% X 60%) + % X 24%) = %乙的活率为 %% X 60%) + % X 20%) = %丙的活率为 %% X 20%) + % X 40%) + % X 100%) + % X 100%) = %通过对两轮枪战的详细概率计算，我们仍然发现枪法最差的丙存活的几率最大，枪法较好的甲和乙的存活几率仍远低于丙的存活几率。

对于这样的例子，有人会发出“英雄创造历史，庸人繁衍子孙”的感叹。

e商务文档

博弈论中的几个经典问题.doc

相关文档推荐：