几个博弈论中的经典问题博弈论( GameTheory ),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。
目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论主要研究公式化了的激励结构间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
生物学家使用博弈理论来理解和预测进化论的某些结果。
几个重要的概念1、策略 (strategies) :一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。
如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。
2、得失 (payoffs) :一局博弈结局时的结果称为得失。
每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。
所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff )函数。
3、次序( orders ):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。
4、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。
在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。
5、纳什均衡 (Nash Equilibrium) :在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。
也就是说,此时如果他改变策略他的支付将会降低。
在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。
所谓“均衡偶”是在二人零和博弈中,当局中人 A 采取其最优策略a*, 局中人 B 也采取其最优策略 b*, 如果局中人 B 仍采取b*, 而局中人 A 却采取另一种策略a,那么局中人 A 的支付不会超过他采取原来的策略a* 的支付。
这一结果对局中人 B 亦是如此。
经典的博弈问题1、“囚徒困境”“囚徒困境”是博弈论里最经典的例子之一。
讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是 " 坦白从宽,抗拒从严 " ,如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。
可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。
A和B均坦白是这个博弈的纳什均衡。
这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。
即是说,不管A坦白或抵赖,B的最佳选择都是坦白。
反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。
结果,两个人都选择了坦白,各判刑8年。
在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。
囚徒困境反映了个人理性和集体理性的矛盾。
如果A和B都抵,各判刑1年,然比都坦白各判刑8年好得多。
当然,A和B可以在被警察抓到之前立一个" 攻守同盟" ,但是可能不会有用,因它不构成什均衡,没有人有极性遵守个定。
2、海盗分金在一座座荒上,有 5 个盗掘出了 100 非常珍的金。
他商定了一个分配金的:首先抽决定每个人的次序,排列成盗一至五。
然后由盗一先提出分配方案,5 人表决,如多数人同意,方案就被通,否盗一将被扔入大海喂。
如果盗一被扔入大海,就由盗二接着提出分配方案,如多数人同意方案就被通,否盗二也要被扔入大海。
以下依次推。
假定每个盗都足明, 都能做出理性的,那么,盗一提出什么的分配方案,能使自己得到最大的收益?于个要采用方向推方法:如果 1 至 3 号盗都喂了,只剩 4 号和 5 号的,5 号一定投反票 4 号喂,以独吞全部金。
所以, 4 号惟有支持 3 号才能保命。
3 号知道一点,就会提出“100, 0,0”的分配方案,4 号、5 号一毛不拔而将全部金已有,因他知道 4 号一无所但是会投成票,再加上自己一票,他的方案即可通。
不, 2 号推知 3 号的方案,就会提出“ 98, 0,1,1”的方案,即放弃 3 号,而予 4 号和 5 号各一枚金。
由于方案于 4 号和 5 号来比在 3 号分配更有利,他将支持他而不希望他出局而由 3 号来分配。
, 2 号将拿走98 枚金。
同, 2 号的方案也会被 1 号所洞悉, 1 号并将提出( 97,0,1,2,0)或( 97,0, 1,0, 2)的方案,即放弃 2 号,而 3 号一枚金,同 4 号(或 5 号) 2 枚金。
由于 1 号的一方案于 3 号和 4 号(或 5 号)来,相比 2 号分配更,他将投 1 号的成票,再加上 1 号自己的票, 1 号的方案可通,97 枚金可松落入囊中。
无疑是 1 号能取最大收益的方案了!答案是: 1 号盗分 3 号 1 枚金,分 4 号或 5 号盗 2 枚,自己独得 97 枚。
分配方案可写成( 97,0, 1, 2, 0)或( 97, 0, 1, 0, 2)。
1号看起来最有可能喂,但他牢牢地把握住先,果不但消除了死亡威,收益最大。
而5 号,看起来最安全,没有死亡的威,甚至能坐收人之利,却因不得不看人色行事而只能分得一小杯羹。
在“海盗分金”中,任何“分配者”想自己的方案得通的关是,事先考清楚“挑者”的分配方案是什么,并用最小的代价取最大收益,拉“挑者”分配方案中最不得意的人。
3、旅行者困境两个旅行者从一个以出瓷花瓶著称的地方旅行回来,他都了花瓶。
提取行李的候,花瓶被摔坏了,于是他向航空公司索。
航空公司知道花瓶的价格大概在八九十元的价位浮,但是不知道两位旅客的候的确切价格是多少。
于是,航空公司两位旅客在 100 元以内自己写下花瓶的价格。
如果两人写的一,航空公司将他真,就按照他写的数;如果两人写的不一,航空公司就定写得低的旅客的是真,并且原上按个低的价格,同,航空公司真的旅客励 2 元,假的旅客款 2 元。
了取最大而言,本来甲乙双方最好的策略,就是都写100 元,两人都能100 元。
可是不,甲很明,他想:如果我少写 1 元成 99 元,而乙会写100 元,我将得到101 元。
何而不?所以他准写99 元。
可是乙更明,他算到甲要算他写 99 元,于是他准写98 元。
想不到甲要更明一个次,估到乙要写98 元来坑他,于是他准写97 元⋯⋯大家知道,下象棋的候,不是要多“看”几步,“看”得越远,胜算越大。
你多看两步,我比你更强多看三步,你多看四步,我比你更老谋深算多看五步。
在花瓶索赔的例子中,如果两个人都“彻底理性”,都能看透十几步甚至几十步上百步,那么上面那样“精明比赛”的结果,最后落到每个人都只写一两元的地步。
事实上,在彻底理性的假设之下,这个博弈唯一的纳什均衡。
4、枪手博弈彼此痛恨的甲、乙、丙三个枪手准备决斗。
甲枪法最好,十发八中;乙枪法次之,十发六中;丙枪法最差,十发四中。
如果三人同时开枪,并且每人只发一枪;第一轮枪战后,谁活下来的机会大一些?一般人认为甲的枪法好,活下来的可能性大一些。
但合乎推理的结论是,枪法最糟糕的丙活下来的几率最大。
我们来分析一下各个枪手的策略。
枪手甲一定要对枪手乙先开枪。
因为乙对甲的威胁要比丙对甲的威胁更大,甲应该首先干掉乙,这是甲的最佳策略。
同样的道理,枪手乙的最佳策略是第一枪瞄准甲。
乙一旦将甲干掉,乙和丙进行对决,乙胜算的概率自然大很多。
枪手丙的最佳策略也是先对甲开枪。
乙的枪法毕竟比甲差一些,丙先把甲干掉再与乙进行对决,丙的存活概率还是要高一些。
我们计算一下三个枪手在上述情况下第一轮枪战中的存活几率:甲: 24%(被乙丙合射40% X 60% = 24%)乙: 20%(被甲射100% - 80% = 20% )丙: 100%(无人射丙)第二轮枪战中甲乙丙存活的几率粗算如下:(1) 假设甲丙对决:甲的存活率为60%,丙的存活率为20%。
(2) 假设乙丙对决:乙的存活率为60%,丙的存活率为40%。
第一轮:甲射乙,乙射甲,丙射甲。
甲的活率为 24%( 40% X 60%),乙的活率为 20%(100% - 80%) ,丙的活率为 100%(无人射丙)。
第二轮:情况 1:甲活乙死( 24% X 80% = % )甲射丙,丙射甲──甲的活率为60%,丙的活率为20%。
情况 2:乙活甲死( 20% X 76% = % )乙射丙,丙射乙──乙的活率为60%,丙的活率为40%。
情况 3:甲乙皆活( 24% X 20% = % )重复第一轮。
情况 4:甲乙皆死( 76% X 80% = % )枪战结束。
甲的活率为 %% X 60%) + % X 24%) = %乙的活率为 %% X 60%) + % X 20%) = %丙的活率为 %% X 20%) + % X 40%) + % X 100%) + % X 100%) = %通过对两轮枪战的详细概率计算,我们仍然发现枪法最差的丙存活的几率最大,枪法较好的甲和乙的存活几率仍远低于丙的存活几率。
对于这样的例子,有人会发出“英雄创造历史,庸人繁衍子孙”的感叹。