当前位置：文档之家› MBA必修课程《博弈论》第二部分：穷途困境与纳什均衡

MBA必修课程《博弈论》第二部分：穷途困境与纳什均衡

Page 32
如果其他牧民约束放牧规模，我单独一家人过度放牧不会破坏广褒的牧场，但自己却获得了高额的收益。因此，任何一位牧民的结论都会是：无论其他牧民是否过度放牧，我选择“约束自己的放牧规模”都是劣战略，从而被剔除。大家最终都会选择过度放牧，结果导致草地消失，生态破坏。
内蒙古草原的沙漠化
三、囚徒困境详解和延伸
1、囚徒困境详解
Page 17
囚徒乙
S i 称为占优策略，或占优于其他策略坦白
抵赖
囚徒甲坦白 -8，-8 0，-10
抵赖 -10，0 -1，-1
占优策略均衡囚徒甲
坦白抵赖
囚徒乙
坦白
抵赖
-8，-8
0，-10
-10，0
-1，-1
Page 18
每个参与人组成的优势策略称为占优策略均衡。甲和乙都不会选择劣战略“抵赖”，称为“剔除劣战略的占优战略均衡”。其中“坦白”是占优于(优于)“抵赖”的占优战略。
2、囚徒困境特点
Page 19
•利己、理性
•非合作
•存在严格劣策略
囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。
参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。
解决方案
Page 7
这么一直迭代下去，理论上如果所有学生都是理性人。平均数应当是1。应该说选择了1的学生都看出了这个博弈的窍门。但是他们的选择不是最接近平均数的。因为在现实中不可能所有人都是理性人。
最终12是最接近平均数2/3的数。
案例——囚徒困境
Page 8
两个嫌疑犯甲和乙作案后被警察抓住，分别关在不同的屋子里接受审讯。警察知道两人有罪，但缺乏足够的证据。
这就是我们看到的为什么大多数路、桥等公共设施都是由政府出资修建的原因。同样的道理，国防、教育、社会保障，环境卫生等都由政府承担资金投入，私人一般没有积极性承担这方面服务的积极性和能力。
案例（2）苏格兰的草地消失了
Page 30
在18世纪以前，英国苏格兰地区有大量的草地，其产权没有界定，属公共资源，大家都可以自由地在那里放牧。草地属于“可再生资源”，如果草场，但如果不限制放牧规模，过多的牛羊将草吃得一光二净，则今后不会再有新草生长出来，草场就会消失。
“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突，是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己，这样他们必然要服长的刑期。只有当他们都首先替对方着想时，或者相互合谋(串供)时，才可以得到最短时间的监禁的结果。
Page 38
“纳什均衡”对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果。《国富论》中有这样一句名言：“通过追求(个人的)自身利益，他常常会比其实际上想做的那样更有效地促进社会利益”。从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论：从利己目的出发，结果损人不利己，既不利己也不利他。两个囚徒的命运就是如此。
在一个特定的战略组合下参与人得到的确定效用水平，或是指参与人得到的期望效用水平。
均衡equilibrium:指所有参与人的最优战略的组合。
囚徒甲
坦白抵赖
囚徒乙
坦白
抵赖
-8，-8
0，-10
-10，0
-1，-1
二、分类
•合作与非合作 •信息、动态
完全信息静态、动态不完全信息静态、动态
Page 14
不顾及团体利益。“囚徒的困境”问题都是个体理性和集体理性的矛盾引起的。
以全体利益而言，如果两个参与者都合作保持沉默，两
人都只会被判刑1年，总体利益更高，结果也比两人背叛对
方、判刑8年的情况较佳。
囚徒乙
坦白
抵赖
囚徒甲
坦白抵赖
-8，-8 -10，0
0，-10 -1，-1
囚徒困境的启示
Page 37
解决方案
Page 5
假设每个人都选择100，平均数100×2/3＝66.66。所以不能选择67-100之间的数（严格劣势策略）。现实中有两名学生选择了。剔除了step1中的严格劣势策略后，重复迭代， 66×2/3＝44。所以不能选择44-67之间的数（弱劣势策略）。现实中有四名学生选择了。
3、囚徒困境结论
Page 20
结论1 不要选择严格劣势策略，因为选择优势策略，我们每次
都能得到更好的收益. 结论2
汝欲得之，必先知之。结论3
站在别人的立场上去分析他们会怎么做。
思考1
Page 21
如果你是个“恶魔饭桶”，你的对手是个“愤怒天使”，这种情况下我们该怎么办？
博弈论信息整理表格如下
5、如何走出囚徒困境？
Page 35
从以上例子我们可以看出：生活中存在着大量的“囚徒困境”事例，有很多对我们的生活与合作不利。那么怎样才能有效避免囚徒困境的出现，从而改善我们的生活呢？
囚徒困境延伸——合作：团体理性
Page 36
若要不是经济学，理性的选择，反而是选择优势策略
（次优的结果），即帕累托效率。
Page 31
由于草地的产权没有界定，政府也没有对放牧作出规模限制，每家牧民都会如此盘算：如果其他牧民不约束自己的放牧规模，让自己的牛羊过多地到草地上吃草，那么，我自己一家约束自己的放牧规模规模对保护草场的贡献是微乎其微的，不会使草场免于破坏；相反，我也加入过度放牧的行列，至少在草场消失之前还会获得一部分短期的收益。
如果其他国家拥有这个鱼群，假设这个鱼群在大西洋，如果其他国家打算正常捕捞，你应该也会正常捕捞。如果其他国家不打算减少捕捞量，那么你现在就想把鱼捞出来，因为没准明天就会没鱼可捞了。
思考5
Page 26
全球变暖和碳排放问题大家能理解碳排放也是一种囚徒困境吗？
4、囚徒困境案例
Page 27
（1）政府要负责修建公共设施
恶魔饭桶
α
β
愤怒天使 α 0，0 -1，1
β 3,-3 1，1
21
Page 22
大揭秘
正确答案选，因为是优势策略，是
劣势策略。
22
思考2 市场进入阻挠（静态）
Page 23
在位者
默许
斗争
进入进入者
不进入
40,50 0,300
-10,0 0,300
思考3
Page 24
价格竞争
两家互相打价格战的企业，可能会陷入囚徒困境。为什么？
设想有两户相居为邻的农家，十分需要有一条好路从居住地通往公路。修一条路的成本为4，每个农家从修好的好路上获得的好处为3。如果两户居民共同出资联合修路，并平均分摊修路成本，则每户居民获得净的好处（支付）为 34/2=1；当只有一户人家单独出资修路时，修路的居民获得的支付为3-4=-1（亏损）
Page 12
参与人在给定信息集的情况下的行动规则，它规定参与人在什么时候选择什么行动。
战略与行动：战略是行动的规则而不是行动本身。在静态博弈中，战略和行动是相同的。战略必须是完备的，要给出参与人在每一种可想象得到的情况下的行动选择。
5、支付payoff（效用utility）
Page 13
Page 11
参与人有关博弈的知识，特别是有关自然的选择，其他参与人的特征和行动的知识。
表中每一个小方格内的数字被称为局中人的支付，其中左边的数字代表甲的支付，右边的是乙的支付。表1中的双变量矩阵称为博弈支付矩阵。囚徒乙
坦白
抵赖
囚徒甲
坦白抵赖
-8，-8 -10，0
0，-10 -1，-1
4、战略strategies
警察将两人分别置于两间房间分开审讯：如果两人都抵赖，各判刑一年；如果两人都坦白，各判八年；如果两人中一个坦白而另一个抵赖，坦白的放出去，抵赖的判十年。
如何选择？
一、博弈的要素
Page 9
1、参与人 players
一个博弈中的决策主体，他的目的是通过选择行动（或战略）以最大化自己的支付（效用水平）。参与人可能是自然人，也可能是团体，如企业，国家等。囚徒困境中甲和乙是参与博弈的人，称为“局中人”。
信息和动态分类
Page 16
完全信息
静态
完全信息静态博弈；纳什均衡； Nash(1950)
动态
完全信息动态博弈；子博弈精炼纳什均衡；泽尔腾（1965）
不完全信息
不完全信息静态博弈；贝叶斯纳什均衡；海萨尼（1967-1968）
不完全信息动态博弈，精炼贝叶斯纳什均衡；泽尔腾（1975） Kreps,Wilson(1982), Fudenberg,Tirole(1991)
MBA必修课
Page 1
博弈论
(Game Theory)
目录
第Ⅰ部分博弈论导论案例诺贝尔经济学奖与博弈论
第Ⅱ部分博弈论与纳什均衡基本概念（策略、局中人）与分类囚徒困境及延伸（合作博弈、口头承诺）智猪博弈及延伸纳什均衡、零和博弈
第Ⅲ部分博弈论与其他三类博弈第Ⅳ部分博弈论与信息（与机制设计）
非合作与合作
Page 15
博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议。倘若不能，则称非合作博弈Non-Cooperative Game。
Collective Rationality，是效率、公平、公正。

e商务文档

MBA必修课程《博弈论》第二部分：穷途困境与纳什均衡

相关文档推荐：