当前位置:文档之家› MBA必修课程《博弈论》第二部分:穷途困境与纳什均衡

MBA必修课程《博弈论》第二部分:穷途困境与纳什均衡


Page 32
如果其他牧民约束放牧规模,我单独一家人过度放 牧不会破坏广褒的牧场,但自己却获得了高额的收益。 因此,任何一位牧民的结论都会是:无论其他牧民是否 过度放牧,我选择“约束自己的放牧规模”都是劣战略, 从而被剔除。大家最终都会选择过度放牧,结果导致草 地消失,生态破坏。
内蒙古草原的沙漠化
三、囚徒困境详解和延伸
1、囚徒困境详解
Page 17
囚徒乙
S i 称为占优策略,或占优于其他策略 坦白
抵赖
囚徒甲 坦白 -8,-8 0,-10
抵赖 -10,0 -1,-1
占优策略均衡 囚徒甲
坦白 抵赖
囚徒乙
坦白
抵赖
-8,-8
0,-10
-10,0
-1,-1
Page 18
每个参与人组成的优势策略称为占优策略均衡。 甲和乙都不会选择劣战略“抵赖”,称为“剔除劣战略的占优战 略均衡”。其中“坦白”是占优于(优于)“抵赖”的占优战略。
2、囚徒困境特点
Page 19
•利己、理性
•非合作
•存在严格劣策略
囚徒困境假定每个参与者(即“囚徒”)都是利己的, 即都寻求最大自身利益,而不关心另一参与者的利益。
参与者某一策略所得利益,如果在任何情况下都比其他 策略要低的话,此策略称为“严格劣势”,理性的参与者绝 不会选择。另外,没有任何其他力量干预个人决策,参与者 可完全按照自己意愿选择策略。
解决方案
Page 7
这么一直迭代下去,理论上如果所有学生都是 理性人。平均数应当是1。应该说选择了1的学生都 看出了这个博弈的窍门。但是他们的选择不是最接 近平均数的。因为在现实中不可能所有人都是理性 人。
最终12是最接近平均数2/3的数。
案例——囚徒困境
Page 8
两个嫌疑犯甲和乙作案后被警察抓住,分别关在不同的 屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。
这就是我们看到的为什么大多数路、桥等公共设施 都是由政府出资修建的原因。同样的道理,国防、教育、 社会保障,环境卫生等都由政府承担资金投入,私人一 般没有积极性承担这方面服务的积极性和能力。
案例(2)苏格兰的草地消失了
Page 30
在18世纪以前,英国苏格兰地区有大量的草地,其 产权没有界定,属公共资源,大家都可以自由地在那里 放牧。草地属于“可再生资源”,如果草场, 但如果不限制放牧规模,过多的牛羊将草吃得一光二净, 则今后不会再有新草生长出来,草场就会消失。
“囚徒的两难选择”有着广泛而深刻的意义。个人理 性与集体理性的冲突,是对所有人都不利的结局。他们 两人都是在坦白与抵赖策略上首先想到自己,这样他们 必然要服长的刑期。只有当他们都首先替对方着想时, 或者相互合谋(串供)时,才可以得到最短时间的监禁的 结果。
Page 38
“纳什均衡”对亚当·斯密的“看不见的手”的原理 提出挑战。按照斯密的理论,在市场经济中,每一个 人都从利己的目的出发,而最终全社会达到利他的效 果。《国富论》中有这样一句名言:“通过追求(个人 的)自身利益,他常常会比其实际上想做的那样更有效 地促进社会利益”。从“纳什均衡”我们引出了“看 不见的手”的原理的一个悖论:从利己目的出发,结 果损人不利己,既不利己也不利他。两个囚徒的命运 就是如此。
在一个特定的战略组合下参与人得到的确定效用水平, 或是指参与人得到的期望效用水平。
均衡equilibrium:指所有参与人的最优战略的组合。
囚徒甲
坦白 抵赖
囚徒乙
坦白
抵赖
-8,-8
0,-10
-10,0
-1,-1
二、分类
•合作与非合作 •信息、动态
完全信息静态、动态 不完全信息静态、动态
Page 14
不顾及团体利益。“囚徒的困境”问题都是个体理性和 集体理性的矛盾引起的。
以全体利益而言,如果两个参与者都合作保持沉默,两
人都只会被判刑1年,总体利益更高,结果也比两人背叛对
方、判刑8年的情况较佳。
囚徒乙
坦白
抵赖
囚徒甲
坦白 抵赖
-8,-8 -10,0
0,-10 -1,-1
囚徒困境的启示
Page 37
解决方案
Page 5
假设每个人都选择100,平均数100×2/3=66.66。 所以不能选择67-100之间的数(严格劣势策略)。现 实中有两名学生选择了。 剔除了step1中的严格劣势策略后,重复迭代, 66×2/3=44。所以不能选择44-67之间的数(弱劣势 策略)。现实中有四名学生选择了。
3、囚徒困境结论
Page 20
结论1 不要选择严格劣势策略,因为选择优势策略,我们每次
都能得到更好的收益. 结论2
汝欲得之,必先知之。 结论3
站在别人的立场上去分析他们会怎么做。
思考1
Page 21
如果你是个“恶魔饭桶”,你的对手是个“愤怒天使”,这种情 况下我们该怎么办?
博弈论信息整理表格如下
5、如何走出囚徒困境?
Page 35
从以上例子我们可以看出:生活中存在着大量的“囚徒 困境”事例,有很多对我们的生活与合作不利。那么怎样才 能有效避免囚徒困境的出现,从而改善我们的生活呢?
囚徒困境延伸——合作:团体理性
Page 36
若要不是经济学,理性的选择,反而是选择优势策略
(次优的结果),即帕累托效率。
Page 31
由于草地的产权没有界定,政府也没有对放牧作出 规模限制,每家牧民都会如此盘算:如果其他牧民不约 束自己的放牧规模,让自己的牛羊过多地到草地上吃草, 那么,我自己一家约束自己的放牧规模规模对保护草场 的贡献是微乎其微的,不会使草场免于破坏;相反,我 也加入过度放牧的行列,至少在草场消失之前还会获得 一部分短期的收益。
如果其他国家拥有这个鱼群,假设这个鱼群在大西洋,如果其 他国家打算正常捕捞,你应该也会正常捕捞。如果其他国家不打算 减少捕捞量,那么你现在就想把鱼捞出来,因为没准明天就会没鱼 可捞了。
思考5
Page 26
全球变暖和碳排放问题 大家能理解碳排放也是一种囚徒困境吗?
4、囚徒困境案例
Page 27
(1)政府要负责修建公共设施
恶魔饭桶
α
β
愤怒天使 α 0,0 -1,1
β 3,-3 1,1
21
Page 22
大揭秘
正确答案选 ,因为 是优势策略, 是
劣势策略。
22
思考2 市场进入阻挠(静态)
Page 23
在位者
默许
斗争
进入 进入者
不进入
40,50 0,300
-10,0 0,300
思考3
Page 24
价格竞争
两家互相打价格战的企业,可能会陷入囚徒困 境。为什么?
设想有两户相居为邻的农家,十分需要有一 条好路从居住地通往公路。修一条路的成本为4, 每个农家从修好的好路上获得的好处为3。如果 两户居民共同出资联合修路,并平均分摊修路成 本 , 则 每 户 居 民 获 得 净 的 好 处 ( 支 付 ) 为 34/2=1;当只有一户人家单独出资修路时,修路 的居民获得的支付为3-4=-1(亏损)
Page 12
参与人在给定信息集的情况下的行动规则,它规定参与 人在什么时候选择什么行动。
战略与行动:战略是行动的规则而不是行动本身。 在静态博弈中,战略和行动是相同的。 战略必须是完备的,要给出参与人在每一种可想象得到 的情况下的行动选择。
5、支付payoff(效用utility)
Page 13
Page 11
参与人有关博弈的知识,特别是有关自然的选择,其他 参与人的特征和行动的知识。
表中每一个小方格内的数字被称为局中人的支付,其中 左边的数字代表甲的支付,右边的是乙的支付。表1中的双变 量矩阵称为博弈支付矩阵。 囚徒乙
坦白
抵赖
囚徒甲
坦白 抵赖
-8,-8 -10,0
0,-10 -1,-1
4、战略strategies
警察将两人分别置于两间房间分开审讯:如果两人都抵 赖,各判刑一年;如果两人都坦白,各判八年;如果两人中 一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。
如何选择?
一、博弈的要素
Page 9
1、参与人 players
一个博弈中的决策主体,他的目的是通过选择行动 (或战略)以最大化自己的支付(效用水平)。参与人可能 是自然人,也可能是团体,如企业,国家等。囚徒困境中甲 和乙是参与博弈的人,称为“局中人”。
信息和动态分类
Page 16
完全 信息
静态
完全信息静态博弈; 纳什均衡; Nash(1950)
动态
完全信息动态博弈; 子博弈精炼纳什均衡;泽尔腾 (1965)
不完全 信息
不完全信息静态博弈;贝叶斯纳 什均衡; 海萨尼(1967-1968)
不完全信息动态博弈, 精炼贝叶斯纳什均衡; 泽尔腾(1975) Kreps,Wilson(1982), Fudenberg,Tirole(1991)
MBA必修课
Page 1
博弈论
(Game Theory)
目录
第Ⅰ部分 博弈论导论 案例 诺贝尔经济学奖与博弈论
第Ⅱ部分 博弈论与纳什均衡 基本概念(策略、局中人)与 分类 囚徒困境及延伸(合作博弈、口头承诺) 智猪博弈及延伸 纳什均衡、零和博弈
第Ⅲ部分 博弈论与其他三类博弈 第Ⅳ部分 博弈论与信息(与机制设计)
非合作与合作
Page 15
博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈 理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束 力的协议。倘若不能,则称非合作博弈Non-Cooperative Game。
Collective Rationality, 是效率、公平、公正。
相关主题