当前位置:文档之家› 第二讲(占优均衡、纳什均衡)

第二讲(占优均衡、纳什均衡)


买方
周周周周周周 一二三四五六
卖 周 3, -1, -1, -1, -1, -1, 方 一 3 -1 -1 -1 -1 -1
周 -1, 3, -1, -1, -1, -1, 二 -1 3 -1 -1 -1 -1
周 -1, -1, 3, -1, -1, -1, 三 -1 -1 3 -1 -1 -1
周 -1, -1, -1, 3, -1, -1. 四 -1 -1 -1 3 -1 -1
– 假设赢得收益是1,而输的收益是-1,平局的收益是各 为0。
A 石头 剪刀 布 B 石头 0, 0 1, -1 -1, 1 剪刀 -1, 1 0, 0 1,-1 布 1,-1 -1, 1 0, 0
零和博弈和非零和博弈
• 零和博弈 (zero-sum game):
– 是一种完全对抗,强烈竞争 的对局。
– 参与者的收益总和是零(或 是某个常数-常数和博弈 constant-sum game),也 就意味着一个参与者的所得 既是另一个参与者所失去的。
– 案例:狐狸和狼
狼 相信 狐狸
不相 信狐 狸
• 画出该博弈的收益矩阵。
狐狸 欺骗 不欺 狼 骗狼 -100, 0, 100 -100
0, 0, -100 -100
第二讲 占优均衡、纳什均衡
占优战略
• 占优战略 (dominant strategy):
– 无论其他博弈者采用何种战略,该博弈者的战略总是 最好。
案例:垃圾处理博弈 甲先生和乙先生是邻居,他们 的房子格局如右图。他们可以 选择把垃圾倾倒在离自己房子 较远的一块属于自己的空地 上,但如此倾倒垃圾会影响到 邻居。他们也可以共同雇佣一 辆卡车处理垃圾,但每人需支 付¥500。 他们会如何做出决策呢?
• 纳什均衡 (Nash equilibrium):
– 是全部参与者所选战略的一个组合,在这个战略组合 中,每个人的战略都是针对其他人战略的最优反映。
– 纳什战略也是非合作均衡。 – 占优均衡属于纳什均衡,而纳什均衡不属于占优均衡。 – 请寻找一下教科书博弈中的纳什均衡。
• 案例:选择电台节目
纳什均衡
协调博弈 (Coordination game)
• 在协调博弈中,只有协调 彼此的战略选择,参与者 才能得到最优的收益。
– 推与不推博弈就是一个协调 博弈。
• 案例:赶集日博弈
– 如果买方和卖方同一天去集 市,交易成功,他们双方都 可获利。但如果不在同一天 去,则交易没法进行,且还 要支付交通费用。
可能出现负和或正和的结果?
非零和博弈
• 在市场经济下,要想获得利益就要跟别人合作,才能使双 方都获得好处。
• 只要是双方同意的任何一个买卖,买方和卖方都会获得利 益。
• 事实上,那些看似零和或者负和的问题如果转换一下视 角,也可能转变为正和博弈。
3 PDF 文件使用 "pdfFactory Pro" 试用版本创建
• 因此纳什均衡具有“非唯一性”。
– 事实上,一方只有在明确知道另一方选择的情况下才能做出自己 的选择,因此当面临同时选择时,就可能产生了问题。结果到底 是哪个纳什均衡呢?
– 假设库克多年来成功的播放了摇滚乐节目,那么维德就有理由相 信库克会继续选择摇滚乐而采用乡村音乐的节目形式。
• 从历史中得到线索,进而判断出各个均衡发生的概率。把 这种以线索为基础选择的均衡称为“谢林点”(Schelling point)或“焦点”。
– 该博弈有无占优战略和占优均衡?
K教授
教科书博弈收益矩阵 H教授
400页 600页 800页 400页 45,45 15,50 10,40 600页 50,15 40,40 15,45 800页 40,10 45,15 35,35
纳什均衡
• 在教科书博弈中,没有占优战略,而只有针对对 方战略的最优反映。当对方改变战略后,另一方 的战略也需要相应的改变,否则就会处于劣势。
垃圾处理博弈收益矩阵
甲先生
倾倒
雇卡车
乙先生 倾倒 4000, 4000 5000, 3500 雇卡车 3500,5000 4500,4500
• 在该博弈中,对于甲先生和乙先生,他们最优的战略就是“倾倒垃 圾”,因此即为他们的占优战略。
• 劣战略:如果第二个战略被第一个战略占优,那么第二个战略被 称为劣战略。显然,雇卡车是该博弈的劣战略。
– 在特定情况下,管理和传统能够提供多纳什均 衡博弈的解。
– 协调博弈中的纳什均衡可以解释为什么习俗和 惯例看似很随意, 实际却很稳定,因为他们都 是纳什均衡,能够自我强化。
不存在纳什均衡的博弈
• “石头,剪刀,布”是一个猜拳游戏。 • 假定该博弈为非合作均衡,参与者都想获胜,那
么其存在占优均衡吗?纳什均衡? • 画出该博弈的收益矩阵。
乡村 40,50 20,20 40,10
目,只有10%。如果两个
音乐
电台同时选择一种节目形
谈话 10,80 10,40 5,5
式,它们将平分听众。
节目
• 该博弈中,有无占优战略 和占优均衡?纳什均衡?
纳什均衡 – 谢林点
• 在选择电台节目博弈中存在两个纳什均衡。 – 维德-摇滚乐和库克-乡村音乐,或者维德-乡村音乐和 库克-摇滚乐。
非合作和合作均衡
• 然而对于契约,往往 每个参与者都有强大 的动机去欺骗协议转 向非合作性均衡。
– 这是为什么呢?
– 在双寡头博弈中,无 论是A寡头还是B寡头 都可以通过违约获取 更多的收益“40”。
B 寡 联合并 头 限制生

竞争
A寡头 联合并 限制生
产 A 30 B 30
A 10 B 40
竞争
非合作和合作均衡
• 对抗博弈 (rivalry game):
– 又称“非合作性均衡” (non-cooperative equilibrium) 。 – 每一方选择战略时都没有共谋,他们只是选择对自身
最有利的战略。(虽然合谋的共同利益将达到最大。) – 占优均衡是一种非合作解。 – 如果两者进行合作,则会出现“合作性均衡”
• 该博弈的纳什均衡是什么? (推推,与推不)推和博(弈不收推益,矩不阵推)
吉姆
• 该博弈的谢林点是哪个?你
推 不推
是如何判断的? 收风益险最占大优这个特卡尔征似乎推能够使5使(,5(不推-,10推不,0 )
均推衡)称为该谢博林弈点的,谢因林为不点这推个。0均,衡-1规0 避1了,1
最大的损失。
2 PDF 文件使用 "pdfFactory Pro" 试用版本创建
非零和博弈
• 非零和博弈:
– 既有对抗,又有合作。参与者的目标不完全对立。
• 非常数和博弈 (non-constant-sum game):
– 总收益取决于参与者所选择的战略。 – 其结局的收益总和是可变的。 – 负和博弈 – 两败俱伤的结果。 – 正和博弈 – 双赢的结果。 – 请你思考一下在狐狸和狼的博弈中,采用怎样的战略
(cooperative equilibrium)。
• 合约为解决社会两难问题提供了一个出路。
– E.g.垃圾处理博弈中共同雇佣卡车就是一个合作解,双 方可以通过签订合约规定必须履行雇卡车的义务。
– 在很多非合作的场合,法规也能达到同样的目的。
非合作和合作均衡
• 案例:双寡头市场。
– 市场上有两个寡头企业。他们可以组成企业联合并限 制生产以抬高产品市场价格。或者他们可以竞争。右 表显示了这两个企业的各种可能的收益。
周 -1, -1, -1, -1. 3, 1, 五 -1 -1 -1 -1 3 -1
周 -1, -1, -1, -1, -1, 3, 六 -1 -1 -1 -1 -1 3
协调博弈
• 赶集日博弈的逻辑推理并没有给出谢林点。 • 提供谢林点的可能是城镇的习俗。该城镇
可能总是周二举行集市。 • 由此可见:
A 40 B 10 A 15 B 15
存在两个以上战略的博弈
• 教科书博弈:
– H和K两位教授都在编写经济教科书。两本书质量相同,但篇 幅长短不同。一般情况下,如果质量一样,教师会选择篇幅 长一点的教科书。当然,每个人都想获得更多的读者,但增 加篇幅需要付出更多的努力。两位作者不想写得太长,只要 能战胜对方就可以了。
• 请问这两家渔民有没有占 优战略和占优均衡?
• 该博弈可以给我们什么启 示?
渔民B
限制捕 尽全力 鱼量 捕鱼
渔 限制捕 民 鱼量
A 尽全力 捕鱼
A 20 B 20 A 30 B2
A2 B 30 A4 B4
社会两难:是一种存在占优均衡的博弈,但是参与者采用这 种均衡战略的收益比采用非均衡战略的收益要差。
• 有两家电台 – 维德和库克。 选择电台节目博弈收益矩阵
它们可以在三种节目形式 中选择:摇滚乐,乡村音 乐和谈话节目。收益用它
们所获得听众的百分比表 示。听众中有70%喜欢的 是摇滚乐;其次是乡村音
维德
摇滚乐 乡村 谈话 音乐 节目
库 摇滚 35,35 50,40 80,10 克乐
乐,有40%;然后谈话节
纳什均衡 – 收益占优均衡
• 案例:推与不推博弈
– 吉姆和卡尔开车驶在同一条路上,有棵大树挡住了道路。 两人可以选择都去推树,树会被成功的挪走(每人收益 5)。如果一人推,一人不推,则推的人会受伤(收益 是-10),另一个人要需要将伤者送到医院(收益是0)。 如果两人都不推,就必须掉头驶回(两人收益都为1)。
– 请问这两家寡头企业有没有占优战略和占优均衡? – 该博弈的合作解是什么? – 两家企业达成了协议进行联合。 – 这对社会效率会有怎样的影响? – 寡头联合形成垄断(托拉斯),并降低社会效率。在
完全竞争的状态下,非合作性均衡造成了社会的最大 效率。
相关主题