第三章经济博弈论
1
不接受,出S
[S2, (10000 S2 )]
[ 2S, 2 (10000 S)]
甲第一阶段出价
S1 10000 10000 2S
乙方接受,其得益为:
10000 2S
当0.5 1时,越大,
甲的得益越大,乙的得益越小
当0 0.5时,越大,
的选择W*,满足:
max u W, L(W*)
与厂商的反应函数相切的那条无差
异曲线对应的效用,就是工会能实 现的最大效用,W*是工会实现最大 W
效用必须选择的工资率,L*(W*)
是厂商对工会的W*最佳反应。
W*
这个博弈的均衡解[W*,L*(W*)]
就是一个子博弈完美纳什均衡
0
maxu[W , L*(W )]
S1 10000 10000 2S
S S1 10000 10000 2S
S* 10000
1
10000 S* 10000 1
例:讨价还价博弈
• 两个兄弟分一块冰激凌。哥哥先提出一个分割比 例,弟弟可以接受或拒绝,接受则按哥哥的提议 分割,若拒绝就自己提出一个比例。但这时候冰 激凌己化得只剩I/2了。对弟弟提议的比例哥哥也 可以选择接受或拒绝,若接受则按弟弟的提议分 割,若拒绝冰激凌会全部化光。因为兄弟之间不 应该做损人不利己的事,因此我们假设接受和拒 绝利益相同时兄弟俩都会接受。求该博弈的子博 弈完美纳什均衡。如果冰激凌每阶段只化掉1/3, 博奔的子博弈完美纳什均衡是什么?
逆推归纳法:第一步,先分析第二阶段厂商的选择
要求厂商对工会选择的工资率W的反应函数L(W)
厂商得益函数: =(W, L)=R(L) W L
(’W, L)=R(’L) W=0
3.4.2 劳资博弈
逆推归纳法:第一步,先分析第二阶段厂商的选择 要求厂商对工会选择的工资率W的反应函数L(W)
• 再比如,在外交中,美国经常向中国承诺只承认一 个中国的原则,我国政府向国际社会承诺中国强大 也决不会采用霸权政策。大家常见的很多耳熟目详 的俗语都是承诺与威胁,比如“人不犯我,我不犯 人”、“坦白从宽,抗拒从严”、“以眼还眼,以 牙还牙”等。
借
3.2.2 纳什均衡的问题 甲
分
根据纳什均衡的定义可以判断,乙 (2,2)
厂商得益函数: =(W, L)=R(L) W L
(’W, L)=R(’L) W=0
max (W , L) max[R(L) WL]
L0
L0
R
R(L) 斜率为W
WL
0
L* (W )
L
厂商的反应函数
3.4.2 劳资博弈
逆推归纳法:第二步,再分析第一阶段工会的选择
工会知道:厂商会根据自己选择的工资率W选择雇佣工人数量L(W*),工会
的策略是第一阶段选择“借”,若第
打
乙 不借
(1,0) 不分
乙 不打
二阶段甲选择“不分”,第三阶段选 择“打”, 甲的策略是第二阶段选择
(-1,0) (0,4)
“分”。
法律保障不足 的开金矿博弈
实际结果是:乙在第一阶段不会选择 “借”,甲在第二阶段也不会选择 “分”,乙在第三阶段也不会选择 “打”。 •是不纳排结可什除果信均博相的衡弈反威在方的胁动策原。态略因博中是弈所第可包三能含阶缺的段乏不的稳可“定信打性的”的行为根设源定在,于不它能不解能
经济博弈论
第三章 完全且完美信息动态博弈
• 动态博弈的表示法和特点 • 可信性和纳什均衡的问题 • 子博弈和子博弈完美纳什均衡 • 几个经典动态博弈模型 • 有同时选择的动态博弈模型 • 动态博弈分析的问题和扩展讨论
3.1 动态博弈的表示法和特点
3.1.1 阶段和扩展性表示
• 阶段:动态博弈中一个博弈方的一次选择行为 • 仿冒和反仿冒博弈
最后结果是:
甲 分
(2,2) 打
(1,0) 不分 乙
不打
乙的完整策略是第一阶段选择 “借”,若第二阶段甲选择“不分”, 第三阶段选择“打”
甲的完整策略是第二阶段选择“分”
(1,0)
(0,4)
有法律保障的 开金矿博弈
3.2 可信性和纳什均衡的问题 3.2.1 相机选择和策略中的可信性问题
法律制度必须满足两方面的要求:一是
决动态博弈的相机选择引起的可信性问题
3.2.3 逆推归纳法
• 定义:从动态博弈的最后一个阶 段博弈方的行为开始分析,逐步 倒推回前一个阶段相应博弈方的 行为选择,一直到第一个阶段的 分 分析方法
乙
借
不借
甲
不分 (1,0)
(2,2)
(0,4)
由于逆推归纳法确定的各个博弈方在各阶段的选择,都是 建立在后阶段各个博弈方理性选择的基础上,因此自然排除了 不可信的威胁和承诺的可能性,因此它得出的结论是比较可靠 的,确定的各个博弈方的策略组合具有稳定性。
6q1
q1(3
q1 2
)
q12
3q1
1 2
q12
u1
q1
3.4 几个经典动态博弈模型
3.4.1 寡占的斯塔克博格模型
厂商1 厂商2
产量 3单位 1.5单位
求得:
得益 4.5 2.25
q1* 3 q2* 1.5
比较:
古诺模型
厂商1 2单位
4
厂商2 2单位
4
比较说明:两厂商地位不对称。 厂商1具有先行优势,得到较多的 利益。同时也说明信息较多并不 一定能得到较多的利益
仿冒 A 不仿冒
阶段的行为,而是各博弈方在整个博弈中轮 到选择的每个阶段,针对前面的阶段的各种
(-2,5) B 制止
不制止(5,5)
情况作相应的选择和行为的完整计划,以及 (2,2) (10,4) 由不同博弈方的这种计划构成的组合,这种
计划称作动态博弈中博弈方的“策略”。
例如,在仿冒和反仿冒博弈中,仿冒企业A:在第一阶段仿冒, 如果第二阶段B制止,第三阶段就不仿冒,否则第三阶段继续 仿冒。仿冒企业B:在第一阶段A仿冒时第二阶段不制止,第三 阶段A继续仿冒时,第四阶段制止。
逆推归纳法
第二阶段:厂商2决策 在决策时,厂商1选择的产量q1已经确定了,厂商2知道这一点,因此 对厂商2来讲,相当于在给定q1的情况下,求使u2最大值的q2。
q2
1 2
6
q1
3
q1 2
第一阶段:厂商1决策
厂商1知道厂商2的这种决策思路,于是厂商1的得益函数转化为
u1 q1, q2*
3.4 几个经典动态博弈模型
3.4.1 寡占的斯塔克博格模型
Q q1 q2 , P P(Q) 8 Q
c1 c2 2
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1 6q1 q1q2 q12
u2 q2P(Q) c2q2 q2[8 (q1 q2 )] 2q2 6q2 q1q2 q22
(S1,10000 S1) 接受
1 不接受,出S
[S2, (10000 S2 )]
[ 2S, 2 (10000 S)]
第三回合、甲的方案是自己得 S=10000
第二回合,乙出价S2满足: 甲:S2 2S 即S2 S
乙:(10000 -S2) (10000 -S) =10000 - 2S 10000 2 2S
W 0
L*(W ) L*(W *)
u3 u2 u1 u0
L
工会的无差异曲线
3.4.3 讨价还价博弈
• 讨价还价博弈:假设两人就如何分配1万元现金进行谈判,规 则是这样ห้องสมุดไป่ตู้首先由甲提出一个分割比例,对甲提出的比例 乙可以接受也可以不接受;如果乙不接受则他应提出另一 个方案,让甲选择接受与否……
三阶段讨价还价博弈,即第三回合甲的方案具有强制约束力
动态博弈的结果首先是指策略组合,其次是指博弈的路径, 最后是各博弈方的得益。
3.1.2 动态博弈的基本特点
动态博弈的非对称性
动态博弈的非对称性是指各博弈方的地位是不对称的。 由于后行为的博弈方有更多的信息帮助他选择行为,可 减少决策的盲目性针对性地选择,处于有利地位。 不过,信息较多的博弈方并不一定能得到更大的利益。
1
出S1
接受
2 不接受,出S2
(S1,10000 S1) 接受
1 不接受,出S
关键:
1.第三回合甲的方案有强制力; 2.消耗系数的存在,谈判时间 越长对双方都不利。
[S2, (10000 S2)] [ 2S, 2(10000 S)]
三回合讨价还价
1
出S1
接受
2 不接受,出S2
甲的得益越小,乙的得益越大
二、无限回合讨价还价
解题思路:对一个无限回合博弈来讲,从第三回合开始,还是 从第一回合开始,结果都应该是一样的。
假如从第一回合开始,甲出价S,乙接受,双方得益分别为S, 10000-S 假如从第三回合开始,甲出价S,乙接受,双方得益分别为S, 10000-S 如果把上述第三回合理解成从第一回合开始的无限回合博弈的第三回合, 那么,由于第三回合的出价是最终出价,因此该博弈相当于前面的三回 合讨价还价博弈。
3.4 几个经典动态博弈模型
3.4.1 寡占的斯塔克博格模型 3.4.2 劳资博弈 3.4.3 讨价还价博弈 3.4.4 委托人—代理人理论
3.4.1 寡占的斯塔克博格模型
该博弈假设寡头市场上有两个厂商,与古诺模型一样,决策 内容也是产量。不同的是一方较强一方较弱,较强的一方先 选择产量,较弱的一方则根据较强的一方的产量选择自己的 产量。