动态博弈
“战术勾结”
寡头之间的“不回避竞争法则”,是指至 少有几个寡头厂商保证(通常以做广告的 方式)自己的索价不高于其他任何竞争者。 这样的许诺对于消费者来说似乎是件很好 的事,但事实上这样的做法会提高价格。
寡占的斯塔克博格(stackberg)模型—— 动态的寡头市场产量博弈模型
u1=q1P(Q)-c1q1 =q1[8-(q1+q2)]-2q1 =6q1- q1q2-q12
最后,实施上述策略组合的最终结果,即 路径终端处得益数组中的数字。
可信性和纳什均衡问题
相机选择和策略中的可信性问题 动态博弈中博弈方的策略并没有强制力,
而且实施起来有一个过程,只要符合博弈 方自己的利益,他们完全可以在博弈过程 中改变计划。我们称这种问题为动态博弈 中的“相机选择”(Contingent Play)。
逆推归纳法(backwards induction)
逻辑基础:动态博弈中先行动的理性的博弈方, 在前面阶段选择行为时必然会考虑后行为博弈 方在后面阶段中将会怎样选择行动,只有在博 弈的最后一个阶段不再有后续阶段牵制的博弈 方,才能做出明确的选择。而当后面阶段博弈 方的选择确定以后,前一阶段博弈方的行为也 就容易确定了。
q2应满足: 6-q1-2 q2 = 0 q2 =3-q1/2
厂商1 知道厂商2的这种决策思路,因此在选择产量水平 q直1时接就将知上道式厂代商入2自的己产的量得q2益*会函根数据,上这式样确厂定商,1的所得以益他函可数以 实际上转化成了他自己产量的一元函数:
u1(q1,q2*) = 6q1-q1q2*-q12 = 6q1-q1(3-q1/2)-q12 = 3q1-0.5q12
乙讨价还价的筹码就是可以跟甲托时间
(当然拖延对乙的收益也有影响),拖延
时间对甲造成的损失越大,甲愿意分给乙
以求早日结束讨价还价的利益越大,只有 当甲完全不怕旷日持久的谈判(δ=1),或 乙的争夺是毁灭性的(δ=0)时,居于有利 地位的甲方才不需要花钱买太平,可以保 证自己的全部利益。
练习:
考虑以下双寡头策略投资模型:企业1 和企业2 当前的平均成本都是2。企业1可以装备一种新 的技术,从而使其平均成本降低到1。装备这一 技术需要花费f。企业2可以观察到企业1是否投 资于这一新技术。一旦企业1对新技术的投资行 为被观察后,两个企业如同在古诺竞争模型中 一样,同时选择自己的产量水平q1和q2。因此, 这是一个两阶段的博弈。假设市场需求函数为 P(Q)=14-Q,其中P是市场价格,Q是市场总产量, Q1会=q选1+择q2。引问进上新述技投术资?额f处于什么水平时,企业
完善的法律制度不但能保障社会的公平, 而且还能提高社会经济活动的效率,是实 现最有效率社会分工的重要保障。
当然,要充分保障社会公平和经济活动的 效率,法律制度必须对人们正当权益的保 护力度足够大,对侵害他人利益者有足够 的震慑作用。
借 乙 不借
分 甲 不分
(1,0)
(2,2)
乙
打
不打
(-1,0)
例如下象棋是动态博弈,但它不仅博弈阶段很多, 而且每各阶段的可能选择也很多,因此很难用扩展 形表示。
无法用扩展形表示的动态博弈,通常可以直接 用文字描述和数学函数式表示。
动态博弈的策略和结果
动态博弈的结果首先是指各博弈方上述类 型的策略构成的策略组合;
其次,动态博弈的结果是各博弈方的策略 组合形成的一条连接各个阶段的“路径” (PATH);
三个厂商的利润函数为:
U1=(100-q1-q2-q3)q1-2q1 U2=(100-q1-q2-q3)q2-2q2 U3=(100-q1-q2-q3)q3-2q3 根据逆推归纳法,先分析第二阶段厂商3的选择 厂商3 的反应函数为:
100-q1-q2--2q3-2=0 q3=(98-q1-q2)/2
利,如果必须让对方得的数额不如早点让其得到, 这对自己是有利的。
甲 1 出 S1
接受 (S1 ,10000-S1)
乙 不接受,出 S2
接受
甲
[δS2 ,δ(10000-S2)]
不接受,出 S
[δ2S,δ2(10000-S)]
第三回合:甲的出价S乙必须接受,因此甲的出 价会选择S=10000。为了容纳更多的可能性,仍 然保留S作为甲在该回合的出价。因此,如果博 弈进行到第三回合,双方的得益分别为δ2S和 δ2(10000-S)。
10000-S1 = 10000δ-δ2S
此时乙的得益于进行到第二回合的利益相同, 甲的得益10000-10000δ+δ2S则比进行到第二、 第三回合的得益δ2S大。因此甲在一第回合出价 S1 = 10000-10000δ+δ2S,乙方接受,甲、乙 双方得益各为10000-10000δ+δ2S和10000δ- δ2S,是这个博弈的子博弈精炼纳什均衡。
乙 不接受,出 S2 接受 甲
不接受,出 S
[δS2 ,δ(10000-S2)]
[δ2S,δ2(10000-S)]
本博弈的关键有两点:1、第三回合甲的方案有强 制力,即进行到该回合甲提出的分割比例S/10000 -S,乙必须接受,并且这一点两博弈方都是清楚 的。2、该博弈每多进行一个回合总得益就会下降 一个比例,因此让谈判拖得越长对双方可能越不
u2=q2P(Q)-c2q2 =q2[8-(q1+q2)]-2q2 =6q2- q1q2-q22
根据逆推归纳法的思路,先分析第二个厂商的决 策实厂最际大商。上值2在来已的第说经q二2,。决个相定阶当了段于,厂在并商给且2定决厂q策商1的时2 情知,况道厂下q商1,求1因选使此择u2实对的于现q1
再分析第一阶段厂商1和厂商2的选择,将厂商3的反应函 数带入1和2利润函数中,求出反应函数,解方程组
q1=q2=98/3 q3=98/6
讨价还价博弈
讨价还价(bargaining)是市场经济中最常 见、普通的事情。讨价还价在博弈论中S1
接受 (S1 ,10000-S1)
完全且完美信息动态博弈
动态博弈的扩展形表示
动态博弈一般用“扩展形” (或称“博弈树”)表示。 扩展形表述要给出每个参与人的动态描述,即参与人 在什么时点、什么情况下选择什么样的行动。
(1)参与人集合; (2)行动顺序(order of move),即谁在何时采取行动; (3)行动空间(action set),每次轮到某一参与人行动时,可
假设任一博弈方只要得益不小于下一回合自己出价 时的得益,就愿意接受对方的出价,那么乙在第二 回合能让甲接受的,也可能使自己的最大利益的S2 应满足:
S2 = δs 此时乙的收益得益为:
δ(10000-δS)=10000δ-δ2S> δ2(10000-S)
甲 1 出 S1
接受 (S1 ,10000-S1)
定义:如果一个完美信息的动态博弈中,各博弈方的 策略构成的一个策略组合满足,在整个动态博弈及 它的所有子博弈中都构成纳什均衡,那么这个策略 组合称为该动态博弈的一个“子博弈完美纳什均 衡”。
子博弈完美纳什均衡能够排除均衡策略中不可信的 威胁和承诺,因此是真正稳定的。
逆推归纳法是求完美信息动态博弈子博弈完美纳什 均衡的基本方法。
供选择的行动; (4息);信息集(information set),参与人进行选择时所知道的信 (5)收益函数,每个参与人可能选择的每一种行动所构成的行
动组合相对应的各个参与人的收益; (6)外生事件的概率分布,即虚拟参与人(自然)的可能选择,
它在博弈中的作用只是在相应的地方在若干外生事件中根据 一定的概率分布随即选取,而没有自己的利益目标和收益函 数。
S=10000
S1 10000 (1 2 )
[10000 (1 2 ), 10000( 2 )]
双方获得利益的比例取决于δ-δ2的大小。δδ2越大,甲的比例越小,乙的比例越大。当 δ=0.5时,δ-δ2有最大值0.25,当0.5<δ<1时, δ越大,δ-δ2越小,甲的得益越大,乙的得 益越小;当0<δ<0.5时,δ越大,δ-δ2越大, 甲的得益越小,乙的得益越大。
甲 1 出 S1
接受 (S1 ,10000-S1)
乙 不接受,出 S2
接受
甲
不接受,出 S
[δS2 ,δ(10000-S2)]
[δ2S,δ2(10000-S)]
第二回合乙的选择:乙知道一旦博弈进行到第三回合,甲将 出S,自己得到δ2(10000-S),甲得到δ2S。如果乙已经拒绝 了第一回合甲的方案,此时他该如何出价才能使自己的得益 最大化呢?如果他出的S2使甲选择接受的得益小于第三回合 的得益,那么方案肯定会被拒绝,进行到第三回合,自己得 δ2(10000-S)。如果自己出的S2既能让甲接受(意味着甲的 得益不小于第三回合的得益),又能使自己的得益比第三回 合的得益大,那么这样的S2符合乙的利益。
借乙 分 甲 不分
不借 (1,0)
(2,2)
(0,4)
开金矿博弈
不可置信威胁引出信息经济学中一个很重要的 概念“承诺行动”(commitment)。
承诺行动是当事人使自己的威胁战略变得可置信的 行动。
一种威胁在什么时候才是可置信的?只有当事人在 不实施这种威胁时,就会遭受更大的损失时,威胁 才是可置信的。
(0,4)
子博弈
定义:由一个动态博弈 第一阶段以外的某阶段 开始的后续博弈阶段构 成的,有初始信息集和 进行博弈所需要的全部 信息,能够自成一个博 弈的原博弈的一部分, 称为原动态博弈的一个 “子博弈”。
乙 借
甲 分 (2,2)
不分 乙
不借 (1,0)
(-1,0) (0,4)
子博弈完美纳什均衡
一般方法:从动态博弈的最后一个阶段开始分 析,每一次确定出所分析阶段博弈方的选择和 路径,然后再确定前一个阶段的博弈方的选择 和路径。
借 乙 不借