当前位置:文档之家› 动态博弈

动态博弈


案例:开金矿博弈 版本3:法律保障不足的开金矿博弈 P1
不借
(1, 0) 起诉 (-1, 0) 不还 P1
借 P2 还
放弃 (0, 4)
(2, 2)
2· B 斯塔克尔贝里双头垄断模型 1· 博弈的时间顺序如下(1) 企业1选择产量q1 , (2) 企 业2观察到q1 以后,然后选择产量q2 ; (3) 企业i 的收 益由下面的利润函数给出:
自己避免小企业,小人物的无端指控. 办法之一就是在被指控之前就支付律师费用. 假定被告在被指控之前支付律师费用y , 那么,赔偿 区域为 s [ rx , rx d y ], 纳什均衡解为
s rx (d y) 2
因为即使 rx d 2 c p 成立, ( d y ) 2 c p rx 也可能不满足, 从而原告将不会提出指控. 这样的 承诺行动使被告节省成本 rx d 2 y . 因此,只要 y rx d 2 , 承诺行动就值得. 这 就是为什么大公司、大人物雇佣律师的原因之一.
动 态 博 弈
简单地讲,动态博弈就是参与者的行动选择必须 是有先后顺序的博弈. 参与者的每一次行动选择叫做一步或一个时期. 直观地讲,动态博弈可以看作若干个静态博弈联 合在一起看作一个博弈. 动态博弈分为 完美信息和非完美信息动态博弈. 第二章 完全信息动态博弈 1 完全信息博弈 参与者的收益函数是共同知识的博弈 2 完全且完美信息动态博弈 博弈进行的每一步当中, 要选择行动的参与者都知道这一步之前博弈进行的
显然即使 rx c p , (即上法庭的期望收益小于诉讼 成本), rx d 2 c p 的条件仍可能成立. 子博弈纳什均衡结果将是: 假定这个条件成立, 原告提出指控要求. 原告的支付为 rx d 2 c p , 被告的支付为 rx d 2 , 案件私了. 该博弈模型的实际背景举例: 因为被告打官司的成本不仅包括应诉的法律费 用而且涉及声誉损失( d ),所以,被告越大(大人物 大企业), d 越大, rx d 2 c p 的条件越可能满足. 这是为什么大人物常常受到无端指控的原因之一. 当然,大企业、大人物也可以通过他们的承诺行动使
max 2 ( q , q 2 ) max q 2 [ a q1 q 2 c ]
q2 q2
由上式可得
R 2 ( q1 )
a q1 c 2
已知 q1 a c , 这与同时行动的古诺模型中得出的
结果相同. 但两者不同之处在于这里的 R 2 ( q 1 ) 是企业 2对企业1已观测到的产量的真实反应,而在古诺模型 R 2 ( q 1 ) 是企业2对假定的企业1的产量的最优反应. 且 企业1的产量选择是和企业2同时作出的. 由于企业1也和企业2一样解出企业2的最优反应, 企业1就可以预测到他如选择q1,企业2将根据 R 2 ( q 1 ) 选择产量. 那么在博弈的第一阶段,企业1的问题就可
(a , R2 (a ).
1
1
第一,参与者1选择支付1000美元给参与者2,或者 一分不给; 第二,参与者2观察到参与者1的选择,然后决定是 否引爆一颗手雷. 两个参与者如何选择呢? 如果参与者1相信这一威胁,他的最优反应是支 付是将1000美元给参与者2,参与者2接受,博弈结束.
但参与者1却不会对这一威胁信以为真,因为它不 可置信. 手雷博弈就属于简单类型的完全且完美信息动 态博弈: 1 参与者1从可行集A1中选择一个行动a1 , 2 参与者2观察到a1后,从可行集A2中选择一个 行动a2, 3 两人的收益分别为 u 1 ( a1 , a 2 ) 和 u ( a1 , a 2 ). 逆向归纳法求解此博弈如下: 在博弈的第二阶段参与者2行动时,由于其前参 与者1已选择行动a1,他面临的决策问题可用下式表
i ( q1 , q 2 ) q i [ P ( Q ) c ]
P (Q ) a Q
(市场出清价格)
Q q 1 q 2 (市场上的总产量)
C 是生产的边际成本(固定成本为0). 为求解此博弈的逆向归纳解,首先计算企业2 对 企业1任意产量的最优反应 R 2 ( q1 ), R 2 ( q1 ) 应满足
( 0 , 9998 ) ( 9999 , 0 )
由逆向归纳法容易得出逆向归纳解为:在A第一次 选择时就结束博弈. 双方的收益为(1, 0). 但是实验的 结果如何呢? 最终B 得到10000元钱,然后,自愿地分给A 一半.
“开金矿博弈” 甲欲开发一个价值4万元的金矿,缺少1万元资金, 乙有1万元的资金可以投资.甲想说服乙借给他,并答 应分给乙2万元,乙是否应该借给他? 可将此问题看作一个两个阶段两个参与者的动态 博弈. P1 版本1:无法律保障 借 不借 P 的开金矿博弈
表示为
max 1 ( q1, R 2 ( q1 )) max q 1 [ a q1 R 2 ( q1 ) c ]
q1 0 q1 0
max q 1
a q1 c 2
1
于是
q1 0
q
1
ac 2
,
q R2 (q )
2
ac 4
.
这就是斯塔克尔贝里双头垄断博弈的逆向归纳解. 斯塔克尔贝里模型产量与古诺模型产量的比较 1)古诺产量
整个过程. 3 完全但不完美信息博弈 在博弈的某些阶段, 要选 择行动的参与者并不知道这一步之前博弈的整个 过程. 4 所有动态博弈的中心问题是可信任性. 完全且完美信息动态博弈 一、动态博弈的表述(初步描述) 1、基本要求 (1)局中人 I={ 1,2,…, n }; (2)局中人的行动次序(有先后之分),Ai 为参与者i 的行动集; (3)每次行动时局中人所进行的选择;
P 不指控 (0,0) 拒绝 P
指控 P 要求S D 放弃
( c, 0)
接受
起诉
(rx c p, rx d )
( s c, s )源自原告指控的目的本身意味着rx < p , 那么, 在博弈的 最后阶段, 原告的最优选择是放弃. 因为被告知道如果自己拒绝,原告将放弃, 被告 在倒数第二阶段的最优选择是拒绝; 原告知道将被拒 绝,原告在第一阶段的最优选择是不指控.因此子博弈 精炼纳什均衡是 原告选择(不指控,要求,放弃),被告选择(拒绝)
(4)外生事件的概率分布; (5)局中人在选择行动时所了解的信息 ; (6)支付函数. A 不仿冒 仿冒 2 博弈树 (扩展型示意) B (0,10) 制止 例:仿冒博弈
不制止 A
3 完全且完美 信息动态博弈(-2,5) 仿冒
B 制止 (2,2)
不仿冒
不制止 (5,5) (10,4)
逆向归纳法-动态规划
2
(1,0) 不还 博弈的逆向归纳解: (0, 4) (不借,X )
还 (2, 2)
易知此博弈的逆向归纳解为:乙选择不借, 博弈结束. 表示为(不借,X ) 直观解释为乙没有理由相信甲的“承诺”. 上面的博弈可以修正为以下博弈. P1 版本2:法律保障 不借 借 充足的开金矿博弈 P2 不还 (1,0) P 还 1 博弈的结果: 起诉 放弃 (2,2) (借,还) (1,0) (0,4)
蜈 蚣 博 弈
以下的蜈蚣博弈是罗森多教授(Robert Rosenthal) 1981年发表在Jour nal of Economic Theory) 上的论 文中提出的.
蜈 蚣 博 弈:
A B A B A B A
( 0 , 10000 )
(1, 0 ) ( 0 , 2 ) ( 3, 0 ) ( 0 , 4 ) ( 5 , 0 )
的状态转移方程,再根据所求问题的有关效益指标, 建立起能够联系局部与全局最优性的动态规划基本 方程. 二、逆向归纳法 1、 二人动态博弈的逆向归纳法 I ={1 ,2},局中人1先行动,2 根据1的行动选择 行动,收益函数 u i u i ( a1 , a 2 ), i 1, 2 . 局中人2 的选择 max u 2 ( a1 , a 2 ) a 2 R 2 R 2 ( a1 )
1 1
逆向归纳法背后的理性假设. 看下例三阶段两个参与者的动态博弈. 三阶段两个参与者的动态博弈的博弈树表示.
1
L R L1 (1 , 1)
2
R1 L2
(2 , 0)
1 R 2
(0 , 2)
(3 , 0)
博弈的解或博弈的结果:参与者选择L,博弈结束. 博弈的逆向归纳解表示为 (L,X).
戴威(Richard H. Thaler)发表在<<经济学视角 杂志 >>上的一个例子. 教授组织同学进行这样的实验:让A, B两同学就 一美元进行讨价还价:首先由A提出方案,若B同意, 就按照A的方案分配这一美元. 如果B 拒绝A 的提议, 则双方一文不名. 请讨论实验分配的结果. 最终A 得到1美元钱,然后自愿地分给B 一半.
示为 max u2 (a1 , a2 ),
a2 A2
假定对 A1 中的每一个 a 1,参与者2的最优化问题 只有唯一解, 用 R2 (a1 )表示. 由于参与者1 能和参与 者2一样解出2的问题, 参与者1 可以预测到参与者2 对每一个可能行动 a 1所做出的反应,这样1 在第一阶 max 段要解决的问题可归结为: A u1 (a1 , R2 (a1 )). a 假定参与者1的这一最优化问题也有唯一解,表示 为 a 1 , 我们称 (a1 , R(a1 )) 是这一博弈的逆向归纳解. 逆向归纳解不含有不可置信的威胁: 因为参与者1 能预测到参与者2对1的可能选择的最优反应, 这一预 测排除了参与者2不可置信的威胁.
q q
* 1 * 2
ac 3

ac 3

* S
2 3
(a c)
* C
3 4
( a c ),
相关主题