当前位置：文档之家› 博弈论第四讲动态博弈

博弈论第四讲动态博弈

制止
（-2，5）制止
仿冒
A 不仿冒
B
不制止（0，10）
仿冒
A
B 不制止
不仿冒（5，5）
（2，2）
（10，4）
节点：边：终节点：
引子
每一阶段节点数、每一个选择节点的可选行为数量，都可以不同，比如
仿冒更多次数、仿冒的规模和程度、制止仿冒的力度
也不是所有动态博弈都可以用扩展形
阶段很多，或在一个阶段有很多可以选择的行为，如下棋
双寡头竞争：古诺（Cournot）博弈
设一市场有1，2两家厂商生产同样的产品。如果厂商1的产量为 q1，厂商2的产量为q2 ，则市场总产量为Q= q1+ q2 。设市场出清价格P是市场总产量的函数P（Q）=a-（q1+q2）
两个企业同时选择产量，价格由市场决定；假设每家公司的成本函数相同，并且每单位成本不随生产的数量
古诺寡头模型扩展－－斯塔克博格模型（Stackelberg)
先分析第二个厂商的决策：?
因为其决策时，厂商1的选择q1实际上已经决定了，并且厂商2知道q1，因此对厂商2来说，相当于在给定q1的情况下求使II2实现最大的q2 ，
II2对q2求导，得到q2必须满足：a-c- q1 -2 q2 =0, 即q2 *=(a-c- q1)/2
法律保障－－单次企业信用体系－－全寿命，一旦有失信发生，它的信用记录
有一笔摸不去的黑，将来它做生意也好，向银行贷款也好，都会受此影响。所以国外企业对信用问题看的非常严重－－电子商务的信用记录
关键在于必须增加一些对甲行为的制约！
在上面，甲选择不分，乙完全无可奈何；只能采取消极办法－不借，保护自己不被骗
变化。更正规一些，每家公司具有常数边际成本函数；C(qi ) cqi
那么，两生产方的利润函数为：
1 q1P(Q) cq1 q1(a q1 q2 c) 2 q2P(Q) cq2 q2 (a q1 q2 c)
双寡头竞争（续）
企业q1 最 R大1(q化2 )利 a润2的c 一q22阶条件为
否定，纳什均衡在动态博弈中失效原因－－动态博弈方策略的选择中可能存在
“可信性”问题
相机选择和策略中的可信性问题
相机选择（Contingent Play):
动态博弈中博弈方的策略是它们自己预先设定的，在各个博弈阶段，针对各种情况的相应行为选择的计划
但这些策略没有强制力，而且实施起来有一个过程，因此只要符合博弈方自己的利益，他们完全可以在博弈过程中改变计划。－－相机选择
假设金矿的价值是经过权威部门探测确认的
画出其博弈的扩展形
开金矿博弈的表示
借
甲分
（2，2）

乙不借
不分
（0，1）
（4，0）
开金矿博弈
引子
分析：
博弈从乙的选择开始他要决策的关键：要判断甲的许诺是否可信
假设甲、乙是理性人
以自身利益最大化为目标，即他们不考虑道德因素
按假设：在第二阶段，轮到甲行动时：必然选择是“不分”，而不是他许诺的“对半分”，也就是他的事先的许诺是“不可信”
中，两家公司比起它们象卡特尔那样经营来利
润较低（因为在纳什均衡里，它们过度地生
产）。
古诺寡头模型扩展－－斯塔克博格模型（Stackelberg)
两个厂商，与古诺模型一样，这两个厂商的决策内容也是产量。
但在这两个厂商中，一方较强一方较弱，因此它们的产量决策是由较强的一方先进行选择，较弱的一方则根据前者的产量选择自己的产量。
动态博弈的表示法－－扩展形
例子：有一家企业的产品被另一家企业仿冒，如果被仿冒的企业采取措施制止，仿冒企业就会停止仿冒，如果被仿冒企业不采取措施制止，仿冒企业就会继续仿冒。
对被仿冒企业来说，被仿冒当然要造成经济损失，因此采取措施制止仿冒是符合自身利益的，但问题是制止仿冒是有代价的，因此在遭仿冒时是否应该制止，如何制止？
发现两者唯一的区别：
古诺寡头模型两厂商同时决策；而后者却是行动有先后之分，后行动的一方能看到先行动的选择内容
导致两个博弈的求解方法、博弈的结果完全的不同
事实上，行动有先后的博弈是很多的：商业活动的讨价还价、拍卖活动的轮流竞价、资本市场的收购与反收购、下棋、打牌的轮流出牌等
依次选择与一次性同时选择有很大的差异。
前提：法律要起到应该有的作用
对人们正当权益的保护力度足够大对侵害他人利益者有足够的威慑作用否则法律的作用有限或完全失效
但斯塔克博格模型的产量大于古诺模型，价格低于古诺模型，总利润小于古诺模型
而厂商1的得益却大于古诺模型中的两个厂商的得益，更大于本模型中厂商2 的得益。
＃＃在信息不对称的博弈中，信息越多的博弈方（2）不一定能得到较多的利益
第四讲：完全且完美信息动态博弈
引子
我们刚才讲了两个无限策略模型－－古诺寡头模型及其扩展模型斯塔克博格模型（Stackelberg)
产目标。预先指定生产“配额”为q1与q2；它们的选择
是使得总利润最大化：
Maxq1,q2 [a (q1 q2 ) c][q1 q2 ]
每家公司的生产数量
ac
4
价格
ac 2
每家公司的利润
(a c)2
8
＃＃如果公司如卡特尔那样经营，它们比起在纳
什均衡里的产量生产得少一些；卡特尔的产量
是古诺特-纳什均衡产量水平的75%。在纳什均衡
在第三阶段，如果乙选择打官司，则能收回自己的1万元本钱，否则不打官司，则甲独吞4万元，乙仍然血本无归，所以作为理性人，乙的选择是“打官司”
在第二阶段，甲完全清楚乙的上述思路及选择，知道乙打官司的威胁是可信的，知道如果自己不分，等着他的必然是一场官司及失去所有的收入，作为理性人，他的选择就是分
如果轮到一个局中人行动的时候，他对于这个博弈进行到这个时刻的所有历史完全清楚，即他对他前面所有人的所有已经采取的行动都很清楚，这样的博弈叫做完美信息博弈
如：是否具有完美信息对行动的选择有很大的影响－－减少盲目性，否则仅仅依靠判断，概率期望决策
完全且完美信息动态博弈的思路
行动有先后顺序，不同的参与人在不同时点行动，先行动者的选择影响后行动者的选择空间，后行动者可以观察到先行动者做了什么选择，因此，为了做出最优的行动选择，每个参与人都必须这样思考问题：如果我如此选择，对方将如何应对？如果我是他，我将会如何行动？给定他的应对，什么是我的最优选择？
q2
R2 (q2 )
a
2
c
q1 2
纳什均衡产量：q1NE
q2NE
ac 3
纳什均衡利润为
1NE
NE 2
(a c)2 9
卡特尔解
作为对比，如果两个公司如卡特尔那样地运作，即，它们能对生产决策进行协调，我们来计算它们将生产的产量，如果公司经营为卡特尔，可以合理地假设它们以最大化它们的联合利润——或总利润这样的方式来设置生
在第一阶段，乙也完全明白甲的思路和选择，知道甲的许诺“分”是个可信的承诺，此时，乙选择借成为合理的行
有法律保障的开金矿博弈
策略：
乙：在第一阶段选择“借”，若第二阶段甲选择“不分”，在第三阶段选择“打官司”
甲：第二阶段选择“分”
这个案例告诉我们：
在一个都有私心，都重视自身利益的成员组成的社会中，完善公正的法律不但能保障社会的公平，而且还能提高社会经济活动的效率，是实现最有效率的社会分工合作的重要保障
如果乙能够在甲违约时可以用法律武器－－打官司，来保护自己呢？
有法律保障的开金矿博弈
乙
借
不借
甲分
（2，2）打
（0，1）
不分乙
（0，1）
不打（4，0）
有法律保障的开金矿博弈 ——分钱打官司都可信
分析:
加不加这个第三阶段，博弈的结果大不相同，现在，当博弈进行到第三阶段时，即甲选择不分，乙可以选择打官司来讨回公道。
产量、价格等连续变量均为无限种行为
可直接用文字描述和数学函数式表达
动态博弈的基本特点
策略是一个完备的行动计划－－在博弈开始之前就规定出每一个决策点上的选择，即使这个决策点实际上不会出现。
不是博弈方在单个阶段的行为，而是各博弈方在整个博弈中轮到选择的每个阶段，针对前面阶段的各种情况做相应的选择和行为的完整的计划，以及由不同博弈方这种完整计划构成的组合，这种计划就是动态博弈中博弈方的策略，如：
由于它们的选择有先后之分，且后选择的厂商在选择时已知道前一个厂商的选择，因此是一个完全信息的动态博弈
古诺寡头模型扩展－－斯塔克博格模型（Stackelberg)
假设同上：逆需求函数 P(Q) a (q1 q2 ) 成本函数： C(qi ) cqi 两生产方的利润函数为：
1 q1P(Q) cq1 q1(a q1 q2 c) 2 q2P(Q) cq2 q2 (a q1 q2 c)
这样，乙清楚甲的行为规则，因此它不会被甲的许诺所迷惑。
如果乙事先料想到甲的不会信守诺言，他的最合理选择： “不借”而不是“借”
因为有了不可信的许诺，使得甲乙合作最终成为不可能，导致开金矿的3万元社会福利的净损失。
如何避免？
有法律保障的开金矿博弈
有没有办法将甲的许诺变成可信呢？，从而使得乙愿意借，然后，甲遵守诺言选择分，最终增加双方的利益呢？
正因为相机选择的存在使得博弈方是真正按照自己设定的方案行动，还是临时改变自己的行动方案？
通过一个例子来说明
开金矿博弈
甲在开采一价值4万元的金矿时缺1万元资金，而乙正好由1万元资金可以投资。设甲想说服乙将这 1万元资金借给自己用于开矿，并许诺在采到金子后与乙对半分成
问：乙是否应该将钱借给甲呢？

e商务文档

博弈论第四讲动态博弈

相关文档推荐：