当前位置:文档之家› 博弈论第四讲动态博弈

博弈论第四讲动态博弈


制止
(-2,5) 制止
仿冒
A 不仿冒
B
不制止 (0,10)
仿冒
A
B 不制止
不仿冒 (5,5)
(2,2)
(10,4)
节点: 边: 终节点:
引子
每一阶段节点数、每一个选择节点的可选行为 数量,都可以不同,比如
仿冒更多次数、仿冒的规模和程度、制止仿冒的力 度
也不是所有动态博弈都可以用扩展形
阶段很多,或在一个阶段有很多可以选择的行为, 如下棋
双寡头竞争:古诺(Cournot)博弈
设一市场有1,2两家厂商生产同样的产品。如果厂商1的产量为 q1,厂商2的产量为q2 ,则市场总产量为Q= q1+ q2 。设市场出 清价格P是市场总产量的函数P(Q)=a-(q1+q2)
两个企业同时选择产量,价格由市场决定; 假设每家公司的成本函数相同,并且每单位成本不随生产的数量
古诺寡头模型扩展--斯塔克博 格模型(Stackelberg)
先分析第二个厂商的决策:?
因为其决策时,厂商1的选择q1实际上已经决定了, 并且厂商2知道q1,因此对厂商2来说,相当于在给 定q1的情况下求使II2实现最大的q2 ,
II2对q2求导,得到q2必须满足:a-c- q1 -2 q2 =0, 即q2 *=(a-c- q1)/2
法律保障 --单次 企业信用体系--全寿命,一旦有失信发生,它的信用记录
有一笔摸不去的黑,将来它做生意也好,向银行贷款也好, 都会受此影响。所以国外企业对信用问题看的非常严重-- 电子商务的信用记录
关键在于必须增加一些对甲行为的制约!
在上面,甲选择不分,乙完全无可奈何;只能采取消极办法 -不借,保护自己不被骗
变化。更正规一些,每家公司具有常数边际成本函数;C(qi ) cqi
那么,两生产方的利润函数为:
1 q1P(Q) cq1 q1(a q1 q2 c) 2 q2P(Q) cq2 q2 (a q1 q2 c)
双寡头竞争(续)
企业q1 最 R大1(q化2 )利 a润2的c 一q22阶条件为
否定,纳什均衡在动态博弈中失效 原因--动态博弈方策略的选择中可能存在
“可信性”问题
相机选择和策略中的可信性问题
相机选择(Contingent Play):
动态博弈中博弈方的策略是它们自己预先设定的,在各 个博弈阶段,针对各种情况的相应行为选择的计划
但这些策略没有强制力,而且实施起来有一个过程,因 此只要符合博弈方自己的利益,他们完全可以在博弈过 程中改变计划。--相机选择
假设金矿的价值是经过权威部门探测确认的
画出其博弈的扩展形
开金矿博弈的表示

甲 分
(2,2)

乙 不借
不分
(0,1)
(4,0)
开金矿博弈
引子
分析:
博弈从乙的选择开始 他要决策的关键:要判断甲的许诺是否可信
假设甲、乙是理性人
以自身利益最大化为目标,即他们不考虑道德因素
按假设:在第二阶段,轮到甲行动时:必然选择是“不 分”,而不是他许诺的“对半分”,也就是他的事先的 许诺是“不可信”
中,两家公司比起它们象卡特尔那样经营来利
润较低(因为在纳什均衡里,它们过度地生
产)。
古诺寡头模型扩展--斯塔克博格模 型(Stackelberg)
两个厂商,与古诺模型一样,这两个厂商的决策内容也 是产量。
但在这两个厂商中,一方较强一方较弱,因此它们的产 量决策是由较强的一方先进行选择,较弱的一方则根据 前者的产量选择自己的产量。
动态博弈的表示法--扩展形
例子:有一家企业的产品被另一家企业仿冒,如果被 仿冒的企业采取措施制止,仿冒企业就会停止仿冒, 如果被仿冒企业不采取措施制止,仿冒企业就会继续 仿冒。
对被仿冒企业来说,被仿冒当然要造成经济损失,因 此采取措施制止仿冒是符合自身利益的,但问题是制 止仿冒是有代价的,因此在遭仿冒时是否应该制止, 如何制止?
发现两者唯一的区别:
古诺寡头模型两厂商同时决策;而后者却是行动有先后之分, 后行动的一方能看到先行动的选择内容
导致两个博弈的求解方法、博弈的结果完全的不同
事实上,行动有先后的博弈是很多的:商业活动的讨 价还价、拍卖活动的轮流竞价、资本市场的收购与反 收购、下棋、打牌的轮流出牌等
依次选择与一次性同时选择有很大的差异。
前提:法律要起到应该有的作用
对人们正当权益的保护力度足够大 对侵害他人利益者有足够的威慑作用 否则法律的作用有限或完全失效
但斯塔克博格模型的产量大于古诺模型,价格低于 古诺模型,总利润小于古诺模型
而厂商1的得益却大于古诺模型中的两个厂商的得 益,更大于本模型中厂商2 的得益。
##在信息不对称的博弈中,信息越多的博弈方 (2)不一定能得到较多的利益
第四讲:完全且完美信息动态博弈
引子
我们刚才讲了两个无限策略模型--古诺寡头模型及 其扩展模型斯塔克博格模型(Stackelberg)
产目标。预先指定生产“配额”为q1与q2;它们的选择
是使得总利润最大化:
Maxq1,q2 [a (q1 q2 ) c][q1 q2 ]
每家公司的 生产数量
ac
4
价格
ac 2
每家公司的 利润
(a c)2
8
##如果公司如卡特尔那样经营,它们比起在纳
什均衡里的产量生产得少一些;卡特尔的产量
是古诺特-纳什均衡产量水平的75%。在纳什均衡
在第三阶段,如果乙选择打官司,则能收回自己的1万元本 钱,否则不打官司,则甲独吞4万元,乙仍然血本无归,所 以作为理性人,乙的选择是“打官司”
在第二阶段,甲完全清楚乙的上述思路及选择,知道乙打 官司的威胁是可信的,知道如果自己不分,等着他的必然 是一场官司及失去所有的收入,作为理性人,他的选择就 是分
如果轮到一个局中人行动的时候,他对于这个博弈进行到这个时刻的所有历史完全 清楚,即他对他前面所有人的所有已经采取的行动都很清楚,这样的博弈叫做完美 信息博弈
如:是否具有完美信息对行动的选择有很大的影响--减少盲目性,否则仅仅依靠 判断,概率期望决策
完全且完美信息动态博弈的思路
行动有先后顺序,不同的参与人在不同时点行动,先 行动者的选择影响后行动者的选择空间,后行动者可 以观察到先行动者做了什么选择,因此,为了做出最 优的行动选择,每个参与人都必须这样思考问题:如 果我如此选择,对方将如何应对?如果我是他,我将 会如何行动?给定他的应对,什么是我的最优选择?
q2
R2 (q2 )
a
2
c
q1 2
纳什均衡产量:q1NE
q2NE
ac 3
纳什均衡利润为
1NE
NE 2
(a c)2 9
卡特尔解
作为对比,如果两个公司如卡特尔那样地运作,即,它 们能对生产决策进行协调,我们来计算它们将生产的产 量,如果公司经营为卡特尔,可以合理地假设它们以最 大化它们的联合利润——或总利润这样的方式来设置生
在第一阶段,乙也完全明白甲的思路和选择,知道甲的许 诺“分”是个可信的承诺,此时,乙选择借成为合理的行
有法律保障的开金矿博弈
策略:
乙:在第一阶段选择“借”,若第二阶段甲选择“不分”,在第三 阶段选择“打官司”
甲:第二阶段选择“分”
这个案例告诉我们:
在一个都有私心,都重视自身利益的成员组成的社会中,完善公正 的法律不但能保障社会的公平,而且还能提高社会经济活动的效率, 是实现最有效率的社会分工合作的重要保障
如果乙能够在甲违约时可以用法律武器--打官司,来保护 自己呢?
有法律保障的开金矿博弈


不借
甲 分
(2,2) 打
(0,1)
不分 乙
(0,1)
不打 (4,0)
有法律保障的开金矿博弈 ——分钱打官司都可信
分析:
加不加这个第三阶段,博弈的结果大不相同,现在,当博 弈进行到第三阶段时,即甲选择不分,乙可以选择打官司 来讨回公道。
产量、价格等连续变量均为无限种行为
可直接用文字描述和数学函数式表达
动态博弈的基本特点
策略是一个完备的行动计划--在博弈开始之前就规定 出每一个决策点上的选择,即使这个决策点实际上不会 出现。
不是博弈方在单个阶段的行为,而是各博弈方在整个博弈中轮到 选择的每个阶段,针对前面阶段的各种情况做相应的选择和行为 的完整的计划,以及由不同博弈方这种完整计划构成的组合,这 种计划就是动态博弈中博弈方的策略,如:
由于它们的选择有先后之分,且后选择的厂商在选择时 已知道前一个厂商的选择,因此是一个完全信息的动态 博弈
古诺寡头模型扩展--斯塔克博 格模型(Stackelberg)
假设同上:逆需求函数 P(Q) a (q1 q2 ) 成本函数: C(qi ) cqi 两生产方的利润函数为:
1 q1P(Q) cq1 q1(a q1 q2 c) 2 q2P(Q) cq2 q2 (a q1 q2 c)
这样,乙清楚甲的行为规则,因此它不会被甲的许诺所 迷惑。
如果乙事先料想到甲的不会信守诺言,他的最合理选择: “不借”而不是“借”
因为有了不可信的许诺,使得甲乙合作最终成为不可能, 导致开金矿的3万元社会福利的净损失。
如何避免?
有法律保障的开金矿博弈
有没有办法将甲的许诺变成可信呢?,从而使得乙愿 意借,然后,甲遵守诺言选择分,最终增加双方的利 益呢?
正因为相机选择的存在使得博弈方是真正按照自己设定 的方案行动,还是临时改变自己的行动方案?
通过一个例子来说明
开金矿博弈
甲在开采一价值4万元的金矿时缺1万元资金,而 乙正好由1万元资金可以投资。设甲想说服乙将这 1万元资金借给自己用于开矿,并许诺在采到金子 后与乙对半分成
问:乙是否应该将钱借给甲呢?
相关主题