当前位置:
文档之家› 博弈论各章节课后习题答案 (3)
博弈论各章节课后习题答案 (3)
1
L
R
1
L
R
2
L
R
2
L
R
2
L
R
2
L
R
3
L
R
3
L
R
3
L
R
3
L
R
答:两个扩展式中的子博弈划分均不正确,图 1 中的划分对同一信息集产生了分割,图 2 中的子博弈不是开始于单节信息集的决策结点。
4. 在双寡头古诺模型中,设逆需求函数为 p=a-Q,其中 Q=q1+q2 为市场总需求,但 a 有 aH 和 aL 两种可能的情况,并且企业 1 知道 a 究竟是 aH 还是 aL,而企业 2 只知道 a=aH 和 a=aL 的概率分 别是θ和 1-θ,该信息是双方都知道的。双方的总成本函数分别是 cq1 和 cq2。如果两企业同时 选择产量,双方的策略空间是什么?试计算出贝叶斯纳什均衡。
∂π2 ∂q 2
= a − q1
− 2q2
− q3
−c=0
∂π3 ∂q3
=
a
− q1
− q2
− 2q3
−c
=0
求解(1)、( 2)组成的方程组有:
(1) (2)
q*2
=
q*3
=
a
−
q1 3
−
c
(2)现进行第一阶段的博弈分析:
对与a − q1 − q2 − q3 )q1 − cq1 将(3)代入可得:
1
(0,0) 1
2 (s -c1,-s )
(Pr-c1-c2,-Pr-d)
(-c1,0)
一)局中人 1 不指控局中人 2 时两个人的收益均为 0 二)局中人 1 决定指控局中人 2,在告上法庭之前,局中人 1 提出一个无协商余地的赔偿金 额 s 以私了,
(1)当局中人 2 接受要求时局中人的收益为 s-c1;局中人 2 的收益为-s; (2)当局中人 2 拒绝局中人 1 的要求, 1)局中人 1 放弃上诉时,局中人 1 的收益为-c1,局中人 2 的收益为 0; 2)当局中人 1 起诉时,局中人 1 的期望收益为 Pr-(c1+c2);局中人 2 的期望收益为-Pr-d
7. 如果将如下的囚徒困境博弈重复进行无穷次,惩罚机制为触发策略,贴现因子为δ。试问
δ应满足什么条件,才存在子博弈完美纳什均衡?
乙 坦白 不坦白
甲
坦白
4,4
0,5
不坦白 5,0
1,1
由划线法求得该博弈的纯策略纳什均衡点为(不坦白,不坦白),均衡结果为(1,1),采用触发策
略,局中人 i 的策略组合 s 的最好反应支付 φi (s) = max Pi (s−i ,si ) =5,Pi(s*)=4,Pi(sc)=1。若存 si ∈Si
的定价,qi是企业i的需求量。假设企业生产没有固定成本,并且边际成本为常数c,c<a.假定博弃 重复无穷多次,每次的价格都立即被观察到,企业使用触发策略。求使垄断价格可以作为完美 均衡结果出现的最低贴现因子δ,并解释δ与n的关系。
分以下几个步骤进行。
1)计算纳什均衡 当企业 i 选择价格 pi,其它企业选择价格 pj(j=1,2,…,n,j≠i)时,企业 i 的利润为: πi = (pi − c)qi = (pi − c)(a − pi + b(p1 + p2 + ⋯ + pi−1 + pi+1 + ⋯ + pn )) ,i=1,2,…,n
P2 (s)
=
200s2
−
15s
2 2
+
10s1s 2
,i=1,2。(1)求纳什均衡点;(2)在纳什均衡下的最优反应函数;(3)若该
博弈重复无限次,是否存在触发策略构成的子博弈完美纳什均衡,其条件是什么?
解:局中人 1,2 的最优反应函数分别为:
s1=5+1/2s2
s2=20/3+1/3s1
由此得唯一的纯策略纳什均衡点:sc=(10,10).相应的有 P(sc)=(1000,1500).
+ c1
− 2c2
]
企业 2 的策略为:
q*2
=
1 3
[
θaH
+ (1− θ
)aL
+ c1
− 2c2
]
因此博弈的贝叶斯纳什均衡是:当 a=aH 时,企业 1 生产 q1*H ;当 a=aL 时,企业 1 生产 q1*L ,
企业 2 生产 q*2 。
5. 在下面的静态贝叶斯博弈中,求出所有的纯策略贝叶斯纳什均衡。 (1) 自然决定收益情况是由博弈 1 给出,还是由博弈 2 给出,选择每一博弈的概率相等; (2) 局中人 1 了解到自然选择了博弈 1,还是选择了博弈 2,但局中人 2 不知道; (3) 局中人 1 选择行动 T 或 B,同时局中人 2 选择行动 L 或 R; (4) 根据自然选择的博弈,两局中人得到相应的收益。
1
A1
A2
3
2
C1
C2
B1
B2
(4,2,3)
(1,7,8) (7,6,6)
(2,1,9)
这时,假设局中人 1 采取行动 A1,对于左边一个子博弈,局中人 3 必定采取行动 C2(3<8),因 而在该子博弈顶点的结果只会是(1,7,8).同样,若局中人 1 采取行动 A2,此时局中人 2 必然采取 行动 B1(6>1),因而在该子博弈顶点的结果只会是(7,6,6).进而,该博弈又简化为:
(
a
−
q2
−
c1
)
⎨ ⎪⎪⎩q2
=
1 2
[θaH
+(1−θ
)aL
− (θq1H
+(1−θ
)q1L
) − c2
]
由此得:
企业 1 的策略为:
q1*H
=
1 2
(
aH
− c1 ) −
1 6
[
θaH
+(1−θ
)aL
+ c1 − 2c2 ]
q1*L
=
1 2 ( aL
− c1
)−
1 6
[ θaH
+ (1−θ
)aL
2
美纳什均衡。 答:该博弈分为两个阶段,第一阶段企业 1 选择产量 q1,第二阶段企业 2 和 3 观测到 q1 后, 他们之间作一完全信息的静态博弈。我们按照逆向递归法对博弈进行求解。 (1)假设企业 1 已选定产量 q1,先进行第二阶段的计算。设企业 2,3 的利润函数分别为:
π2 = (a − q1 − q2 − q3 )q2 − cq2 π3 = (a − q1 − q2 − q3 )q2 − cq3 由于两企业均要追求利润最大,故对以上两式分别求一阶条件:
价格组合( p1c , pc2,⋯, pcn )若是纳什均衡,则对每个企业 i, pic 应是如下最优问题的解:
max (pi − c)(a − pi + b(p1* + p*2 + ⋯p*i−1 + p*i+1 + ⋯ + p*n ))
0≤pi <∞
5
求解该问题,得;
∑ pic
=
1 2
(a
+
c
+
9. 求如图所示完全信息动态博弈的子博弈完美纳什均衡(图中数字(a,b,c)分别表示局中人 1、
2、3 的 收 益 )。
1
A1
A2
3
2
C1
C2
B1
B2
(4,2,3)
(1,7,8) 3
C1
C2 C1
3
C2
(5,4,3) (7,6,6) (2,1,9) (0,4,2)
答:局中人 1 采取 A2 行 动 ,局中人 2 采取行动 B1 时,局中人 3 必然采取 C2 行 动( 因为 3<6), 因而该博弈的顶点只能是(7,6,6)。同样对于局中人 3 右边一个子博弈,必然采取 C1 行动 (9>2),因而该博弈的顶点只能是(2,1,9)。进而原博弈简化为:
E( π 2 ) = θq2( aH − q1H − q2 − c2 ) + (1−θ )q2( aL − q1L − q2 − c2 )
由此得:
1 q2 = 2 [θaH + (1−θ )aL − (θq1H + (1−θ )q1L ) − c2 ]
在均衡时,q1,q2 应满足
1
⎪⎪⎧q1
=
1 2
在子博弈完美纳什均衡,必须满足: δ
≥
φi (s* ) φi (s* )
− −
Pi (s* ) Pi (sc )
=
5−4 5 −1
=
1 4
,即只有当贴现因子
δ
>1/4
时,才存在子博弈完美纳什均衡。
3
8. 假设 有 一 博 弈 G=[N,S,P], 其中 N={1,2},S1=[0,50],S2=[0,50], P1(s) = 100s1 −10s12 +10s1s2 ,
第三章 纳什均衡的扩展与精炼 1. 什么是完全信息和不完全信息?什么是完美信息和不完美信息?在海萨尼转换中,自然 对局中人类型的确定都是有限的吗?举例说明。(见教材) 2. 什么是重复博弈中的策略?什么是一个重复博弈中的子博弈?什么是一个子博弈完美纳什 均衡? (见教材) 3. 以下(虚线框中的)子博弈的划分是否正确?
LR
LR
T 1,1 0,0
T 0,0 0,0
B 0,0 0,0 博弈 1
B 0,0 2,2 博弈 2
N
1
0.5
2