当前位置：文档之家› 博弈论各章节课后习题答案 (3)

博弈论各章节课后习题答案 (3)

1
L
R
1
L
R
2
L
R
2
L
R
2
L
R
2
L
R
3
L
R
3
L
R
3
L
R
3
L
R
答：两个扩展式中的子博弈划分均不正确，图 1 中的划分对同一信息集产生了分割，图 2 中的子博弈不是开始于单节信息集的决策结点。
4. 在双寡头古诺模型中,设逆需求函数为 p=a-Q,其中 Q=q1+q2 为市场总需求,但 a 有 aH 和 aL 两种可能的情况,并且企业 1 知道 a 究竟是 aH 还是 aL,而企业 2 只知道 a=aH 和 a=aL 的概率分别是θ和 1-θ,该信息是双方都知道的。双方的总成本函数分别是 cq1 和 cq2。如果两企业同时选择产量,双方的策略空间是什么？试计算出贝叶斯纳什均衡。
∂π2 ∂q 2
= a − q1
− 2q2
− q3
−c=0
∂π3 ∂q3
=
a
− q1
− q2
− 2q3
−c
=0
求解（1）、（ 2）组成的方程组有：
（1）（2）
q*2
=
q*3
=
a
−
q1 3
−
c
（2）现进行第一阶段的博弈分析：
对与a − q1 − q2 − q3 )q1 − cq1 将（3）代入可得：
1
(0,0) 1
2 (s -c1,-s )
(Pr-c1-c2,-Pr-d)
(-c1,0)
一)局中人 1 不指控局中人 2 时两个人的收益均为 0 二)局中人 1 决定指控局中人 2，在告上法庭之前，局中人 1 提出一个无协商余地的赔偿金额 s 以私了，
(1)当局中人 2 接受要求时局中人的收益为 s-c1;局中人 2 的收益为-s； (2)当局中人 2 拒绝局中人 1 的要求， 1)局中人 1 放弃上诉时，局中人 1 的收益为-c1,局中人 2 的收益为 0； 2)当局中人 1 起诉时，局中人 1 的期望收益为 Pr-(c1+c2);局中人 2 的期望收益为-Pr-d
7. 如果将如下的囚徒困境博弈重复进行无穷次，惩罚机制为触发策略，贴现因子为δ。试问
δ应满足什么条件，才存在子博弈完美纳什均衡？
乙坦白不坦白
甲
坦白
4,4
0,5
不坦白 5,0
1,1
由划线法求得该博弈的纯策略纳什均衡点为(不坦白,不坦白)，均衡结果为(1,1)，采用触发策
略，局中人 i 的策略组合 s 的最好反应支付 φi (s) = max Pi (s−i ,si ) =5,Pi(s*)=4，Pi(sc)=1。若存 si ∈Si
的定价,qi是企业i的需求量。假设企业生产没有固定成本,并且边际成本为常数c,c<a.假定博弃重复无穷多次,每次的价格都立即被观察到,企业使用触发策略。求使垄断价格可以作为完美均衡结果出现的最低贴现因子δ,并解释δ与n的关系。
分以下几个步骤进行。
1)计算纳什均衡当企业 i 选择价格 pi,其它企业选择价格 pj(j=1,2,…,n,j≠i)时,企业 i 的利润为: πi = (pi − c)qi = (pi − c)(a − pi + b(p1 + p2 + ⋯ + pi−1 + pi+1 + ⋯ + pn )) ,i=1,2,…,n
P2 (s)
=
200s2
−
15s
2 2
+
10s1s 2
,i=1,2。(1)求纳什均衡点;(2)在纳什均衡下的最优反应函数;(3)若该
博弈重复无限次,是否存在触发策略构成的子博弈完美纳什均衡,其条件是什么？
解：局中人 1,2 的最优反应函数分别为:
s1=5+1/2s2
s2=20/3+1/3s1
由此得唯一的纯策略纳什均衡点:sc=(10,10).相应的有 P(sc)=(1000,1500).
+ c1
− 2c2
]
企业 2 的策略为：
q*2
=
1 3
[
θaH
+ (1− θ
)aL
+ c1
− 2c2
]
因此博弈的贝叶斯纳什均衡是：当 a=aH 时，企业 1 生产 q1*H ；当 a=aL 时，企业 1 生产 q1*L ，
企业 2 生产 q*2 。
5. 在下面的静态贝叶斯博弈中,求出所有的纯策略贝叶斯纳什均衡。 (1) 自然决定收益情况是由博弈 1 给出，还是由博弈 2 给出，选择每一博弈的概率相等； (2) 局中人 1 了解到自然选择了博弈 1，还是选择了博弈 2，但局中人 2 不知道； (3) 局中人 1 选择行动 T 或 B，同时局中人 2 选择行动 L 或 R； (4) 根据自然选择的博弈，两局中人得到相应的收益。
1
A1
A2
3
2
C1
C2
B1
B2
(4,2,3)
(1,7,8) (7,6,6)
(2,1,9)
这时,假设局中人 1 采取行动 A1，对于左边一个子博弈，局中人 3 必定采取行动 C2(3<8),因而在该子博弈顶点的结果只会是(1,7,8).同样,若局中人 1 采取行动 A2,此时局中人 2 必然采取行动 B1(6>1),因而在该子博弈顶点的结果只会是(7,6,6).进而,该博弈又简化为：
(
a
−
q2
−
c1
)
⎨ ⎪⎪⎩q2
=
1 2
[θaH
+(1−θ
)aL
− (θq1H
+(1−θ
)q1L
) − c2
]
由此得：
企业 1 的策略为：
q1*H
=
1 2
(
aH
− c1 ) −
1 6
[
θaH
+(1−θ
)aL
+ c1 − 2c2 ]
q1*L
=
1 2 ( aL
− c1
)−
1 6
[ θaH
+ (1−θ
)aL
2
美纳什均衡。答：该博弈分为两个阶段，第一阶段企业 1 选择产量 q1，第二阶段企业 2 和 3 观测到 q1 后，他们之间作一完全信息的静态博弈。我们按照逆向递归法对博弈进行求解。（1）假设企业 1 已选定产量 q1，先进行第二阶段的计算。设企业 2，3 的利润函数分别为：
π2 = (a − q1 − q2 − q3 )q2 − cq2 π3 = (a − q1 − q2 − q3 )q2 − cq3 由于两企业均要追求利润最大，故对以上两式分别求一阶条件：
价格组合( p1c , pc2,⋯, pcn )若是纳什均衡,则对每个企业 i, pic 应是如下最优问题的解:
max (pi − c)(a − pi + b(p1* + p*2 + ⋯p*i−1 + p*i+1 + ⋯ + p*n ))
0≤pi <∞
5
求解该问题,得;
∑ pic
=
1 2
(a
+
c
+
9. 求如图所示完全信息动态博弈的子博弈完美纳什均衡（图中数字(a,b,c)分别表示局中人 1、
2、3 的收益）。
1
A1
A2
3
2
C1
C2
B1
B2
(4,2,3)
(1,7,8) 3
C1
C2 C1
3
C2
(5,4,3) (7,6,6) (2,1,9) (0,4,2)
答：局中人 1 采取 A2 行动，局中人 2 采取行动 B1 时，局中人 3 必然采取 C2 行动（因为 3<6），因而该博弈的顶点只能是(7,6,6)。同样对于局中人 3 右边一个子博弈，必然采取 C1 行动（9>2），因而该博弈的顶点只能是(2,1,9)。进而原博弈简化为：
E( π 2 ) = θq2( aH − q1H − q2 − c2 ) + (1−θ )q2( aL − q1L − q2 − c2 )
由此得：
1 q2 = 2 [θaH + (1−θ )aL − (θq1H + (1−θ )q1L ) − c2 ]
在均衡时，q1，q2 应满足
1
⎪⎪⎧q1
=
1 2
在子博弈完美纳什均衡，必须满足： δ
≥
φi (s* ) φi (s* )
− −
Pi (s* ) Pi (sc )
=
5−4 5 −1
=
1 4
，即只有当贴现因子
δ
>1/4
时，才存在子博弈完美纳什均衡。
3
8. 假设有一博弈 G=[N,S,P], 其中 N={1,2},S1=[0,50],S2=[0,50], P1(s) = 100s1 −10s12 +10s1s2 ，
第三章纳什均衡的扩展与精炼 1. 什么是完全信息和不完全信息？什么是完美信息和不完美信息？在海萨尼转换中，自然对局中人类型的确定都是有限的吗？举例说明。(见教材) 2. 什么是重复博弈中的策略?什么是一个重复博弈中的子博弈?什么是一个子博弈完美纳什均衡? (见教材) 3. 以下（虚线框中的）子博弈的划分是否正确?
LR
LR
T 1,1 0,0
T 0,0 0,0
B 0,0 0,0 博弈 1
B 0,0 2,2 博弈 2
N
1
0.5
2

e商务文档

博弈论各章节课后习题答案 (3)

相关文档推荐：