当前位置：文档之家› 博弈论第三章完全信息动态博弈讲解

博弈论第三章完全信息动态博弈讲解

房地产开发博弈
开发
A hA(1) 不开发
h表示信息集
N hN(1)
需求大
需求小
N hN(2)
需求大
需求小
B hB(1)
开发
不开发
B hB(2)
B hB(3)
开发
不开发开发不开发开发
B hB(4)
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8) (0,0) (0,1) 单位:百万元
定义一个展开式博弈的子博弈G 由一个决策结x 和所有该决策结的后继结T(x)( 包括终点结0 组成, 它满足下列条件:⑴x 是一个单点信息结即h(x)={x};⑵对于所有的 x′∈T(x),如果x″∈h(x′),则x″∈T(x)。
(3)
N
1/3
2/3
1
Y1
z1
1
x1
w1
(2,6) (5,6)
2
2
a2 (9,0)
b2 (0,3)
a2 (9,5)
b2 (0,3)
3.3 子博弈与子博弈完美
Nash 均衡在原则上适用所有的博弈,但对于预测参与人的行为来说,Nash均衡可能并不是一个合理的预测, 如房地产博弈:
A
开发
不开发
A
开发
不开发
B
B
B
B
开发不开发开发不开发开发不开发开发
不开发
有了信息集的概念, 展开式表示也可以用来表示静态博弈, 如“囚徒的困境 ”博弈可以表示为:
1
坦白
2
不坦白
2
坦白
不坦白坦白
不坦白
(-5,-5)
(0,-8) (-8,0)
(-1,-1)
或者:
2
坦白
不坦白
1
1
坦白
Ff 0,0
0,0
该博弈有唯一的Nash均衡(σ1,σ2)=(1/3(Rr)+2/2(Rf), 2/3(M)+1/3(P)),它与信念体系一起构成序贯均衡。
习题
1.写出下列博弈的策略型表示:
(1)
(2)
1
U
D
U
1 D
2
L
R
2
L
R
(2,1) (0,0) (-1,1) (3,2)
2
2
L
RL
R
(2,1) (0,0) (-1,1) (3,2)
A
开
不
B
开
不
B
开
不
(-3,-3)
(1,0)
的策略式表示为:
(0,1)
(0,0)
参与人B
( 开, 开) ( 开, 不) ( 不, 开) ( 不, 不)
开 -3,-3
-3,-3
1,0
1,0
参与人A
不 0,1
0,0
0,1
0,0
由画线法可得三个纯策略Nash 均衡:
可表示为策略型
参与人2
M
P
Rr 0,0
1,-1
注:u1(Rf,M)= 2×1/2+(-1)×1/2=0,5
u2((Rf,M)= -2×1/2+1×1/2=-0.5
Rf 0.5,-0.5
参与人1
Fr –0.5,0.5
0,6 1,-1
其中R(r)表示加注;F(f)表示摊牌;M表示对抗;P表示放弃。
例房地产博弈开A
BX
开
不
不 B X′
开
不
有子博弈Ⅰ:
Bx
开
不
和子博弈Ⅱ:
B X′
开
不
1
U
D
2
2
L
R
L
R
无(真)子博弈
1
U
D
2
2
L
R
L
R
3
3
3
3
C
DC DC
DC D
参与人2 的信息集不能作为子博弈的初始结, 否则将导致3的信息被分割。
3.3.2 子博弈完美 (精练)动态博弈
定义展开式博弈的略组s*=(s1*,…si*,…sn*) 是一个子博弈完美(精练)Nash均衡, 如果满足:(1)它是原博弈的Nash均衡;(2)它在每一个子博弈上给出Nash均衡。
如果博弈树的所有信息集都是单结的, 则称该博弈为完美(perfect)息博弈。(无虚线连接), 而完全(complete)信息博弈是指得益函数和纯策略空间均为博弈各方的共同知识。完全信息可以是完美的也可以是不完美的。
3.2 展开型博弈的策略与均衡
一、行为策略
在策略型博弈中, 参与人的策略是进行博弈的计划( 或打算)的详细集合, 而在展开型博弈中参与人的策略必须确定在该参与人的每一个决策集上所采取的行动,又结与信息集紧密相连, 对于参与人i,基于信息hi的行动的
(Luce & Raiff)。
参与人i的行为策略bi 定义为：
bi∈×hi∈Hi△(A(hi))
其中△ 表示某集合是的概率分布。
行为策略的Nash 集合是这样一个策略组合，它使得没有一个参与人可以通过不同的使用策略而增加自己的得益。
＃Si= Π ＃(A(hi)) hi∈Hi
展开型博弈中纯策略是由信息集与行动集定义的( 与静态博弈不同,静态博弈中采取纯策略与采取某行动是一个意思)。
纯策略组合(剖面profile)是由参与人各自的纯策略空间中的任一纯策略构成的组
合，在任一纯策略组合s下，总可以从
初始结开始，沿着博弈树的某条路径
黑
N
[0.5]
红 [0.5]
<1> 1
<1> 1
加注r <1/3>
y2 2 <1/4>
摊牌f
摊牌F
<2/3> <0>
(-1,1) (1,-1)
加注R <1>
x2 2 <3/4>
放弃P
对抗M
放弃P
对抗M
(1,-1)
(-2,2)
(1,-1)
(2,-2)
摊牌博弈的策略空间分别为:
S1={(R,F)×(r,f)}={Rr,Rf,Fr,Ff},S2={M,P}
⑷ 当参与人作出他们的行动决策时,他所观测到或他所了解到的信息,即他在此时获得的信息集合;
⑸ 参与人的得益(支付或效用), 它们是已知行动的函数;
⑹ 在任何外生事件的概率分布。
例房地产开发博弈
有两个房地产开发商(分别为参与人1,记为 A和参与人2,记为B) 在某地开发房地产, 但该地的房地产需求状况是不确定的, 假定该博弈的行动顺序如下:(1) 开发商1先行动, 选择开发或不开发;(2)在1决策后,“ 自然”选择需求的大小;(3)开发商2在观测到1的决策和市场的需求后, 再决定开发或不开发。( 如下图)
={(左,左),(左,右),(右,左),(右,右)},其中纯策略 (左,左)表明:当1取“上”时,2取“左”;当1取
“下”时,2取“左”,…… 参与人1有三个信息集H1={hi(i),i=1,2,3},1的纯
策略空间为:S1=A(h1(1))×A(h1(2))×A(h1(3)) ={(上,下)×(A,B)×(C,D)},共8种纯策略。一般地,参与人I的纯策略空间的纯策略数目为:
(0,0)
上述博弈树给出了有限博弈的几乎所有信息。
博弈树必须满足下列规则：
(1) 每一个结(node)至多有一个其他结直接位于它的前面;
(2) 在博弈中没有一条路径可以使决策集与自身相连;
(3) 每一个结是唯一初始结的后续结, 即博弈树必须有初始结;
(4) 每个博弈树“正好”只有一个初始结(多于一个可以用“ 自然”连接。
不坦白
坦白
不坦白
(-5,-5)
(0,-8) (-8,0)
(-1,-1)
注意: 得益向量的次序与参与人决策的顺序一致。
同样地,展开型博弈也可以用策略式来表示, 如
展开型博弈:
1
T
B
2
L
R
2
L
R
(2,2)
(4,0) ((1,0)
可以表示为:
参与人2
L
R
T 2,2 4,0
另一种情况就则B知道自然的选择,但不知道A的
选择,这时博弈树如下:
A
开发
不开发
N
N
大
小
大
小
B
B
B
B
开发
不开发开发
不开发开发
不开发开发
不开发
(-5,-5)
(0,-8) (-3,-3)
(1,0) (0,8) (0,0) (0,1)
(0,0)
上述房地产开发博弈还有另一种表示：
N
大(1/2)
小(1/2)
注意：行为策略是在A(hi)上随机化，而混合策略则是在Si( 即A(hi) 的乘积空间)上的随机化
定理 (Kuhn,1953) 在完美回忆博弈中，混合策略与行为策略是等价的。
完美回忆指没有参与人会忘记以前知道的信息。
例下列展开型博弈不具备完美回忆：

e商务文档

博弈论第三章完全信息动态博弈讲解

相关文档推荐：

e商务文档

博弈论 第 三 章 完全信息动态博弈讲解

相关文档推荐：

博弈论第三章完全信息动态博弈讲解