当前位置:
文档之家› 贝叶斯博弈与贝叶斯Nash均衡
贝叶斯博弈与贝叶斯Nash均衡
• 贝叶斯博弈(the static Bayesian game)是关 于不完全信息静态博弈的一种建模方式, 也是不完全信息静态博弈的标准式描述。
贝叶斯博弈的定义
• 贝叶斯博弈包含以下五个要素: (1)参与人集合 Γ ={1, 2,..., n} ; (2)参与人的类型集T1,…,T2; (3)参与人关于其他参与人类型的推断 p1(t−1 t1),
• 用 pi (t−i ti ) 表示参与人i在知道自己类型为ti 的情况下,关于其他参与人类型的推断
(即条件概率),则
p= i (t−i ti )
p= (t−i , ti ) p(ti )
p(t−i , ti )
∑ p(t−i , ti )
t− i ∈T− i
• 其中, p(ti ) 为边缘密度函数。
• 但由于参与人1不知道对手究竟是“强硬” 的还是“软弱”的,因此,此时的参与 人1就觉得自己似乎是在与两个决斗者进 行决斗,一个是“强硬”的,另一个是 “软弱”的。
• 当一个参与人并不知道在与谁博弈时, 博弈的规则是没有定义的,如何处理不 完全信息?
• Harsanyi提出了Harsanyi转换。
p(t1,…,tn)表示定义在参与人类型组合上 的一个联合分布密度函数,Harsanyi转换 假定:对于一个给定的不完全信息博弈 问题,存在一个参与人关于“自然”选 择的推断p(t1,…,tn),且p(t1,…,tn)为共同知 识。也就是说,Harsanyi转换假定所有参 与人关于“自然”行动的信念(belief)是 相同的,并且为共同知识。
• 用 vi (ai , s−i;ti )表示给定其他参与人的战
略
s−i
=(s1
(⋅),
,
si−1
(⋅),
si+1
(⋅), ,
sn
(⋅))
,类型为ti的
参与人i选择行动ai时的期望效用,则
∑ vi (ai , s−i ;ti ) =
pi (t−i ti )ui (ai , a−i (t−i );ti )
U
1
D
2
U
D
-4, -4
0, -2
0, 2
1, 0
U
1
D
-4, -4
2, 0
-2, 0
0, 1
(2) 参与人1为强硬者
参与人2为软弱者
2
U
D
-4, -4
0, 0
0, 0
1, 1
(3) 参与人1为软弱者 参与人2为强硬者
(4) 参与人都为软弱者
• 在“斗鸡博弈”中,虽然在博弈开始之 前每位决斗者都了解(知道)自己的性格特 征,但对对手的性格特征往往不甚了解 或了解不全。
• 在Harsanyi转换中规定:参与人关于“自 然”选择的推断为共同知识。
• 也就是说,两个决斗者不仅同时一起看 到了“自然”随机选择参与人2的性格特 征,而且同时一起看到了“自然”以一 定的概率分布随机选择参与人2的性格特 征。
在应用Harsanyi转换时,需要注意以下问题:
• 1) “自然”的选择。在一般的不完全信息 博弈问题中,Harsanyi转换规定“自然” 选择的是参与人的类型(type)。
U -4, -4
0, -2
1
D
0, 2
1, 0
• 博弈存在唯一的Nash均衡——(D, U)。
当参与人都为软弱者时
2
U
D
U -4, -4
0, 0
1
D
0, 0
1, 1
• 博弈存在唯一的Nash均衡——(D, D)。
2
U
D
2
U
D
U
1
D
-4, -4 -2, 2
2, -2
U
1
0, 0
D
(1) 参与人都为强硬者
t− i ∈T− i
• 其中,对 ∀t−i , ∈T−i a−i (t−i ) 为给定t-i时由s-i 所确定的其他参与人的行动组合
s−i
(t−i
)
=
(s1
(t1
), ,
si −1 (ti −1 ),
si+1
(ti
+1
),
,
sn
(tn
))
• 在贝叶斯博弈中,对于一个理性的参与
人i,当他只知道自己的类型ti而不知道其 他参与人的类型时,给定其他参与人的
U
1
D
2
U
D
-4, -4
2, -2
-2, 2
0, 0
• 博弈存在两个纯战略Nash均衡—— (U, D)和(D,U)。
当参与人1为强硬者参与人2为软弱者时
2
U
D
U -4, -4
2, 0
1
D
-2, 00, 1Fra bibliotek• 博弈存在唯一的Nash均衡——(U, D)。
当参与人1为软弱者参与人2为强硬者时
2
U
D
∑ ai∗
(ti
)
∈
arg
max
ai∈Ai (ti
)
t−
i
∈T−
i
pi (t−i
ti )ui (ai , a−∗i (t−i );ti )
存在性结论
• 定理 一个有限的贝叶斯博弈一定存在贝 叶斯Nash均衡。
贝叶斯Nash均衡定义的另一种表示方式
•
在静态贝叶斯博弈
G
=<
Γ; (T i
);
(
p i
…, pn (t−n tn;) (4)参与人类型相依的行动集A(t1),…, A(tn); (5)参与人类型相依的支付函数 u1(a1(t1), a2(t2),, an (tn );t1)
,…, un (a1(t1), a2 (t2 ),, an (tn );tn ) 。
规定贝叶斯博弈的时间顺序如下:
由∂π 2 = 0,得:
∂q2
q2 (q1,= t)
• 在这种情况下即使所有的决斗者都看到 了上面的四个战略式博弈 ,但对决斗者 来讲,仍存在着所谓的事前不确定性即 博弈开始之前就不知道的信息。
• 对于“强硬”的参与人1来讲,虽然他看 到了上面的战略式博弈,但他不知道对 手是“强硬”的还是“软弱”的,所以 博弈开始之前他无法确定博弈是根据(1) 还是(2)进行。 这意味着“强硬”的参与 人1面临着事前无法确定的信息。
第三部分: 不完全信息静态博弈
第十章贝叶斯博弈与贝叶斯Nash均衡
主要内容: 一、贝叶斯博弈 二、贝叶斯Nash均衡 三、贝叶斯Nash均衡的应用 四、关于混合战略Nash均衡的一个解释
一、贝叶斯博弈
• 前面两部分我们讨论了完全信息博弈问 题,但在现实生活中我们遇到更多的可 能是不完全信息博弈问题。
• 同样,“软弱”的参与人1也会面临类似 的问题。此时,“斗鸡博弈”就是一个 不完全信息博弈问题。
• 对于不完全信息博弈问题,是不可能应 用前面两部分介绍的方法进行求解的。
• 这是因为给定参与人1为“强硬”的决斗 者,如果对手是“软弱”的,那么博弈 就只存在惟一的Nash均衡(U, D),参与人 1有惟一的最优选择“冲上去”;如果对 手是“强硬”的,则博弈就会出现两个N ash均衡(U,D)和(D,U),参与人1的最优选 择取决于对手的选择。
• 为了分析,对“斗鸡博弈”进行简化。
• 假设参与人1是“强硬”的决斗者,参与 人2可能是“强硬”的也可能是“软弱” 的,参与人1不知道但参与人2清楚,而 且这一假设为所有的参与人所知道。
Harsanyi转换
• 对于简化的“斗鸡博弈”,Harsanyi转换 是这样处理的: 在原博弈中引入一个“虚拟”参与 人——“自然”(nature,用N表示),构造 一个参与人为:两个决斗者和“自然” 的三人博弈。
动组合 (a1∗(t1), a2∗(t2 ),, an∗(tn )) ,其中每个参与人 在给定自己的类型ti和其他参与人的类型相依 行动 a−∗i (t−i ) 的情况下最大化自己的期望效用。
•
也就是,行动组合
(a1∗
(t1),
a2∗
(t2
), ,
an∗
(tn
))
是一个
纯战略贝叶斯Nash均衡,如果对 ∀i∈Γ ,
• 用ti表示参与人i的一个特定的类型,Ti表 示参与人i所有类型的集合(亦称类型空间,
type space),即ti ∈Ti ,t=(t1,…,tn)表示一 个所有参与人的类型组合, t-i=(t1,…,ti1,…,tn)表示除参与人i之外其他参与人的 类型组合。所以,t=(ti, t-i)。
• 2) 参与人关于“自然”选择的推断。用
市场需求:
P= a − Q
Q= q1 + q2
进一步假设:
a = 2;
=c1 1,= c2L
3 4
,= c2H
5; 4
p=1 2
企业2:
π 2 = q2 ⋅ (P − c2 )
= q2 ⋅ (a − c2 − q2 − q1)
• 令 a − c2 = t 则 π 2=q2 ⋅ (t − q2 − q1)
“自然”首先行动决定参与人2的性格特征(即选择
的参H选与ar择人sa参2n是与y“i人转强1换不硬知”道的,还但是参“与软人弱2”知的道),。“自然”
N
x0 强硬( p)
1
x1
U
D
2
软弱(1− p)
x2
U
D
2
UD
UD
UD
UD
-4 ,-4
2 ,-2
-2 ,2
0,0
-4 ,-4
2,0
-2 ,0