当前位置：文档之家› 贝叶斯博弈与贝叶斯Nash均衡

贝叶斯博弈与贝叶斯Nash均衡

• 贝叶斯博弈(the static Bayesian game)是关于不完全信息静态博弈的一种建模方式，也是不完全信息静态博弈的标准式描述。
贝叶斯博弈的定义
• 贝叶斯博弈包含以下五个要素：（1）参与人集合 Γ ={1, 2,..., n} ；（2）参与人的类型集T1,…,T2；（3）参与人关于其他参与人类型的推断 p1(t−1 t1),
• 用 pi (t−i ti ) 表示参与人i在知道自己类型为ti 的情况下，关于其他参与人类型的推断
(即条件概率)，则
p= i (t−i ti )
p= (t−i , ti ) p(ti )
p(t−i , ti )
∑ p(t−i , ti )
t− i ∈T− i
• 其中， p(ti ) 为边缘密度函数。
• 但由于参与人1不知道对手究竟是“强硬” 的还是“软弱”的，因此，此时的参与人1就觉得自己似乎是在与两个决斗者进行决斗，一个是“强硬”的，另一个是 “软弱”的。
• 当一个参与人并不知道在与谁博弈时，博弈的规则是没有定义的，如何处理不完全信息？
• Harsanyi提出了Harsanyi转换。
p(t1,…,tn)表示定义在参与人类型组合上的一个联合分布密度函数，Harsanyi转换假定：对于一个给定的不完全信息博弈问题，存在一个参与人关于“自然”选择的推断p(t1,…,tn)，且p(t1,…,tn)为共同知识。也就是说，Harsanyi转换假定所有参与人关于“自然”行动的信念(belief)是相同的，并且为共同知识。
• 用 vi (ai , s−i;ti )表示给定其他参与人的战
略
s−i
=(s1
(⋅),
,
si−1
(⋅),
si+1
(⋅), ,
sn
(⋅))
，类型为ti的
参与人i选择行动ai时的期望效用，则
∑ vi (ai , s−i ;ti ) =
pi (t−i ti )ui (ai , a−i (t−i );ti )
U
1
D
2
U
D
-4, -4
0, -2
0, 2
1, 0
U
1
D
-4, -4
2, 0
-2, 0
0, 1
(2) 参与人1为强硬者
参与人2为软弱者
2
U
D
-4, -4
0, 0
0, 0
1, 1
(3) 参与人1为软弱者参与人2为强硬者
(4) 参与人都为软弱者
• 在“斗鸡博弈”中，虽然在博弈开始之前每位决斗者都了解(知道)自己的性格特征，但对对手的性格特征往往不甚了解或了解不全。
• 在Harsanyi转换中规定：参与人关于“自然”选择的推断为共同知识。
• 也就是说，两个决斗者不仅同时一起看到了“自然”随机选择参与人2的性格特征，而且同时一起看到了“自然”以一定的概率分布随机选择参与人2的性格特征。
在应用Harsanyi转换时，需要注意以下问题：
• 1) “自然”的选择。在一般的不完全信息博弈问题中，Harsanyi转换规定“自然” 选择的是参与人的类型(type)。
U -4, -4
0, -2
1
D
0, 2
1, 0
• 博弈存在唯一的Nash均衡——(D, U)。
当参与人都为软弱者时
2
U
D
U -4, -4
0, 0
1
D
0, 0
1, 1
• 博弈存在唯一的Nash均衡——(D, D)。
2
U
D
2
U
D
U
1
D
-4, -4 -2, 2
2, -2
U
1
0, 0
D
(1) 参与人都为强硬者
t− i ∈T− i
• 其中，对 ∀t−i ， ∈T−i a−i (t−i ) 为给定t-i时由s-i 所确定的其他参与人的行动组合
s−i
(t−i
)
=
(s1
(t1
), ,
si −1 (ti −1 ),
si+1
(ti
+1
),
,
sn
(tn
))
• 在贝叶斯博弈中，对于一个理性的参与
人i，当他只知道自己的类型ti而不知道其他参与人的类型时，给定其他参与人的
U
1
D
2
U
D
-4, -4
2, -2
-2, 2
0, 0
• 博弈存在两个纯战略Nash均衡—— (U， D)和(D,U)。
当参与人1为强硬者参与人2为软弱者时
2
U
D
U -4, -4
2, 0
1
D
-2, 00, 1Fra bibliotek• 博弈存在唯一的Nash均衡——(U, D)。
当参与人1为软弱者参与人2为强硬者时
2
U
D
∑ ai∗
(ti
)
∈
arg
max
ai∈Ai (ti
)
t−
i
∈T−
i
pi (t−i
ti )ui (ai , a−∗i (t−i );ti )
存在性结论
• 定理一个有限的贝叶斯博弈一定存在贝叶斯Nash均衡。
贝叶斯Nash均衡定义的另一种表示方式
•
在静态贝叶斯博弈
G
=<
Γ; (T i
);
(
p i
…, pn (t−n tn；) （4）参与人类型相依的行动集A(t1),…, A(tn)；（5）参与人类型相依的支付函数 u1(a1(t1), a2(t2),, an (tn );t1)
,…, un (a1(t1), a2 (t2 ),, an (tn );tn ) 。
规定贝叶斯博弈的时间顺序如下：
由∂π 2 = 0,得：
∂q2
q2 (q1，= t)
• 在这种情况下即使所有的决斗者都看到了上面的四个战略式博弈，但对决斗者来讲，仍存在着所谓的事前不确定性即博弈开始之前就不知道的信息。
• 对于“强硬”的参与人1来讲，虽然他看到了上面的战略式博弈，但他不知道对手是“强硬”的还是“软弱”的，所以博弈开始之前他无法确定博弈是根据(1) 还是(2)进行。这意味着“强硬”的参与人1面临着事前无法确定的信息。
第三部分：不完全信息静态博弈
第十章贝叶斯博弈与贝叶斯Nash均衡
主要内容：一、贝叶斯博弈二、贝叶斯Nash均衡三、贝叶斯Nash均衡的应用四、关于混合战略Nash均衡的一个解释
一、贝叶斯博弈
• 前面两部分我们讨论了完全信息博弈问题，但在现实生活中我们遇到更多的可能是不完全信息博弈问题。
• 同样，“软弱”的参与人1也会面临类似的问题。此时，“斗鸡博弈”就是一个不完全信息博弈问题。
• 对于不完全信息博弈问题，是不可能应用前面两部分介绍的方法进行求解的。
• 这是因为给定参与人1为“强硬”的决斗者，如果对手是“软弱”的，那么博弈就只存在惟一的Nash均衡(U, D)，参与人 1有惟一的最优选择“冲上去”；如果对手是“强硬”的，则博弈就会出现两个N ash均衡(U,D)和(D,U)，参与人1的最优选择取决于对手的选择。
• 为了分析，对“斗鸡博弈”进行简化。
• 假设参与人1是“强硬”的决斗者，参与人2可能是“强硬”的也可能是“软弱” 的，参与人1不知道但参与人2清楚，而且这一假设为所有的参与人所知道。
Harsanyi转换
• 对于简化的“斗鸡博弈”，Harsanyi转换是这样处理的：在原博弈中引入一个“虚拟”参与人——“自然”(nature，用N表示)，构造一个参与人为：两个决斗者和“自然” 的三人博弈。
动组合 (a1∗(t1), a2∗(t2 ),, an∗(tn )) ，其中每个参与人在给定自己的类型ti和其他参与人的类型相依行动 a−∗i (t−i ) 的情况下最大化自己的期望效用。
•
也就是，行动组合
(a1∗
(t1),
a2∗
(t2
), ,
an∗
(tn
))
是一个
纯战略贝叶斯Nash均衡，如果对 ∀i∈Γ ，
• 用ti表示参与人i的一个特定的类型，Ti表示参与人i所有类型的集合(亦称类型空间，
type space)，即ti ∈Ti ，t=(t1,…,tn)表示一个所有参与人的类型组合， t-i=(t1,…,ti1,…,tn)表示除参与人i之外其他参与人的类型组合。所以，t=(ti, t-i)。
• 2) 参与人关于“自然”选择的推断。用
市场需求：
P= a − Q
Q= q1 + q2
进一步假设：
a = 2;
=c1 1,= c2L
3 4
,= c2H
5; 4
p=1 2
企业2：
π 2 = q2 ⋅ (P − c2 )
= q2 ⋅ (a − c2 − q2 − q1)
• 令 a − c2 = t 则 π 2＝q2 ⋅ (t − q2 − q1)
“自然”首先行动决定参与人2的性格特征(即选择
的参H选与ar择人sa参2n是与y“i人转强1换不硬知”道的，还但是参“与软人弱2”知的道)，。“自然”
N
x0 强硬( p)
1
x1
U
D
2
软弱(1− p)
x2
U
D
2
UD
UD
UD
UD
-4 ,-4
2 ,-2
-2 ,2
0,0
-4 ,-4
2,0
-2 ,0

e商务文档

贝叶斯博弈与贝叶斯Nash均衡

相关文档推荐：