不完全信息动态博弈
2的信息集在均衡 路径上
1
均衡(M,U)中,2的推断 一定是:给1的均衡战
略M,参与者2知道已
经到达了信息集中的哪 一个节,即p=1。
L M
精炼贝叶斯均衡为{M,U;p=1}
R
精炼贝叶斯均衡是均衡战略和
p
2
1-p 均衡信念的结合
(1,3)
U
B
B
U
(2,1)
(0,0)
(0,2)
(0,1)
设想存在一个混合战略均衡,其中参与者1选择M 的概率为q1,R的
后验信念:参与人根据贝叶斯法则和均衡战略修正后验 概率
后续博弈:从每个信息集开始的博弈的剩余部分称为一 个后续博弈。
一、精炼贝叶斯均衡
引入精炼贝叶斯均衡的目的是为了进一步强化(即加强对 条件的要求)贝叶斯纳什均衡,这和子博弈精炼纳什均衡 强化了纳什均衡是相同的。
如果参与者的战略要成为博弈的一个精炼贝叶斯均衡,它 们不仅必须是整个博弈的贝叶斯纳什均衡,而且还必须构 成每一个后续博弈的贝叶斯纳什均衡。如果参与者的战略 要成为一个子博弈精炼纳什均衡,则它们不仅必须是整个 博弈的纳什均衡,还必须是其中每一个子博弈的纳什均衡。
(2,0
(8,0)
θ<1/2,下列战略组合是一个贝叶斯均衡:不论在位者选 择什么价格,进入者总是认为在位者高成本概率为 θ*<1/2 ,总是选择不进入;高成本在位者选择p=6,低成 本在位者选择p=5。
该均衡是否合理?——均衡中包含不可置信的战略。
一个合理均衡应满足如下要求:给定每个参与人有关其 他参与人类型的后验信念,参与人的战略组合在每个后 续博弈上构成贝叶斯均衡。
➢ 后行动者通过观察先行动者的行动来推断其类型或修正对其 类型的先验信念(概率分布),然后选择自己的行动。
一、精炼贝叶斯均衡
➢ 先行动者预测自己的行动将被后行动者所利用,就会设 法传递对自己最有利的信息,避免传递对自己不力的信 息。
➢ ——博弈过程不仅是选择行动的过程,也是参与人修正 信念的过程。
参与人2在自己信息 集,轮到选择的博 弈方必须具有一个 关于博弈达到该信 息集中每个节点可 能性的“判断”。
1
L M p
(1,3)
U
给定该信念,2的行动必须是最优的 (给定该信念,2的战略选择在后续博 弈上构成贝叶斯均衡)。
2选择U的期望支付为1*p+2*(1-p)=2p
2选择B的期望支付为0*p+1*(1-p)=1-
例,张三与李四的博弈 ➢ 张三恃强凌弱,第一次与李四见面,不知李四强弱。但
对李四类型有先验概率{0.8.0.2} ➢ 张三通过观察李四吃辣椒的数量修正李四强弱的看法
(后验概率),并以此确定对李四的态度
一、精炼贝叶斯均衡
➢ 李四预测到这一点,即使生性懦弱,也会强迫自己吃辣 椒,以传达对自己有利的信息。
精炼贝叶斯均衡是对贝叶斯均衡的精炼,也是子博弈思想 在不完全信息博弈中的推广,它本身是纳什均衡。
二、不完美信息博弈的精炼贝叶斯均衡
1
L M
R
2 (1,3)
U
B
B
U
(2,1)
(0,0)
(0,2)
(0,1)
二、不完美信息博弈的精炼贝叶斯均衡
L 1M
R
2
U
B
1,3
1,3
2,1
0,0
0,2
0,1
该博弈存在两个纯战略NE: (M,U);(L,B)
(M,U);(L,B)同样是子博弈 精炼纳什均衡
(L,B)却又明显要依赖于一个不可信的威胁:如果轮到参 与者2行动,则选择 U优于选择B,1便不会由于2威胁他将 在其后的行动中选择B,而去选择L
在信息完全但不完美的博弈中,尽管(L,B)是SPNE,它依 赖一个不可信的空头威胁,应该从合理的预测中排除。
➢ 两种结果:
——懦弱李四不吃辣椒,强悍李四吃辣椒且吃的足够多, 使得懦弱李四不敢模仿。张三能够区分李四类型并选择 是否欺负李四。
——两类李四都吃同样多辣椒,张三不能从李四吃辣椒行 为中推出自己的信息,维持对李四的类型的先验信念{0.8, 0.2}
在位者的价格选择中包含关于 其类型的信息,进入者可据此 修正对在位者类型的先验信念 →在位者行动时必须考虑价格
不完全信息动态博弈
精炼贝叶斯均衡 不完美信息博弈的精炼贝叶斯均衡 信号博弈
一、精炼贝叶斯均衡
不完全信息博弈
➢ “自然”选择参与人类型,参与人自己知道,其他参与人不 知道;
➢ 自然选择之后,参与人开始行动,行动有先后顺序,后行动 者能观察到先行动者的行动,但不能观察到先行动者类型。 (先行动者行动类型依存,每个参与人行动都传递着关于自 己类型的某种信息)
p<2-p 2选择U。 给定2的后续战略(1
R 1-p
知道2选择U),1的 最优选择是M
2
2如果观察到1没
有选择L,则2一定
知道1选择了M,
B
B 于是有p=1
U
(2,1)
(0,0)
(0,2)
(0,1)
要求3: 在处于均衡路径之上的信息集中,推断由贝叶斯 法则及参与者的均衡战略给出。
定义 :对于一个给定的扩展式博弈中的均衡,如果博弈按 照均衡战略进行时将以正的概率达到某信息集,我们称此 信息集处于均衡路径之上。反之,如果博弈根据均衡战略 进行时,肯定不会达到某信息集,我们称之为不在均衡路 径上的信息集。(其中“均衡”可以是纳什、子博弈精炼、 贝叶斯以及精炼贝叶斯均衡)
完全信息条件下,若在 位者高成本——“进 入”;若在位者低成 本——不进入
选择的信息效应
单阶段最优垄断
古诺均衡下的价格
价格
N
假设低成本在
高 θ 在位者
低 1-θ
位者不会选择 P=6,结果会 怎样?
P=4 P=5
P=6
P=4 P=5
P=6
进入者
进 不进 进 不进 进 不进 进 不进 进 不进进 不进
(3,1) (7,0) (3, 1) (7,0) (3, 1) (7,0) (5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
精炼贝叶斯均衡
➢ 要求1:在每一信息集中,应该行动的参与者必须对博弈 进行到该信息集中的哪个节有一个推断。对于非单节信息 集,推断是在信息集中不同节点的一个概率分布;对于单 节的信息集,参与者的推断就是到达此单一决策节的概率 为l。
➢ 要求2: 给定参与者的推断,参与者的战略必须满足序贯 理性的要求。即在各个信息集,给定该信息集上概率分布 和其他参与人的后续策略,参与人的行动必须是最优的。