当前位置：文档之家› 不完全信息动态博弈

不完全信息动态博弈

2的信息集在均衡路径上
1
均衡(M,U)中，2的推断一定是：给1的均衡战
略M，参与者2知道已
经到达了信息集中的哪一个节，即p=1。
L M
精炼贝叶斯均衡为{M,U；p=1}
R
精炼贝叶斯均衡是均衡战略和
p
2
1-p 均衡信念的结合
(1,3)
U
B
B
U
(2,1)
(0,0)
(0,2)
(0,1)
设想存在一个混合战略均衡，其中参与者1选择M 的概率为q1，R的
后验信念：参与人根据贝叶斯法则和均衡战略修正后验概率
后续博弈：从每个信息集开始的博弈的剩余部分称为一个后续博弈。
一、精炼贝叶斯均衡
引入精炼贝叶斯均衡的目的是为了进一步强化(即加强对条件的要求)贝叶斯纳什均衡，这和子博弈精炼纳什均衡强化了纳什均衡是相同的。
如果参与者的战略要成为博弈的一个精炼贝叶斯均衡，它们不仅必须是整个博弈的贝叶斯纳什均衡，而且还必须构成每一个后续博弈的贝叶斯纳什均衡。如果参与者的战略要成为一个子博弈精炼纳什均衡，则它们不仅必须是整个博弈的纳什均衡，还必须是其中每一个子博弈的纳什均衡。
(2,0
(8,0)
θ<1/2，下列战略组合是一个贝叶斯均衡：不论在位者选择什么价格，进入者总是认为在位者高成本概率为 θ*<1/2 ，总是选择不进入；高成本在位者选择p=6,低成本在位者选择p=5。
该均衡是否合理？——均衡中包含不可置信的战略。
一个合理均衡应满足如下要求：给定每个参与人有关其他参与人类型的后验信念，参与人的战略组合在每个后续博弈上构成贝叶斯均衡。
➢ 后行动者通过观察先行动者的行动来推断其类型或修正对其类型的先验信念（概率分布），然后选择自己的行动。
一、精炼贝叶斯均衡
➢ 先行动者预测自己的行动将被后行动者所利用，就会设法传递对自己最有利的信息，避免传递对自己不力的信息。
➢ ——博弈过程不仅是选择行动的过程，也是参与人修正信念的过程。
参与人2在自己信息集，轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”。
1
L M p
(1,3)
U
给定该信念，2的行动必须是最优的（给定该信念，2的战略选择在后续博弈上构成贝叶斯均衡）。
2选择U的期望支付为1*p+2*(1-p)=2p
2选择B的期望支付为0*p+1*(1-p)=1-
例，张三与李四的博弈 ➢ 张三恃强凌弱，第一次与李四见面，不知李四强弱。但
对李四类型有先验概率{0.8.0.2} ➢ 张三通过观察李四吃辣椒的数量修正李四强弱的看法
（后验概率），并以此确定对李四的态度
一、精炼贝叶斯均衡
➢ 李四预测到这一点，即使生性懦弱，也会强迫自己吃辣椒，以传达对自己有利的信息。
精炼贝叶斯均衡是对贝叶斯均衡的精炼，也是子博弈思想在不完全信息博弈中的推广，它本身是纳什均衡。
二、不完美信息博弈的精炼贝叶斯均衡
1
L M
R
2 (1,3)
U
B
B
U
(2,1)
(0,0)
(0,2)
(0,1)
二、不完美信息博弈的精炼贝叶斯均衡
L 1M
R
2
U
B
1，3
1，3
2，1
0，0
0，2
0，1
该博弈存在两个纯战略NE: （M,U）;(L,B)
（M,U）;(L,B)同样是子博弈精炼纳什均衡
(L,B)却又明显要依赖于一个不可信的威胁：如果轮到参与者2行动，则选择 U优于选择B，1便不会由于2威胁他将在其后的行动中选择B，而去选择L
在信息完全但不完美的博弈中，尽管(L,B)是SPNE，它依赖一个不可信的空头威胁，应该从合理的预测中排除。
➢ 两种结果：
——懦弱李四不吃辣椒，强悍李四吃辣椒且吃的足够多，使得懦弱李四不敢模仿。张三能够区分李四类型并选择是否欺负李四。
——两类李四都吃同样多辣椒，张三不能从李四吃辣椒行为中推出自己的信息，维持对李四的类型的先验信念{0.8， 0.2}
在位者的价格选择中包含关于其类型的信息，进入者可据此修正对在位者类型的先验信念 →在位者行动时必须考虑价格
不完全信息动态博弈
精炼贝叶斯均衡不完美信息博弈的精炼贝叶斯均衡信号博弈
一、精炼贝叶斯均衡
不完全信息博弈
➢ “自然”选择参与人类型，参与人自己知道，其他参与人不知道；
➢ 自然选择之后，参与人开始行动，行动有先后顺序，后行动者能观察到先行动者的行动，但不能观察到先行动者类型。（先行动者行动类型依存，每个参与人行动都传递着关于自己类型的某种信息）
p<2-p 2选择U。给定2的后续战略（1
R 1-p
知道2选择U），1的最优选择是M
2
2如果观察到1没
有选择L，则2一定
知道1选择了M，
B
B 于是有p=1
U
(2,1)
(0,0)
(0,2)
(0,1)
要求3：在处于均衡路径之上的信息集中，推断由贝叶斯法则及参与者的均衡战略给出。
定义：对于一个给定的扩展式博弈中的均衡，如果博弈按照均衡战略进行时将以正的概率达到某信息集，我们称此信息集处于均衡路径之上。反之，如果博弈根据均衡战略进行时，肯定不会达到某信息集，我们称之为不在均衡路径上的信息集。(其中“均衡”可以是纳什、子博弈精炼、贝叶斯以及精炼贝叶斯均衡)
完全信息条件下，若在位者高成本——“进入”；若在位者低成本——不进入
选择的信息效应
单阶段最优垄断
古诺均衡下的价格
价格
N
假设低成本在
高 θ 在位者
低 1-θ
位者不会选择 P=6，结果会怎样？
P=4 P=5
P=6
P=4 P=5
P=6
进入者
进不进进不进进不进进不进进不进进不进
(3,1) (7,0) (3, 1) (7,0) (3, 1) (7,0) (5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
精炼贝叶斯均衡
➢ 要求1：在每一信息集中，应该行动的参与者必须对博弈进行到该信息集中的哪个节有一个推断。对于非单节信息集，推断是在信息集中不同节点的一个概率分布；对于单节的信息集，参与者的推断就是到达此单一决策节的概率为l。
➢ 要求2：给定参与者的推断，参与者的战略必须满足序贯理性的要求。即在各个信息集，给定该信息集上概率分布和其他参与人的后续策略，参与人的行动必须是最优的。

e商务文档

不完全信息动态博弈

相关文档推荐：