当前位置:文档之家› Lecture 5 不完全信息动态博弈

Lecture 5 不完全信息动态博弈


5.2 信号博弈
Case 1:混同于行动L的PBE
接受者分别在观察到L和R后形成信念������和������,由于在该情况
下,发送者都选择L,因此������ = 0.5(没有信念更新)。 要使得均衡成立,需要接受者在给定信念下达到最优选择


要使得均衡成立,还需要发送者选择L比选择R要好。 混同均衡:
• •
((强势进入,合作);p=1) 求解PBE时,一定要列举出信念
择价格战的支付为-1,因此在位者的最优选择是合作。给定在 位者选择合作,进入者会选择强势进入。
5.1 不完全信息动态博弈
例5.1.2:吓阻进入(2)
5.1 不完全信息动态博弈
例5.1.2:吓阻进入(2)
由C1,在位者(I)形成信念 ������ 和 1 − ������,分别为������和������的概率 由C2,给定信念,在位者(I)的期望支付为
������, ������ , ������, ������ ; ������ = 0.5, ������ ≤ 2/3
5.2 信号博弈
Case 2:混同于行动R的PBE
接受者分别在观察到L和R后形成信念������和������,由于在该情况
下,发送者都选择R,因此������ = 0.5(没有信念更新)。 要使得均衡成立,需要接受者在给定信念下达到最优选择

显然当������ ≤ 2/3时,两种类型的发送者选择L会更好
观察到L后,接受者选择������的支付为3∗0.5+4∗0.5=3.5,选择������ 的支付为0∗0.5+1∗0.5=0.5,从而最优选择为������。使得在均衡 路径上类型������1 和������2 的发送者支付分别为1和2。 观察到R后,给定信念������,接受者选择������的支付为������,选择������ 的支付为2(1−������)。若������ ≥ 2/3,接受者的最优选择为������,类 型������1 和������2 的发送者支付分别为2和1;若������ ≤ 2/3,接受者的 最优选择为������ ,类型������1 和������2 的发送者支付分别为0和1
5.1 不完全信息动态博弈
例5.1.1:吓阻进入
5.1 不完全信息动态博弈
例5.1.1:吓阻进入(1)
由C1,在位者(I)形成信念 ������和 1 − ������,分别为强势进入和
弱势进入的概率:
由C2,给定信念,在位者选择合作的期望支付为1 − ������,选 由C3,在均衡路径上,信念由进入者的策略决定p=1 均衡
若������ < ������,不存在分离均衡,存在两类混同均衡
饼干, 饼干 , 决斗, 不决斗 ; ������ = 0.1, ������ ≥ 0.5
啤酒, 啤酒 , 决斗, 不决斗 ; ������ ≥ 0.5, ������ = 0.1
5.2 信号博弈
5.2.1 “啤酒饼干”博弈与“直观准则”
5.3 声誉模型
5.3.1 “声誉”与连锁店悖论
分离均衡:
• • • •
分离均衡中理智在位者选择原价,因此������ = 0 理智的在位者第一期采用原价的总支付为50 + 50������ 观察到在位者第一期采用低价,进入者认为在位者一定是 疯狂的,因此在第二期会选择不进入,这使得理智在位者 第一期选择低价的总支付为100 + 30������ 分离均衡要求50 + 50������ ≥ 100 + 30������ ,即������ ≤ 0.4

• • •
观察到L后,接受者的最优选择为������。使得类型������1 和������2 的发 送者选择L的支付分别为1和2。
观察到R后,接受者的最优选择为������。使得类型������1 和������2 的发 送者选择R支付分别为1和0 发送者������1 选择R(支付为1)与选择R(支付为1)无差异 发送者������2 选择L(支付为2)优于选择R(支付为0)
������ < ������时,第一类混同均衡中接讯者观察到啤酒(非均衡路
径)后的信念������ ≥ 0.5是不合理的:类型为弱(������1 )的发讯者均衡 中报酬为B+D高于D(这是传递信号啤酒后的最高报酬),根 据直观准则,信念������ = 0 ,因而这个PBE被剔除了。
5.3 声誉模型
• •
进入者的策略{In,c}决定在位者在均衡路径上的信念为������ = 1 > 1/3,给定该信念,进入者的策略{In,c}与在位者的策 略c互为最优反应,得到WPBE ������������, ������ , ������ ; ������ = 1 进入者的策略{Out,c}使得信念出现在非均衡路径上,此 时任意信念为������ < 1/3,进入者的策略{Out,c}与在位者的 策略f互为最优反应,得到WPBE ������������������,������ , ������ ; ������ < 1/3 第二个均衡非均衡路径上的策略������ 使得信念������ = 1,与������ < 1/3矛盾,因此可以去掉 ������������, ������ , ������ ; ������ = 1


给定在位者选������ ,进入者(E)的最优选择是������ ,子博弈上得 到支付3,因此在最初会选择In
给定在位者选������ ,进入者(E)的最优选择是������ ,子博弈上得 到支付-2,因此在最初会选择Out
5.1 不完全信息动态博弈
例5.1.2:吓阻进入(2)
由C3,在均衡路径上,信念由进入者的策略决定
要使得均衡成立,还需要发送者������1选择R,������2选择L为最优。 分离均衡:
������, ������ , ������, ������ ; ������ = 0, ������ = 1
5.2 信号博弈
5.2.1 “啤酒饼干”博弈与“直观准则”
5.2 信号博弈
5.2.1 “啤酒饼干”博弈与“直观准则”
5.2 信号博弈
u
d
(4, 0)
(1,3)
L
[ p]
发送者
R
[q]
u
(2,1)
t1
自然
0.5
d
[1 q]
(0, 0)
(1, 0)
(2, 4)
u
[1 p]
t2 0.5发送者来自u(0,1)d
L
R
d
(1, 2)
5.2 信号博弈
该博弈可能存在的纯策略PBE有。




1、混同于行动L的PBE——无论发送者的类型是t1和t2,发 送者的策略都为(L,L) 2、混同于行动R的PBE——无论发送者的类型是t1和t2,发 送者的策略都为(R,R) 3、分离均衡——类型t1的发送者选择L,类型t2发送者选择R, 发送者的策略都为(L,R) 4、分离均衡——类型t1的发送者选择R,类型t2的发送者选择 L,发送者的策略都为(R,L)
当������ ≤ 0.4时,存在分离均衡
原价, 低价 , 进入, 不进 ; ������ = 0
5.3 声誉模型
5.3.1 “声誉”与连锁店悖论
混同均衡:
• • •
混同均衡中理智在位者选择低价,因此������ = ������ 理智的在位者第一期采用原价的总支付为50 + 50������ 观察到在位者第一期采用低价,进入者认为在位者是理智 的概率为������。此时,其选择不进入的支付为0,选择进入的 支付为������ ∗ 10������ + (1 − ������)(−10������) 。因此若������ ≥ 0.5,进入者 最优选择为进入,从而在位者选择低价的支付为30 + 50������ ;若������ ≤ 0.5,进入者最优选择为不进,从而在位者选择低 价的支付为30 + 100������ 。 混同均衡要求30 + 100������ ≥ 50 + 50������ ,即������ ≥ 0.4
由C4,在非均衡路径上,信念由进入者的策略决定

唯一的均衡PBE为
5.2 信号博弈
信号博弈的一般形式
5.2 信号博弈
信号博弈的一般形式
5.2 信号博弈
信号博弈的均衡
信号传递博弈的所有可能精炼贝叶斯均衡可以划分为三类:
分离均衡、混同均衡和半分离均衡。
• •

分离均衡(Separating Equilibrium):不同类型的发送者以1 的概率选择不同的信号,信号准确地揭示出类型。 混同均衡(Pooling Equilibrium):不同类型的发送者选择 相同的信号,接收者不修正先验概率(发送者的选择没有 信息量)。 半分离均衡(Semi-separating Equilibrium):一些类型的发 送者随机地选择信号,另一类的发送者选择特定的信号。
直观准则 (Intuitive Criterion):如果信息(m)后的信息集合在非
均衡路径上,而且该信息m对类型������������ 的传讯者而言是均衡被占 优的(equilibrium-dominated),即������������ 在均衡路径的报酬高于������������ 发送 信息m之后的最高报酬,那么接讯者观察到信息m后对类型������������ 的 信念应该为0。
发送者������1 选择L(支付为1)优于选择R(支付为0) 发送者������2 选择R(支付为1)的支付低于L(支付为2),从 而无法达成均衡。
5.2 信号博弈
Case 4:分离均衡(R,L)
接受者分别在观察到L和R后形成信念������和������,由于在该情况
相关主题