当前位置：文档之家› Lecture 5 不完全信息动态博弈

Lecture 5 不完全信息动态博弈

5.2 信号博弈
Case 1：混同于行动L的PBE
接受者分别在观察到L和R后形成信念��和��，由于在该情况
下，发送者都选择L，因此�� = 0.5（没有信念更新）。要使得均衡成立，需要接受者在给定信念下达到最优选择
•
•
要使得均衡成立，还需要发送者选择L比选择R要好。混同均衡：
• •
（（强势进入，合作）；p=1）求解PBE时，一定要列举出信念
择价格战的支付为-1，因此在位者的最优选择是合作。给定在位者选择合作，进入者会选择强势进入。
5.1 不完全信息动态博弈
例5.1.2：吓阻进入（2）
5.1 不完全信息动态博弈
例5.1.2：吓阻进入（2）
由C1，在位者（I）形成信念 �� 和 1 − ��，分别为��和��的概率由C2，给定信念，在位者（I）的期望支付为
��, �� , ��, �� ; �� = 0.5, �� ≤ 2/3
5.2 信号博弈
Case 2：混同于行动R的PBE
接受者分别在观察到L和R后形成信念��和��，由于在该情况
下，发送者都选择R，因此�� = 0.5（没有信念更新）。要使得均衡成立，需要接受者在给定信念下达到最优选择
•
显然当�� ≤ 2/3时，两种类型的发送者选择L会更好
观察到L后，接受者选择��的支付为3∗0.5+4∗0.5=3.5，选择�� 的支付为0∗0.5+1∗0.5=0.5，从而最优选择为��。使得在均衡路径上类型��1 和��2 的发送者支付分别为1和2。观察到R后，给定信念��，接受者选择��的支付为��，选择�� 的支付为2(1−��)。若�� ≥ 2/3，接受者的最优选择为��，类型��1 和��2 的发送者支付分别为2和1；若�� ≤ 2/3，接受者的最优选择为�� ，类型��1 和��2 的发送者支付分别为0和1
5.1 不完全信息动态博弈
例5.1.1：吓阻进入
5.1 不完全信息动态博弈
例5.1.1：吓阻进入（1）
由C1，在位者（I）形成信念 ��和 1 − ��，分别为强势进入和
弱势进入的概率：
由C2，给定信念，在位者选择合作的期望支付为1 − ��，选由C3，在均衡路径上，信念由进入者的策略决定p=1 均衡
若�� < ��，不存在分离均衡，存在两类混同均衡
饼干, 饼干 , 决斗, 不决斗 ; �� = 0.1, �� ≥ 0.5
啤酒, 啤酒 , 决斗, 不决斗 ; �� ≥ 0.5, �� = 0.1
5.2 信号博弈
5.2.1 “啤酒饼干”博弈与“直观准则”
5.3 声誉模型
5.3.1 “声誉”与连锁店悖论
分离均衡：
• • • •
分离均衡中理智在位者选择原价，因此�� = 0 理智的在位者第一期采用原价的总支付为50 + 50�� 观察到在位者第一期采用低价，进入者认为在位者一定是疯狂的，因此在第二期会选择不进入，这使得理智在位者第一期选择低价的总支付为100 + 30�� 分离均衡要求50 + 50�� ≥ 100 + 30�� ，即�� ≤ 0.4
•
• • •
观察到L后，接受者的最优选择为��。使得类型��1 和��2 的发送者选择L的支付分别为1和2。
观察到R后，接受者的最优选择为��。使得类型��1 和��2 的发送者选择R支付分别为1和0 发送者��1 选择R（支付为1）与选择R（支付为1）无差异发送者��2 选择L（支付为2）优于选择R（支付为0）
�� < ��时，第一类混同均衡中接讯者观察到啤酒（非均衡路
径）后的信念�� ≥ 0.5是不合理的：类型为弱(��1 )的发讯者均衡中报酬为B＋D高于D（这是传递信号啤酒后的最高报酬），根据直观准则，信念�� = 0 ，因而这个PBE被剔除了。
5.3 声誉模型
• •
进入者的策略{In，c}决定在位者在均衡路径上的信念为�� = 1 > 1/3，给定该信念，进入者的策略{In，c}与在位者的策略c互为最优反应，得到WPBE ��, �� , �� ; �� = 1 进入者的策略{Out，c}使得信念出现在非均衡路径上，此时任意信念为�� < 1/3，进入者的策略{Out，c}与在位者的策略f互为最优反应，得到WPBE ��，�� , �� ; �� < 1/3 第二个均衡非均衡路径上的策略�� 使得信念�� = 1，与�� < 1/3矛盾，因此可以去掉 ��, �� , �� ; �� = 1
•
•
给定在位者选�� ，进入者（E）的最优选择是�� ，子博弈上得到支付3，因此在最初会选择In
给定在位者选�� ，进入者（E）的最优选择是�� ，子博弈上得到支付-2，因此在最初会选择Out
5.1 不完全信息动态博弈
例5.1.2：吓阻进入（2）
由C3，在均衡路径上，信念由进入者的策略决定
要使得均衡成立，还需要发送者��1选择R，��2选择L为最优。分离均衡：
��, �� , ��, �� ; �� = 0, �� = 1
5.2 信号博弈
5.2.1 “啤酒饼干”博弈与“直观准则”
5.2 信号博弈
5.2.1 “啤酒饼干”博弈与“直观准则”
5.2 信号博弈
u
d
(4, 0)
(1,3)
L
[ p]
发送者
R
[q]
u
(2,1)
t1
自然
0.5
d
[1 q]
(0, 0)
(1, 0)
(2, 4)
u
[1 p]
t2 0.5发送者来自u(0,1)d
L
R
d
(1, 2)
5.2 信号博弈
该博弈可能存在的纯策略PBE有。
•
•
•
•
1、混同于行动L的PBE——无论发送者的类型是t1和t2，发送者的策略都为（L,L) 2、混同于行动R的PBE——无论发送者的类型是t1和t2，发送者的策略都为（R,R) 3、分离均衡——类型t1的发送者选择L,类型t2发送者选择R, 发送者的策略都为（L,R) 4、分离均衡——类型t1的发送者选择R,类型t2的发送者选择 L,发送者的策略都为（R,L)
当�� ≤ 0.4时，存在分离均衡
原价, 低价 , 进入, 不进 ; �� = 0
5.3 声誉模型
5.3.1 “声誉”与连锁店悖论
混同均衡：
• • •
混同均衡中理智在位者选择低价，因此�� = �� 理智的在位者第一期采用原价的总支付为50 + 50�� 观察到在位者第一期采用低价，进入者认为在位者是理智的概率为��。此时，其选择不进入的支付为0，选择进入的支付为�� ∗ 10�� + (1 − ��)(−10��) 。因此若�� ≥ 0.5，进入者最优选择为进入，从而在位者选择低价的支付为30 + 50�� ；若�� ≤ 0.5，进入者最优选择为不进，从而在位者选择低价的支付为30 + 100�� 。混同均衡要求30 + 100�� ≥ 50 + 50�� ，即�� ≥ 0.4
由C4，在非均衡路径上，信念由进入者的策略决定
•
唯一的均衡PBE为
5.2 信号博弈
信号博弈的一般形式
5.2 信号博弈
信号博弈的一般形式
5.2 信号博弈
信号博弈的均衡
信号传递博弈的所有可能精炼贝叶斯均衡可以划分为三类：
分离均衡、混同均衡和半分离均衡。
• •
•
分离均衡（Separating Equilibrium）：不同类型的发送者以1 的概率选择不同的信号，信号准确地揭示出类型。混同均衡（Pooling Equilibrium）：不同类型的发送者选择相同的信号，接收者不修正先验概率（发送者的选择没有信息量）。半分离均衡（Semi-separating Equilibrium）：一些类型的发送者随机地选择信号，另一类的发送者选择特定的信号。
直观准则 (Intuitive Criterion)：如果信息(m)后的信息集合在非
均衡路径上，而且该信息m对类型�� 的传讯者而言是均衡被占优的(equilibrium-dominated)，即�� 在均衡路径的报酬高于�� 发送信息m之后的最高报酬，那么接讯者观察到信息m后对类型�� 的信念应该为0。
发送者��1 选择L（支付为1）优于选择R（支付为0）发送者��2 选择R（支付为1）的支付低于L（支付为2），从而无法达成均衡。
5.2 信号博弈
Case 4：分离均衡（R，L）
接受者分别在观察到L和R后形成信念��和��，由于在该情况

e商务文档

Lecture 5 不完全信息动态博弈

相关文档推荐：