当前位置:文档之家› 不完全信息动态博弈(续1)——信号博弈

不完全信息动态博弈(续1)——信号博弈


例题

下图是一个信号传递博弈:自然首先选择参与人1的类型,参与 人1知道自然的选择,参与人2 不知道,只知道参与人1属于类型 t1和t1的可能性相等,参与人1然后选择信号m1或m2,参与人2选 择行动a1或a2,博弈结束,支付向量如图所示,给出这个博弈所 有纯战略分离均衡和混同均衡。
1 1 2 t 2 2 2 p ( t m ) u ( m , a , t ) u ( m , a, t 2 ) 2 2 t
即: a* (m1 ) arg max u2 (m1 , a, t1 )
a
a* (m 2 ) arg max u2 (m 2 , a, t2 )
a
准分离均衡(semi-separating equilibrium):
m2
2 [1-q] a1 a2
信号传递博弈实际上是不完全信息情况 下的Stackelberg博弈
信号发出者是领头者(leader),信号接收者是尾随者 (Follower)。 当参与人1发出信号时,他预测到参与人2将根据他发出的信 号修正对自己类型的判断,因而他的问题是如何选择一个 最优的类型依存信号战略m*(tj)? 同样,参与人2知道参与人1选择的是给定类型和考虑信息效 应情况下的最优战略,因此他的问题是使用Bayes法则修 正对参与人1类型的判断,选择自己的最优行动a*(m)。
μ<1/2时,精练贝叶斯均衡为: 不论是高成本还是低成本,在 位者选择p=5;进入者进入, 当且仅当进入者观察到p=6(基 于(6)=1)。 混同均衡
N
[μ ] 高 低 [1-μ]
μ≥1/2时,精练贝叶斯均衡为: 低成本在位者选择p=4,高成本 在位者选择p=6;进入者选择不 进入,如果观测到p=4;进入者 选择进入,如果观测到p=6或 p=5(基于 (6)=1, (5)≥1/2)。 在位者 p=5 分离均衡 p=6
即: a* (m1 ) arg max[ p(t1 )u2 ( m1 , a, t1 ) p(t2 )u2 ( m1 , a, t2 )]
a
a* (m 2 ) arg max[ p(t1 )u2 ( m 2 , a, t1 ) p(t2 )u2 ( m 2 , a, t2 )]
a
在K=J=2时: 分离均衡
不同类型的发送者(参与人1)以概率1选择发送 不同的信号,这时信号准确地揭示出类型, u1(m1,a*(m),t1)>u1(m2,a*(m),t1); u1(m2,a*(m),t2)>u1(m1,a*(m),t2); 因此,后验概率是: p(t1|m1)=1,p(t1|m2)=0; p(t2|m1)=0,p(t2|m2)=1。
目录导航


一 精练贝叶斯纳什均衡
基本思路
贝叶斯法则
精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡

二 信号传递博弈及其应用举例
精练贝叶斯纳什均衡的定义
定义:精炼贝叶斯均衡是一个战略组合 s*( ) (s1*(1), pn ,满足: 和一个后验概率组合p= p1 (P)对于所有的参与人i,在每一个信息集h, h si ( si , i ) arg max pi ( i a i )ui ( si , s i , i )
p
(t1|m1)=
p(t1 ) 0 p(t2 )
p(t1 )
1
(1 ) p(t1 ) p(t1 ) 2 P (t1|m )= (1 ) p(t ) 1 p(t ) 1 2
P
(t2|m2)=
1 p(t2 ) p(t2 ) (1 ) p(t1 ) 1 p(t2 )
(4)双方的得益函数为u1(m,a,t)和u2(m,a,t )。 下图是一个简单的信号传递博弈的展开式表述,这 里K=J=H=2,p=p(t1|m1),q=p(ti|m2)(省略 了得益):
t1
1 N
[p]
t2
[1-p]
1
m1
[P]2 a1 a2
m2
[ q] 2 a1 a2
m1
[1-p] 2 a1 a2
在K=J=2时信号传递博弈的四种纯战略

信号接受者(参与人2)的四种纯战略:
战略1(总是选择a1):如果发送者选择信号m1,选择行动 a1;如果发送者选择信号m2,选择行动a1 。 战略2 (跟随mi选择ai) :如果发送者选择信号m1,选择 行动a1;如果发送者选择信号m2,选择行动a2。 战略3 (与mi相反选择aj,i≠j) :如果发送者选择信号m1, 选择行动a2;如果发送者选择信号m2,选择行动a1。
在K=J=2时的分离均衡
后验概率 p(t1|m1)=1,p(t1|m2)=0; p(t2|m1)=0,p(t2|m2)=1。 意味着:
p(t m)u (m, a, t ) p(t
2 t
1
m)u2 ( m, a, t1 ) p (t2 m)u2 ( m, a, t 2 )
1 2 1
从而
p(t m )u (m , a, t ) u (m , a, t )
(3,1)
参与人? 博弈顺序? 博弈结果? 市场进入博弈-2阶段不完全信息动态博弈
(7,0) (5,-1) (9,0) (5,-1)
(9,0) (5,-1)
(9,0)
信号博弈模型描述
假设: (1)参与人1的类型为ti∈T={t1,t2,…,tK} 参与人1知道ti,但参与人2不知道,只知道1的类型的先验概 率p(ti), Σp(ti)=1。 (2)参与人1在知道自己的类型后选择发出信号m∈M={m1, m2,…,mJ}。 (3)参与人2观测到参与人1发出的信号(但不是类型) 使用Bayes法则从先验概率p=p(ti)得到后验概率p=p(ti|m), 然后选择行动a∈A={a1,a2,…,aH};
即看到m1就知 道参与人1是 类型t1的;看 到m2就不能确 定1的类型, 但会推断属于 1的概率下降, 属于2的概率 上升了。
关于信号博弈模型的均衡
在所有上述三个定义中,都应该适当加 上参与人2的最优化条件和非均衡路径 上的后验概率。在只有两个类型和两 个信号的情况(即J=K=H=2)下,只 有混同均衡有非均衡路径,分离均衡 和准分离均衡的所有信息集都在均衡 路径上。但一般说来,如果信号的种 类多于类型的种类,每种均衡下均有 非均衡路径。



在K=J=2时的信号传递博弈模型
这里p=p(t1|m1),q=p(ti|m2)(省略了得益):
t1m1
[P]2 a1 a2
m2
[ q] 2 a1 a2
m1
[1-p] 2 a1 a2
m2
2 [1-q] a1 a2
在K=J=2时信号传递博弈的四种纯战略


信号发送者(参与人1)的四种纯战略:
一些类型的发送者随机地发送信号,另 一些类型的发送者选择特定的信号。 假定类型t1的发送者以概率分布( , 1- )随机地选择 m1或m2,类型t2的 发送者以概率1选择m2。如果这个策 略组合是均衡策略组合,那么:
准分离均衡
u1(m1, a*(m),t1)=u1(m2, a*(m),t1) u1(m1, a*(m),t2)<u1(m2, a*(m),t2)
2 t
从而
1 1 1 1 p ( t m ) u ( m , a , t ) p ( t ) u ( m , a , t ) p ( t ) u ( m , a, t 2 ) 2 1 2 1 2 2 t 2 2 2 2 p ( t m ) u ( m , a , t ) p ( t ) u ( m , a , t ) p ( t ) u ( m , a, t 2 ) 2 1 2 1 2 2 t
( P2 )a (m) arg max a p
* t * *
(ti | m)u2 (m, a, ti );
(P 1 ) m (t ) arg max m u1 ( m, a , ti ); ( B) p(t | m)是参与人2使用Bayes法则得到的.

精练贝叶斯均衡

信号传递博弈的所有可能的精练贝叶斯均 衡可以划分为3类:
在位者
p=4 p=5 p=6
在位者
p=4
进入者
进入 不进入 进入 不进入 进入
不进入
不进入 进入
不进入
进入
不进入
进入
(2,0) (2,0)
(6,0)
(6,0)
(7,0)
(7,0)
(6,0)
(6,0)
(9,0)
(9,0) (8,0)
(8,0)
第一阶段 第二阶段
(3,1) (7,0) (3,1) (7,0)
p(tk|mj)≡p(tk)
在K=J=2时的混同均衡
后验概率 p(t1|m1)=p(t1), p(t1|m2)=p(t1); p(t2|m1)=p(t2), p(t2|m2)=p(t2)。 意味着:
2 1 2 1 2 2
p(t m)u (m, a, t ) p(t )u (m, a, t ) p(t )u (m, a, t )
——此处参与人的最优是指根据修正概率计算的期望支付最优。
其中:m(t)是参与人1的类型依存信号策略,a(m)是参与人2 的行为策略(允许混合策略)。
信号传递博弈的精练Bayes均衡定义
定义: 信号传递博弈的精练Bayes均衡是战略组 合(m*(t),a*(m))和后验概率p(ti|m)的结合, 它满足:
信号传递博弈及其应用举例


信号传递博弈是一种比较简单的但有广泛应用意义的 不完全信息动态博弈。 它是由两阶段市场在位者和进入者博弈衍生出来的一 类特定背景下的博弈,并在许多领域如劳动力市场招 聘者和应聘者博弈、二手车市场博弈等等有广泛应用
相关主题