当前位置:文档之家› 博弈论与信息经济学 第二章 完全信息动态博弈

博弈论与信息经济学 第二章 完全信息动态博弈


(0,0)
21 22 23 24
S1 {开发,开发}—威胁战略 S 2 {开发,不开发}—跟随战略 S 3 {不开发,开发}—差异化战略 S 4 {不开发,不开发}—放弃战略
扩展式表达博弈的纳什均衡
则:
21 22 23 24 21 23 22 24
(即如果A开发,B不开发;如果A不 开发,B开发),因此(开发,{不开
x’
开发 不开发
发,开发})是这个博弈的唯一的子博
弈精炼纳什均衡。
(0,1)
(0,0)
子博弈(c)
子博弈精炼纳什均衡
用逆向归纳法求解子博弈精炼纳什均衡: 假定博弈有两个阶段,第一阶段参与人1行动,第二阶段 参与人2行动,并且2在行动前观测到1的选择。 令A1是参与人1的行动空间,A2是参与人2的行动空间。
(0,0)
子博弈精炼纳什均衡
例:
U (2,0) L 1 D 2 R 1 D’ (0,2)
Step1:参与人1(第二次行动)——U’ Step2:参与人2——L Step3:参与人1——U 所以,精炼均衡({U,U’},L)
(1,1) U’ (3,0)
用逆向归纳法求解子博弈精炼纳什均衡的过程,实质是重复剔除劣 战略过程在扩展式表述博弈上的扩展:从最后一个决策结开始依次剔除 掉每一个子博弈的劣战略,最后生存下来的战略构成精炼纳什均衡。
在扩展式表述博弈中,所有n个参与人的一个纯战略组合s= (si,…,sn)决定了博弈树上的一个路径。每一个战略组合 (即博弈树的路径)决定了一个支付向量u=(u1,…,un)。 战略组合si*是扩展式博弈的一个纳什均衡,如果对于所有 的i,si*最大化 u ( s s ) ,即 i i i
ui ( si s i ) ui ( si s i ).si si
子博弈精炼纳什均衡
现在以上例进行说明:
A
开发
不开发
这个博弈有三个子博弈,除原博弈外,子 博弈(b)和(c)实际上是两个单人博弈(即在 每个博弈中,只有开发商B在决策)。
x’ x
开发 (-3,-3) 不开发 (1,0) 开发 (0,1)
B
开发
B x
开发 不开发
x’
不开发 (0,0)
不开发
(0,1) ( -3 , -3 ) (1,0)
纳什均衡(不开发,{开发,开发})中B的均衡 战略{开发,开发}在子博弈(c)上构成纳什均衡, 但在子博弈(b)上不构成纳什均衡,因此,(不开 发,{开发,开发})不是一个子博弈精炼纳什均 衡; 同理,纳什均衡(开发,{不开发,不开发})中 B的均衡战略{不开发,不开发}在子博弈(b)上构 成纳什均衡,但在子博弈(c)上不构成纳什均衡, 因此, (开发,{不开发,不开发})也不是一个 子博弈精炼纳什均衡。
不开发 开发
(0,1) ( -3 , -3 ) (1,0)
(0,0)
子博弈精炼纳什均衡应用举例
1.斯坦科尔伯格寡头竞争模型 例: 市场上有两家企业,企业 1 首先选择产量
博弈树
博弈的扩展形(即博弈树)构造,包括结、枝和信息集。
(1) 结:包括决策结和终点结两类。决策结是参与人
采取行动的时点,终点结是博弈行动路径的终点。
用 X 所有结的结合, x X 表示某个特定的结。 用 " " x x' '意味着 x在 x ' ' 之前。 表示定义在X上的顺序关系: 假定 " " 满足传递性和反对称性,从而意味着顺序关系 " " 是半序的,即有些结之间是不可比较的。




注意:因为一个参与人的纳什均衡战略是假定其他参与人的战略为给 定时在最优战略,所有参与人似乎时在同时选择战略。但这并意味着 在纳什均衡中,参与人一定是在同时选择行动。
扩展式表达博弈的纳什均衡
在扩展式表述博弈中,混合战略被称为“行为战略”以 区别于战略式表述博弈的混合战略概念。行为战略是指 参与人在每一个信息集上随机地选择行动。一个行为战 略规定了对应每一个信息集的行动集合上的概率分布, 且不同信息集上的概率分布是独立的。每一个行为战略 组合b=(b1,…,bn)给出一个支付空间上的概率分布。 b*=(b1*,…,bn*)是一个行为战略纳什均衡,如果没 有任何参与人可以通过选择其他行为战略增加自己的期 望效用。
博弈树
(3)信息集:博弈树上的所有决策结分割成不同的信息集。 每一个信息集是决策结集合的一个子集,该子集包括所有 满足下列条件的决策结:
①每一个决策结都是同一参与人的决策结。
②该参与人知道博弈进入该集合的某个决策结,但不知道自 己究竟处于哪一个决策结。
引入信息集的目的是描述下列情况:当一个参与人要作出
完美回忆:指没有参与人会忘记自己以前知道的事情,所 有参与人都知道自己以前的选择。
扩展式表达博弈的纳什均衡
为了说明如何从扩展式表达构造战略式表达,让我们考虑 房地产开发博弈的例子。假定在博弈开始之前自然就选择 了“低需求”,并且已成为参与人的共同信息;再假定开 发商A先决策,开发商B在观测到A的选择后决策。那么, 博弈的扩展式表述如图所示。
承诺行动与子博弈精炼纳什均衡
有些纳什均衡之所以不是精炼均衡,是因为他们包含了不可置信的威 胁战略。这一点意味着,如果参与人能在博弈之前采取某种措施改变 自己的行动空间或支付函数,原来不可置信的威胁就可能变得可置信, 博弈的精炼均衡就会相应改变。我们将这些为改变博弈结果而采取的 措施称为“承诺行动”。 有些情况下,一个参与人可以通过减少自己的选择机会使自己受益, 原因在于保证自己不选择某些行动可以改变对手的最优选择。这样的 承诺是完全承诺。
博弈树
( 2 )枝:在博弈树上,枝是从一个决策结到它的直接后续 结的连线(有时用箭头表述),每一个枝代表参与人的一 个行动选择。并且,当且仅当参与人选择不同的行动时, 从一个给定的结出发博弈才会到达不同的直接后续结。博 弈树的枝不仅完整地描述了每个决策结参与人的行动空间, 而且给出了从一个决策结到下一个决策结的路径。正因为 如此,每一个终点结才完全决定了博弈树的路径。
1 2 1 2 1 2 1 2
上例说明:一个行为战略可能对应多个混合战略;但逆定理不成立,即一 个混合战略只对应一个行为战略。
库恩(Kuhn,1953)证明,在完美回忆博弈中,混合战 略和行为战略是等价的。
子博弈精炼纳什均衡
例:
A
开发
从上一节讨论中,可得三个纳什均衡:
不开发
B
开发 不开发 开发
这个博弈的子博弈精炼 纳什均衡为( a1 , a2 (a1 ))。
子博弈精炼纳什均衡
例:
A
开发 不开发
Step1:B的最优行动规则—— 差异化战略S3={不开发,开发}
Step2:A——开发
不开发
B
开发 不开发 开发
B
所以,精炼均衡是(开发,{不 开发,开发})
(0,1) ( -3 , -3 ) (1,0)
博弈论
任课教师: 南京航空航天大学 经管学院
李帮义 教授
博弈论与信息经济学
第二章 完全信息动态博弈
博弈的扩展式表述
博弈的扩展式表述包括以下要素: 1.参与人的集合:i=1,…,n. N—虚拟参与人“自然”。 2.参与人的行动顺序:谁在什么时候行动。 3.参与人的行动空间:在每次行动时,参与人有些什么选择。 4.参与人的信息集:每次行动时,参与人知道些什么。 5.参与人的支付函数:在行动结束之后,每个参与人得到些 什么(支付是所有行动的函数)。 6.外生事件(即自然的选择)的概率分布。
(0,0)
(b)子博弈Ⅰ
(c)子博弈Ⅱ
如前所述,这个博弈有三个纳什均衡:(不开发,{开发,开发}); (开 发,{不开发,开发}); (开发,{不开发,不开发})
子博弈精炼纳什均衡
检验这三个纳什均衡是否满足子博弈精炼纳什均衡的要求。
x
开发 不开发
在子博弈(b),B的最优选择是不开发;在子博 弈(c),B的最优选择是开发。
A
开发 不开发
B
开发 (-3,-3) 不开发 开发
B
不开发 (0,0)
(1,0) (0,1)
这是一个完美信息博弈(每个人的信息集都是单结的)。
扩展式表达博弈的纳什均衡
为了构造出这个博弈的战略式表述,首先注意到,A只有一个 信息集,两个可选择的行动,因而A的行动空间也即战略空 间:SA=(开发,不开发)。但B有两个信息集,每个信息集上 有两个可选择的行动,因而B有四个纯战略,分别为: 1.不论A开发还是不开发,我开发—威胁战略S1=(开发,不开发). 2.A开发我开发,A不开发我不开发—跟随战略S2=(开发,不开发). 3.A开发我不开发,A不开发我开发—差异化战略S3=(不开发,开 发). 4.不论A开发还是不开发,我不开发—放弃战略S4=(不开发,不 开发).
参与人1: 参与人2: Step1:a1 A1源自支付函数 u1 (a1 , a2 )
a2 A2 支付函数 u2 (a1 , a2 )
max u 2 ( a1 , a 2 ) a 2 ( a1 ) a 2 A2
Step2:
maxu1 (a1 , a2 (a1 )) a1
博弈树
定义 P( x) 为在 x 之前的所有结的集合,简称为 x 的前列集。 如果 P( x) ,x 称为初始结。
定义 T ( x) 为在 x 之后的所有结的集合,简称为 x 的后续集。
如果 T ( x) , x 称为终点结。
除了终点结之外的所有结都是决策结。 在图示中,用空心圆“○”代表初始结,实心圆“●” 代表其他决策结。
扩展式表达博弈的纳什均衡
例:
相关主题