当前位置：文档之家› 博弈论与信息经济学第二章完全信息动态博弈

博弈论与信息经济学第二章完全信息动态博弈

（0，0）
21 22 23 24
S1 {开发，开发}—威胁战略 S 2 {开发，不开发}—跟随战略 S 3 {不开发，开发}—差异化战略 S 4 {不开发，不开发}—放弃战略
扩展式表达博弈的纳什均衡
则：
21 22 23 24 21 23 22 24
（即如果A开发，B不开发；如果A不开发，B开发），因此（开发，{不开
x’
开发不开发
发，开发}）是这个博弈的唯一的子博
弈精炼纳什均衡。
（0，1）
（0，0）
子博弈(c)
子博弈精炼纳什均衡
用逆向归纳法求解子博弈精炼纳什均衡：假定博弈有两个阶段，第一阶段参与人1行动，第二阶段参与人2行动，并且2在行动前观测到1的选择。令A1是参与人1的行动空间，A2是参与人2的行动空间。
（0，0）
子博弈精炼纳什均衡
例：
U (2,0) L 1 D 2 R 1 D’ (0,2)
Step1：参与人1（第二次行动）——U’ Step2：参与人2——L Step3：参与人1——U 所以，精炼均衡（{U,U’}，L）
(1,1) U’ (3,0)
用逆向归纳法求解子博弈精炼纳什均衡的过程，实质是重复剔除劣战略过程在扩展式表述博弈上的扩展：从最后一个决策结开始依次剔除掉每一个子博弈的劣战略，最后生存下来的战略构成精炼纳什均衡。
在扩展式表述博弈中，所有n个参与人的一个纯战略组合s= （si,…,sn）决定了博弈树上的一个路径。每一个战略组合（即博弈树的路径）决定了一个支付向量u=（u1,…,un）。战略组合si*是扩展式博弈的一个纳什均衡，如果对于所有的i，si*最大化 u ( s s ) ，即 i i i
ui ( si s i ) ui ( si s i ).si si
子博弈精炼纳什均衡
现在以上例进行说明：
A
开发
不开发
这个博弈有三个子博弈，除原博弈外，子博弈(b)和(c)实际上是两个单人博弈（即在每个博弈中，只有开发商B在决策）。
x’ x
开发（-3，-3）不开发（1，0）开发（0，1）
B
开发
B x
开发不开发
x’
不开发（0，0）
不开发
（0，1）（ -3 ， -3 ）（1，0）
纳什均衡（不开发，{开发，开发}）中B的均衡战略{开发，开发}在子博弈(c)上构成纳什均衡，但在子博弈(b)上不构成纳什均衡，因此，（不开发，{开发，开发}）不是一个子博弈精炼纳什均衡；同理，纳什均衡（开发，{不开发，不开发}）中 B的均衡战略{不开发，不开发}在子博弈(b)上构成纳什均衡，但在子博弈(c)上不构成纳什均衡，因此，（开发，{不开发，不开发}）也不是一个子博弈精炼纳什均衡。
不开发开发
（0，1）（ -3 ， -3 ）（1，0）
（0，0）
子博弈精炼纳什均衡应用举例
1.斯坦科尔伯格寡头竞争模型例：市场上有两家企业，企业 1 首先选择产量
博弈树
博弈的扩展形（即博弈树）构造，包括结、枝和信息集。
（1）结：包括决策结和终点结两类。决策结是参与人
采取行动的时点，终点结是博弈行动路径的终点。
用 X 所有结的结合， x X 表示某个特定的结。用 " " x x' '意味着 x在 x ' ' 之前。表示定义在X上的顺序关系：假定 " " 满足传递性和反对称性，从而意味着顺序关系 " " 是半序的，即有些结之间是不可比较的。

注意：因为一个参与人的纳什均衡战略是假定其他参与人的战略为给定时在最优战略，所有参与人似乎时在同时选择战略。但这并意味着在纳什均衡中，参与人一定是在同时选择行动。
扩展式表达博弈的纳什均衡
在扩展式表述博弈中，混合战略被称为“行为战略”以区别于战略式表述博弈的混合战略概念。行为战略是指参与人在每一个信息集上随机地选择行动。一个行为战略规定了对应每一个信息集的行动集合上的概率分布，且不同信息集上的概率分布是独立的。每一个行为战略组合b=（b1，…，bn）给出一个支付空间上的概率分布。 b*=（b1*，…，bn*）是一个行为战略纳什均衡，如果没有任何参与人可以通过选择其他行为战略增加自己的期望效用。
博弈树
（3）信息集：博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集，该子集包括所有满足下列条件的决策结：
①每一个决策结都是同一参与人的决策结。
②该参与人知道博弈进入该集合的某个决策结，但不知道自己究竟处于哪一个决策结。
引入信息集的目的是描述下列情况：当一个参与人要作出
完美回忆：指没有参与人会忘记自己以前知道的事情，所有参与人都知道自己以前的选择。
扩展式表达博弈的纳什均衡
为了说明如何从扩展式表达构造战略式表达，让我们考虑房地产开发博弈的例子。假定在博弈开始之前自然就选择了“低需求”，并且已成为参与人的共同信息；再假定开发商A先决策，开发商B在观测到A的选择后决策。那么，博弈的扩展式表述如图所示。
承诺行动与子博弈精炼纳什均衡
有些纳什均衡之所以不是精炼均衡，是因为他们包含了不可置信的威胁战略。这一点意味着，如果参与人能在博弈之前采取某种措施改变自己的行动空间或支付函数，原来不可置信的威胁就可能变得可置信，博弈的精炼均衡就会相应改变。我们将这些为改变博弈结果而采取的措施称为“承诺行动”。有些情况下，一个参与人可以通过减少自己的选择机会使自己受益，原因在于保证自己不选择某些行动可以改变对手的最优选择。这样的承诺是完全承诺。
博弈树
（ 2 ）枝：在博弈树上，枝是从一个决策结到它的直接后续结的连线（有时用箭头表述），每一个枝代表参与人的一个行动选择。并且，当且仅当参与人选择不同的行动时，从一个给定的结出发博弈才会到达不同的直接后续结。博弈树的枝不仅完整地描述了每个决策结参与人的行动空间，而且给出了从一个决策结到下一个决策结的路径。正因为如此，每一个终点结才完全决定了博弈树的路径。
1 2 1 2 1 2 1 2
上例说明：一个行为战略可能对应多个混合战略；但逆定理不成立，即一个混合战略只对应一个行为战略。
库恩（Kuhn，1953）证明，在完美回忆博弈中，混合战略和行为战略是等价的。
子博弈精炼纳什均衡
例：
A
开发
从上一节讨论中，可得三个纳什均衡：
不开发
B
开发不开发开发
这个博弈的子博弈精炼纳什均衡为（ a1 , a2 (a1 )）。
子博弈精炼纳什均衡
例：
A
开发不开发
Step1：B的最优行动规则—— 差异化战略S3={不开发，开发}
Step2：A——开发
不开发
B
开发不开发开发
B
所以，精炼均衡是（开发，{不开发，开发}）
（0，1）（ -3 ， -3 ）（1，0）
博弈论
任课教师：南京航空航天大学经管学院
李帮义教授
博弈论与信息经济学
第二章完全信息动态博弈
博弈的扩展式表述
博弈的扩展式表述包括以下要素： 1.参与人的集合：i=1,…,n. N—虚拟参与人“自然”。 2.参与人的行动顺序：谁在什么时候行动。 3.参与人的行动空间：在每次行动时，参与人有些什么选择。 4.参与人的信息集：每次行动时，参与人知道些什么。 5.参与人的支付函数：在行动结束之后，每个参与人得到些什么（支付是所有行动的函数）。 6.外生事件（即自然的选择）的概率分布。
（0，0）
(b)子博弈Ⅰ
(c)子博弈Ⅱ
如前所述，这个博弈有三个纳什均衡：（不开发，{开发，开发}）；（开发，{不开发，开发}）；（开发，{不开发，不开发}）
子博弈精炼纳什均衡
检验这三个纳什均衡是否满足子博弈精炼纳什均衡的要求。
x
开发不开发
在子博弈(b)，B的最优选择是不开发；在子博弈(c)，B的最优选择是开发。
A
开发不开发
B
开发（-3，-3）不开发开发
B
不开发（0，0）
（1，0）（0，1）
这是一个完美信息博弈（每个人的信息集都是单结的）。
扩展式表达博弈的纳什均衡
为了构造出这个博弈的战略式表述，首先注意到，A只有一个信息集，两个可选择的行动，因而A的行动空间也即战略空间：SA=(开发，不开发)。但B有两个信息集，每个信息集上有两个可选择的行动，因而B有四个纯战略，分别为： 1.不论A开发还是不开发，我开发—威胁战略S1=(开发,不开发). 2.A开发我开发，A不开发我不开发—跟随战略S2=(开发,不开发). 3.A开发我不开发，A不开发我开发—差异化战略S3=(不开发,开发). 4.不论A开发还是不开发，我不开发—放弃战略S4=(不开发,不开发).
参与人1：参与人2： Step1：a1 A1源自支付函数 u1 (a1 , a2 )
a2 A2 支付函数 u2 (a1 , a2 )
max u 2 ( a1 , a 2 ) a 2 ( a1 ) a 2 A2
Step2：
maxu1 (a1 , a2 (a1 )) a1
博弈树
定义 P( x) 为在 x 之前的所有结的集合，简称为 x 的前列集。如果 P( x) ，x 称为初始结。
定义 T ( x) 为在 x 之后的所有结的集合，简称为 x 的后续集。
如果 T ( x) ， x 称为终点结。
除了终点结之外的所有结都是决策结。在图示中，用空心圆“○”代表初始结，实心圆“●” 代表其他决策结。
扩展式表达博弈的纳什均衡
例：

e商务文档

博弈论与信息经济学第二章完全信息动态博弈

相关文档推荐：

e商务文档

博弈论与信息经济学 第二章 完全信息动态博弈

相关文档推荐：

博弈论与信息经济学第二章完全信息动态博弈