当前位置：文档之家› 子博弈精炼Nash均衡

子博弈精炼Nash均衡

-400,-400 0,200
-400,-400 0， 0
200,0 0,200
200,0 0， 0
• 该博弈存在三个Nash均衡——(开发，(不开发，开发))、(开发，(不开发，不开发))和(不开发， (开发，开发))，但这三个均衡是否都是合理的呢？
• 在“新产品开发博弈”中，如果市场需求小，那么就只能一个企业开发，另一个企业不开发，问题在于谁选择开发，谁选择不开发。
Nash均衡： (开发，(开发，开发))和(开发，(开发，不开发))
企业1
开发
x1 不开发
企业2 x2
x3 企业 2
开发
不开发开发不开发
x4
x5 x6
x7
3 0 0 ,3 0 0 8 0 0 ,0
0 ,8 0 0 0 ,0
• 虽然(开发， (开发，不开发))是Nash均衡，但并不是子博弈精炼Nash均衡。
开发企业 1
不开发
300， 300 0， 800
300， 300 0， 0
800， 0 0， 800
800， 0 0， 0
• 博弈存在两个Nash均衡——(开发，(开发，开发))和(开发，(开发，不开发))，其中均衡(开发，(开发，不开发))要求企业2采取战略“企业1开发自己就开发，企业1 不开发自己也不开发”。
• 作为求解子博弈精炼Nash均衡的方法，逆推归纳法可以将Nash均衡中的“不可置信的威胁”剔除掉。
例：
1
C
2
A x1
x2
D
B
1 ,2
0 ,0
2 ,1
A 1
B
2
C
D
0, 0
2, 1
1, 2
1, 2
• 战略组合(A,D)和(B,C)都是Nash均衡，但是，只有(A,D)为子博弈精炼Nash均衡。
子博弈精炼Nash均衡
主要内容：一、子博弈精炼Nash均衡二、子博弈精炼Nash均衡的求解三、承诺行动与要挟诉讼
一、子博弈精炼Nash均衡
• 博弈论的研究目的是寻找博弈的解。在静态博弈中我们将Nash均衡作为博弈的解，但纳什均衡作为博弈的解面临一个很大的问题——多重性问题。
• 当我们将Nash均衡作为扩展式博弈的解时，同样也会遇到Nash均衡的多重性问题，而且在多个Nash均衡中有些是明显不合理的。
(2)子博弈 ( x 3 )
例2：找出下列博弈的子博弈
1
1
E x7
3 ,0
C
2
A x1 B
x2
x4
D 2 ,1
x3 F
1 ,1 x 5
x6
1 ,2
该博弈存在3个子博弈：除了原博弈自己以外，还存在下面两个子博弈。
2
x2
C
D
1 x3
x5
1 ,1EFra bibliotekFx7
3 ,0
x6
1 ,2
1 x3
E
F
x7
3 ,0
新产品开发博弈
购买
企业2 x0
不购买
企业1
开发
x1
不开发
企业2 开发
x2
x3
不开发开发
企业2 不开发
开发
企业1 x4 不开发
企业2 开发
x5
x6
不开发开发
企业2 不开发
-300,-400 -500,200 300,0
-500,0
• 但是，如果在博弈开始之前，企业2采取某种行动使自己的支付(或行动空间)发生改变，那么原来不可置信的威胁就有可能变得可信。
新产品开发博弈的再考察
• 假设企业投入的2000万元中，有1000万元用来购买研发设备(即固定成本)，另外1000万元用来支付新产品开发中的人力、原材料等投入(即可变成本)。
子博弈的概念
• 子博弈：是原博弈的一部分，它始于原博弈中一个单结信息集中的决策结x，并由决策结x及其后续结共同组成。一般用 ( x i )表示博弈树中始于决策结xi的一个子博弈。
• 注意：1）子博弈可以作为一个独立的博弈进行分析，并且与原博弈具有相同的信息结构；2）原博弈可以作为自身的一个子博弈；
• 因为在(B,C)中，包含了参与人2不可置信的威胁：当参与人1在决策结x1选择A时，参与人2在决策结选择C。事实上，只要博弈达到决策结x2，参与人2的理性选择就是 D。
三、承诺行动与要挟诉讼
• 前面分析的“新产品开发”博弈提到，当市场需求小时，Nash均衡(不开发，(开发，开发)) 由于含有不可置信的威胁(即企业1选择“开发” 时，企业2仍选择“开发”)，而不是子博弈精炼Nash均衡。
• 解决Nash均衡多重性问题的一种主要方法就是精炼的方法，即在Nash均衡的基础上，通过定义更加合理的博弈解并剔除不合理的均衡。
• Selten在1965年提出的“子博弈精炼Nash均衡”(subgame perfect Nash equlibrium)的概念，就是这样一种新的纳什均衡解，我们首先给出子博弈的定义。
• 由于参与人i选择行动L时使博弈进入了子博弈Γ(xi+1) ，因此，参与人i选择行动L的结果就是得到子博弈Γ(xi+1) 。
• 同样，参与人i选择行动R的结果就是得到子博弈Γ(xi+2) 。
• 所以，参与人i在信息集Ii ({xi})上的最优选择，取决于参与人i在信息集Ii ({xi})上可能采取的行动所导致的各个子博弈。
• 在市场需求小的“新产品开发博弈”中， (开发，(不开发，开发))为子博弈精炼Nas h均衡，该均衡不仅在均衡路x径1 x2 x5 上而且在任一非均衡路径上，都能给出参与人的最优决策。
• Nash均衡(开发，(不开发，不开发))虽然在均衡路径 x1 x2 x5上给出了参与人的最优决策，但却包含了参与人在非均衡路径上的不合理选择：当企业1选择“不开发”时，企业2也选择“不开发”。
市场开发博弈——市场需求小
子博弈精炼纳什均衡的理解
• 只有当一个战略规定的行动在所有可能的情况下都为最优时，它才是一个合理的、可置信的战略。
• 子博弈精炼纳什均衡就是要剔除那些只在特定情况下合理而在其他情况下并不合理的行动规则。
二、子博弈精炼Nash均衡的求解
• 逆推归纳法是最常用的求解子博弈精炼 Nash均衡的方法。
• 假设企业提前购买研发设备(即在决定是否开发之前就购买)，可得到一定的优惠，只需900万元即可。但是如果企业购买了设备而决定“不开发”，那么所购买的研发设备就只能当“废品”处理，收回400万元。
考察如下博弈情形：
• 企业1先选择是否开发，企业2观测到企业1的决策后选择是否开发，但在企业1 决策之前，企业2可以决定是否提前购买研发设备。
• 再求解子博弈Γ(x2) ，容易得到博弈的结果为(1,1)(即参与人2选择D)；
• 最后求解原博弈即子博弈Γ(x1) ，得到博弈的结果为(2,1) (即参与人1选择B)。
一般情形：
i
L
xi
R
j
L xi1 R
j
L xi2 R
• 参与人i在信息集Ii ({xi})选择行动L还是行动R，取决于选择行动L和行动R所引致的后续结果。
市场开发博弈——市场需求大
Nash均衡：(开发，(不开发，开发))、(开发，(不开发，不开发))、(不开发，(开发，开发))
企业1
开发
x1
不开发
企业2 开发
x2 不开发
x3 企业 2
开发
不开发
x4
-4 0 0 ,-4 0 0
x5
2 0 0 ,0
x6
0 ,2 0 0
x7
0 ,0
• 虽然(不开发，(开发，开发))和 (开发，(不开发，不开发))是Na sh均衡，但并不是子博弈精炼纳什均衡。
x9
4,1
• 由于子博弈精炼Nash均衡在任一决策结上都能给出最优决策，这也使得子博弈精炼纳什均衡不仅在均衡路径(即均衡战略组合所对应的路径)上给出参与人的最优选择，而且在非均衡路径(即除均衡路径以外的其它路径)上也能给出参与人的最优选择。
• 所以，子博弈精炼Nash均衡不会含有参与人在博弈进程中不合理的、不可置信的行动。这就是子博弈精炼Nash均衡与Nash均衡的实质性区别。
• 这意味着，参与人i在信息集Ii ({xi})上的最优选择，一定是使博弈进入能给自己带来
最大支付的子博弈。
• 因此，为了确定参与人i在信息集Ii ({xi})上的选择，就必须先求解参与人i在信息集Ii ({xi})上可能采取的行动所导致的各个子博弈。
• 由以上分析可得求解有限扩展式博弈的一般步骤：
• 对于先行动的企业1来讲，只要自己选择 “开发”，理性的企业2就只会选择“不开发” ，所以，均衡(不开发，(开发，开发))是不合理的。
• 对于企业2来讲，企业1开发自己当然不能开发，如果企业1不开发自己显然应该开发。均衡(开发，(不开发，不开发))也是不合理的。因此，合理的Nash均衡是(开发， (不开发，开发))。
• 逆推归纳法对于完美信息(perfect information)博弈问题尤为适用，但在有些情形下，对于不完美信息博弈，也能运用逆推归纳法进行求解。
例：
1
1
E 3 ,0 x 7
C
2
A x1 B
x2
x4
D 2 ,1
x3 F
1 ,1 x 5
1
x
,2
6
由以上分析可以得到博弈的求解过程：
• 首先求解博弈树中最底层的子博弈Γ(x3)，得到子博弈Γ(x3)的结果为(3,0) (即参与人1 选择E)；

e商务文档

子博弈精炼Nash均衡

相关文档推荐：