当前位置：文档之家› 5 同时博弈与序贯博弈

5 同时博弈与序贯博弈

第五章同时博弈与序贯博弈
目录
•5-1 正规型表示与展开型表示–树型表示转化为矩阵表示
–矩阵表示转化为树型表示：信息集•5-2 同时决策与序贯决策的混合博弈•5-3 树型博弈的子博弈
•5-4 子博弈精炼纳什均衡
•5-6 连续支付情形的序贯博弈
5-1 正规型表示与展开型表示•1.树型表示转化为矩阵表示
•“进入者”只有一个决策节点，他有两个纯策略可以选择：进入和不进入。

•“垄断者”有四个可能的纯策略：
–{容忍，容忍}、{对抗，对抗}、{对抗，容忍}、{容忍，对抗}。

•把首先行动的局中人放在行局中人的位置，后行动的局中人放在列局中人的位置。

•垄断者有不止一个纯策略可以导致相同的博弈结果。

•步骤：首先确定好可供每个局中人选择的纯策略的总数目，从而把表格的大小确定下来，然后在每个策略组合所对应的格子中，按照约定的规格填入相应的支付向量。

•2.矩阵表示转化为树型表示
•问题：树型如何能够表达出局中人同时进行博弈的情况。

信息集
•处理方法：用一个扁椭圆形的虚线的圈，把所论局中人的若干决策节点罩起来，成为他的一个信息集，并约定如下的理解：所论局中人只知道博弈是否进行到了他的这个信息集，但是在他知道博弈已经进行到他的这个信息集的情况下。

他不知道博弈究竟进行到这个信息集中的哪个决策节点。

注意
•一个信息集罩住的必须首先是同一个局中人的决策节点。

•一个信息集罩住的必须是同一个局中人在同一个时点的决策节点。

•给予不被扁椭圆虚线罩住的每个决策节点以信息集的地位，是单点集的信息集。

•每一个决策位置都是一个信息集。

•在同一个信息集上，大自然、老天爷或者虚拟局中人必须给位于该信息集内的每个决策节点规定相同的行动选择集合。

（数量，内容均相同）
•当博弈走到一个单点集的信息集时，面临决策的局中人对于博弈迄今的历史是清楚的，他清楚博弈具体走到了他的这个决策节点而不是别的决策节点。

但是当博弈走到一个非单点集的信息集时，面临决策的局中人对于博弈迄今的历史是不清楚的，他不清楚博弃具体走到了他的这个信息集里面的哪个决策节点。

完美和不完美
•历史，也是一种信息。

历史清楚的博弈，叫做完美信息的博弈，历史不清楚的博弈，叫做不完美信息的博弈。

•非单点集的信息集的作用，在于说明所论局中人在决策时面对不完美信息的局面，即他不能根据自己现有的信息对位于信息集内的决策节点进行区分，他不知道自己现在究竟位于这个信息集的哪个决策节点上。

定义
•定义：如果一个序贯博弈的每个信息集都是一个单点集，那么么该序贯博弈就是完美信息博弈。

否则，它就是不完美信息博弈。

•同集同注
例子
•女方不清楚男方“先前做出”
的策略选择。

女方必须要么
在两个决策节点上都选择足
球，要么在两个决策节点上
都选择芭蕾，她不能在一个
决策节点上选择足球，而在
另一个决策节点上选择芭蕾。

•女方的选择也可以放在博弈树的初始决策节点上，这时候男方的两个决策节点就位于同一个信息集内。

此时，男方受到的限制是，他必须在位于信息集内的两个决策节点上作出相同的策略选择。

5-2 同时决策与序贯决策的混合博弈•混合博弈：包含同时决策行动和序贯决策行动的博弈。

例子
•假定有两家计算机公司，彼此就新产品的研发展开博弈竞争。

博弈持续的时间为一年。

•在这一年里，这两家公司为能在市场上推出新产品而需要各自私下确定对研发的投入。

•假设两家公司致力推出的新产品类型相同，并且双方都知道对方要这样做，但他们都没有向公众公布他们的研发预算。

•了解对手研发投入决策的唯一方法，是通过在产业年度交易展上观察其产品的性能来推断最终产品的情况。

•在交易展上观察到对手的新产品后。

双方必须分别对各自的新产品定价。

•假定公司的研发投入只有低预算和高预算两种选择。

低预算的结果是新产品只是旧产品的部分改良，而高预算的结果则是推出一个完全不同于旧产品而且质量高很多的全新产品。

低预算策略用“小”或者“小投人”表示，高预算策略用“大”或者“大投入”表示。

•假定方正和联想在看到对手的新产品后的唯一决策问题就是对自己的新产品进行定价，定价只有“高”和“低”两种选择。

•两阶段同时博弈的序贯结构
研发预算和定价博弈的矩阵型表述
•研发预算和定价博
弈的展开表述•每家公司各有32个
纯策略；共有64个纯策略。

•结果只有16个。

5-3 树型博弈的子博弈
支和棱
•一个支可以包含许多条棱。

支必须包含从它的每个决策节点往后直到末端节点的所有棱。

子博弈
•定义：在一个n人展开型博弈T中，满足如下3个条的一个博弈S称为博弈T的一个子博弈：
1.S的博弈树是T的博弈树的一支；
2.博弈S不能分割博弈T的信息集．具体来说，只要博
弈T的某个情息集的任何一个决策节点是博弈S的一
个决策节点，那么T的这个信息集的每一个决策节点
都必须是博弈S决策节点；
3.博弈S的末端节点处的支付向量，与博弈T在这些末
端节点的支付向量的有关部分重合。

z母博弈
•子博弈的根前断开标示法
注意
•任何博弈树必须从一个初始决策节点（根）开始，那么，子博弈的根必须组成母博弈的单点信息集。

•子博弈的信息集和不包含在它这个支内的母博弈的信息集不相交。

一共有几个子博弈？
5-4 子博弈精炼纳什均衡•策略组合的粗线表示法和纳什均衡的虚线排除确定法可知，8个策略组合，有3个是纳什均衡。

•哪个均衡是最有可能发生的并且具有最好稳定性的结果？
子博弈精炼纳什均衡
•定义(泽尔滕)：在一个博弈的所有作为纳什均衡的策略组合当中，那些局限在每个子博弈上都仍然是那个子博弈的纳什均衡的策略组合，叫做子博弈精炼纳什均衡。

•子博弈精练纳什均衡本身也是纳什均衡，但却是比纳什均衡更强的均衡概念。

•利用博弈树考察一个纳什均衡的时，只要局限于某一个子博弈上它不再是纳什均衡，所考察的纳什均衡就不是子博弈精炼纳什均衡。

•(足球，{足球，足球})对局虽然是博弈的纳什均衡，但不是博弈的子博弈精炼纳什均衡，因为局限在根前断开的那支子树所标示的子博弈上，指向(-1，-1)的策略选择有单独偏离的激励，用弯曲箭头表示箭尾的策略成分有向箭头的方向偏离的激励（偏离方向的箭头标示法）。

•如果一个策略组合的某个策略成分有偏离的激励，可以说这个策略组合缺乏局部稳定性。

•子博弈精炼纳什均衡，应该是经得起每个子博弈均衡检验的纳什均衡
•包含不可信威胁的纳什均衡，不是子博弈精炼的纳什均衡。

•这个策略组合，无论从全局看还是从每个局部看，都符合稳定性的要求，符合最优性的要求。

所以，序贯情侣博弈的(足球，{足球，芭蕾})对局，是博弈的子博弈精炼的纳什均衡。

5-5 完美博弈的库恩定理•是否每个树型表示的动态博弈都有纳什均衡呢?
•库恩定理完美信息的有限序贯博弈(sequential game of perfect information)都有纳什均衡。

课堂练习
•用策略组合的粗线表示法和纳什均衡的虚线排除法画出并讨论全部可能的对局或者策略组合，以虚线标示不是纳什均衡的那些对局。

•用虚线圈住的子博弈和相应的标示具有偏离激励策略的箭头，排除那些不是子博弈精炼均衡的纳什均衡，得到子博弈精炼的纳什均衡。

5-6 连续支付情形的序贯博弈•斯坦克尔伯格模型
–与古诺竞争模型一样，斯坦克尔伯格寡头竞争模型也是同质产品的产量竞争模型。

–与古诺模型所不同的是，斯坦克尔伯格模型是一个序贯决策模型，博弈的其中一方具有较强的实力，称之为企业1；而另一方的实力相对
较弱，称之为企业2。

–博弈首先由实力比较强的企业1选择自己的产
量，实力比较弱的企业2在观察到企业1所作出的产量决策后，再确定自己的产量水平。

是一个两阶段的序贯决策博弈。

•用（）表示企业1的产量选择；•用（
）表示企业2在观测到后所选择的产量；•用表示当市场总产量为时的市场出清价格，其中•企业的利润是
•每个企业的利润可写为：
1q 01≥q 2q 02≥q 1q q A q p −=)(q 21q q q +=i 2,1)],)([),(21=−=i c q p q q q i i i π)(),(2121i i i c q q A q q q −−−=π。

e商务文档

5 同时博弈与序贯博弈

相关文档推荐：