当前位置：文档之家› 第四章序贯决策

第四章序贯决策

练习2:有法律保障的开金矿博弈
乙借甲分（2，2）打（1，0）
×不借 ×
（1，0）不分乙
×
不打
（0，4）
倒推法的评价

倒推法只能分析明确设定的博弈问题，要求博弈的结构，包括次序、规则和得益情况等都非常清楚，并且各个博弈方了解博弈结构，相互知道对方了解博弈结构。这些可能有脱实际的可能。逆推归纳法也不能分析比较复杂的动态博弈。在遇到两条路径利益相同的情况时倒推法也会发生选择困难。对博弈方的理性要求太高，不仅要求所有博弈方都有高度的理性，不允许犯任何错误，而且要求所有博弈方相互了解和信任对方的理性，对理性有相同的理解，或进一步有理性的“共同知识”。
第四章序贯决策博弈
序贯决策博弈：局中人做出策略选择时知道对手的策略选择。
实验 : 枪手博弈1
三个快枪手相互之间的仇恨到了不可调和的地步。这天他们三在街上不期而遇，每个人的手都握住了枪把，一场生死决斗马上就要开始…… 已知这三个人中甲枪法精准，十发八中；乙的枪法也不错，十发六中，丙的枪法拙劣，十发四中。假如三个人同时开枪，决一死战，一枪后谁最后活下来的机会大一些？
实验 : 枪手博弈2
假设现在三个枪手决定轮流开枪，谁活下来的机会大一些？
实验:海盗分宝
五个海盗抢到100颗宝石,他们决定按如下方法来分配:先抽签决定顺序(1，2，3，4，5)；然后先由1号提出分配方案，其余的人进行表决，当且仅当半数和超过半数的人同意时，则按1号所提方案分配，否则将1号扔进大海喂鲨鱼，当1号方案被否决，则由2号提出分配方案，其余的人进行表决，以此类推，假定这些海盗都是理性人，问第一个海盗应提出怎样的分配方案才能获得通过并使自己的收益最大？
二、寻找序贯博弈的纳什均衡

例如：如图所示的情侣博弈，分析该博弈的纳什均衡？
女足球
●
足球
芭蕾足球
◆
（2，1）（0，0）（-1，-1）
◆
男
●
芭蕾
◆
●
芭蕾
◆（1，2）
男方和女方的纯策略

男方有两个纯策略：足球和芭蕾

女方有四个纯策略：不管你怎样，我总是芭蕾——{芭蕾，芭蕾} 不管你怎样，我总是足球——{足球，足球} 你选择什么，我就选择什么——{足球，芭蕾} 你选择什么，我就不选择什么——{芭蕾，足球}
四、先动优势与后动优势

在序贯情侣博弈中，任何一方率先采取行动可能得到的好处，都比他或她后行动可能得到的好处大。这种局中人先动得益大于后行得益的情况，叫做先动优势。 ◆ 足球请比较：（2，1）女
足球男
● ●
芭蕾
× ×
◆
（0，0）（-1，-1）
芭蕾 ×
女
●
足球芭蕾
◆
◆（1，2）
先动优势
博弈树

用博弈树来表示序贯博弈。
它描述了博弈参与人的一个序贯决策过程，从博弈数的根开始，到末端点结束。

拥有初始决策节点的局中人先做出决策，他的决策引出博弈树的棱，而棱的末端将是下一个局中人做出决策，依此类推。
进入障碍博弈
垄断者进入进入者
● a ● b
容忍抵抗
◆
（1，5）（-2，2）（0，10）（0，4）
用箭头排除确定法寻找纳什均衡

将以上策略在博弈书中用粗线表示。将存在单独改变激励的策略用箭头标示。方法如下：（1）找到第二阶段两根粗线所对应的支付。（2）比较这两个支付前面的数字，如果大的数字所对应的那条“树枝”是细的，则男方存在单独偏离的动机，则男方的策略选择用箭头标示。（3）比较这两个支付后面的数字，其中对应第一阶段“树枝”是细的那个数字可以不再考虑，因为男方没选这个方向。它是“虚”的。（4）因此只在男方选的那个“树丫”上进行比较女方的支付，如果大的数字对应的“树枝”是细的，则女方的策略选择“树枝”用箭头标示。（P142)
倒推法：（1）在上面一个枝桠上，由于最后一阶段是女方做决策，因此比较女方的支付1和0，将0所对应的芭蕾策略砍掉，没砍掉的打上箭头。（2）在下面一个枝桠上，由于最后一阶段是女方做决策，因此比较女方的支付-1和2，将-1所对应的足球策略砍掉，没砍掉的打上箭头。（3）回到第一个阶段，比较带箭头的两个策略男方的支付（因为此时男方做决策），将支付将较小的策略砍掉。
虚线排除确定法的缺陷

该方法可以找到纳什均衡，但找不到博弈的最终结果。
均衡是策略的组合，而结果则是行动的组合。 (P143) 因此，我们一般用倒推法（Backwards Induction)来寻找序贯博弈的结果。

三、寻找序贯博弈的结果——倒推法

从动态博弈的最后一个阶段博弈方的行为开始分析，逐步倒推回前一个阶段相应博弈方的行为选择，一直到第一个阶段的分析方法，称为“倒推法” 或者“逆推归纳法”。倒推法是动态博弈分析最重要、基本的方法。步骤：从博弈的最后一个阶段开始分析，通过比较最后一个参与决策的局中人的支付，推断他或她的选择，从而将他不会选的策略——“枝桠”砍掉，从而回到上一个阶段，比较该阶段参与决策的局中人的支付，将他或她不会选的策略砍掉，依此类推…
左
上甲下
右
10，0
5，4
10，100
5，0
八种策略组合，纳什均衡在哪

该博弈有八种可能的策略组合：（ {足球}，{（上）足球，（下）足球} ）（ {足球}，{（上）足球，（下）芭蕾} ）（ {足球}，{（上）芭蕾，（下）足球} ）（ {足球}，{（上）芭蕾，（下）芭蕾} ）（ {芭蕾}，{（上）足球，（下）足球} ）（ {芭蕾}，{（上）足球，（下）芭蕾} ）（ {芭蕾}，{（上）芭蕾，（下）足球} ）（ {芭蕾}，{（上）芭蕾，（下）芭蕾} ）
乙
借甲分（2，2）不分乙
不借（1，0）
打
（-1，0）
不打（0，4）
3.2.3 逆推归纳法
乙
借
甲分不分
不借（1，0）
（2，2）
（0，4）
3.2.3 逆推归纳法
乙
借
（0，4）
不借（1，0）
练习2:有法律保障的开金矿博弈
乙借甲分（2，2）打（1，0）不分乙不打（0，4）不借（1，0）
注：花括号第一项表示垄断者在上决策节点b，即进入者选择进入时他要选择的行动，第二项表示垄断者在下决策节点c，即进入者选择不进入时他要选择的行动。

假设垄断企业的老板交给你这样的策略： {对抗，容忍}，你明白应该如何行动吗？
策略就是一个完整的行动计划，使得你可以把它交给另外一个人，让他知道如何代表你去执行这个策略。什么是计划：“如果对手选A，我将采取行动X，如果…，我将采取行动…。”

行动与策略

在同时决策博弈中，行动就是策略。
但在序贯决策博弈中，行动是指每一个决策点上局中人的决策变量或行动的具体抉择。策略就是一个完整的行动计划。
策略组合

该博弈有八种可能的策略组合：（ {进入}，{（上）容忍，（下）容忍} ）（ {进入}，{（上）对抗，（下）对抗} ）（ {进入}，{（上）对抗，（下）容忍} ）（ {进入}，{（上）容忍，（下）对抗} ）（ {不进}，{（上）容忍，（下）容忍} ）（ {不进}，{（上）对抗，（下）对抗} ）（ {不进}，{（上）对抗，（下）容忍} ）（ {不进}，{（上）容忍，（下）对抗} ）
本章讨论动态博弈，所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序，因此在表示方法、利益关系、分析方法和均衡概念等方面，都与静态博弈有很大区别。本章对动态博弈分析的概念和方法，特别是子博弈完美均衡和逆推归纳法作系统介绍，并介绍各种经典的动态博弈模型。

当男方先动时，男方得2，女方得1，但当女方先动时，男方得1，女方得2。 “先下手为强”
男足球× 女
● ●
足球芭蕾 × ×
◆
（1，2）（-1，-1）（0，0）
◆
芭蕾
男
●
足球芭蕾
◆
◆（2，1）
序贯博弈中的性别战

举例：情侣博弈中往往是先动一方具有优势，因此男女双方往往要抢先一步，获得主动权，比如女方已经买好了电影票，再比如男方曾经多次告诉女方，世界杯就算不上班也要看!
支付

进入者纯策略与垄断者的“计划型”策略形成策略组合，构成一条路径。
支付对应每条路径，而不是对应每步选择、行为。支付向量中，数字的排列按局中人的出场顺序出现。（进入者，垄断者）

八种策略组合对应的支付
（ {进入}，{（上）容忍，（下）容忍} ）——（1，5）（ {进入}，{（上）对抗，（下）对抗} ）——（-2，2）（ {进入}，{（上）对抗，（下）容忍} ）——（-2，2）（ {进入}，{（上）容忍，（下）对抗} ）——（1，5）（ {不进}，{（上）容忍，（下）容忍} ）——（0，10）（ {不进}，{（上）对抗，（下）对抗} ）——（0，4）（ {不进}，{（上）对抗，（下）容忍} ）——（0，10）（ {不进}，{（上）容忍，（下）对抗} ）——（0，4）
女足球男
● ●
足球芭蕾 × ×
◆
（2，1）（0，0）（-1，-1）
◆
芭蕾 ×

e商务文档

第四章序贯决策

相关文档推荐：

e商务文档

第四章 序贯决策

相关文档推荐：

第四章序贯决策