当前位置:文档之家› 第四章 序贯决策

第四章 序贯决策


练习2:有法律保障的开金矿博弈
乙 借 甲 分 (2,2) 打 (1,0)
×不借 ×
(1,0) 不分 乙
×
不打
(0,4)
倒推法的评价




倒推法只能分析明确设定的博弈问题,要求博弈 的结构,包括次序、规则和得益情况等都非常清 楚,并且各个博弈方了解博弈结构,相互知道对 方了解博弈结构。这些可能有脱实际的可能。 逆推归纳法也不能分析比较复杂的动态博弈。 在遇到两条路径利益相同的情况时倒推法也会发 生选择困难。 对博弈方的理性要求太高,不仅要求所有博弈方 都有高度的理性,不允许犯任何错误,而且要求 所有博弈方相互了解和信任对方的理性,对理性 有相同的理解,或进一步有理性的“共同知识”。
第四章 序贯决策博弈
序贯决策博弈:局中人做出策略选 择时知道对手的策略选择。
实验 : 枪手博弈1
三个快枪手相互之间的仇恨到了不可 调和的地步。这天他们三在街上不期而遇, 每个人的手都握住了枪把,一场生死决斗 马上就要开始…… 已知这三个人中甲枪法精准,十发八 中;乙的枪法也不错,十发六中,丙的枪 法拙劣,十发四中。假如三个人同时开枪, 决一死战,一枪后谁最后活下来的机会大 一些?
实 验 : 枪手博弈2
假设现在三个枪手决定轮流开枪,谁活下 来的机会大一些?
实验:海盗分宝
五个海盗抢到100颗宝石,他们决定按如下方 法来分配:先抽签决定顺序(1,2,3,4,5); 然后先由1号提出分配方案,其余的人进行 表决,当且仅当半数和超过半数的人同意 时,则按1号所提方案分配,否则将1号扔进 大海喂鲨鱼,当1号方案被否决,则由2号提 出分配方案,其余的人进行表决,以此类 推,假定这些海盗都是理性人,问第一个 海盗应提出怎样的分配方案才能获得通过 并使自己的收益最大?
二、寻找序贯博弈的纳什均衡

例如:如图所示的情侣博弈,分析该博弈 的纳什均衡?
女 足球

足球
芭蕾 足球

(2,1) (0,0) (-1,-1)



芭蕾


芭蕾
◆(1,2)
男方和女方的纯策略

男方有两个纯策略:足球和芭蕾

女方有四个纯策略: 不管你怎样,我总是芭蕾——{芭蕾,芭蕾} 不管你怎样,我总是足球——{足球,足球} 你选择什么,我就选择什么——{足球,芭蕾} 你选择什么,我就不选择什么——{芭蕾,足球}
四、先动优势与后动优势


在序贯情侣博弈中,任何一方率先采取行动可能得 到的好处,都比他或她后行动可能得到的好处大。 这种局中人先动得益大于后行得益的情况,叫做先 动优势。 ◆ 足球 请比较: (2,1) 女
足球 男
● ●
芭蕾
× ×

(0,0) (-1,-1)
芭蕾 ×


足球 芭蕾

◆(1,2)
先动优势
博弈树

用博弈树来表示序贯博弈。
它描述了博弈参与人的一个序贯决策过程, 从博弈数的根开始,到末端点结束。

拥有初始决策节点的局中人先做出决策, 他的决策引出博弈树的棱,而棱的末端将 是下一个局中人做出决策,依此类推。
进入障碍博弈
垄断者 进入 进入者
● a ● b
容忍 抵抗

(1,5) (-2,2) (0,10) (0,4)
用箭头排除确定法寻找纳什均衡



将以上策略在博弈书中用粗线表示。 将存在单独改变激励的策略用箭头标示。方法如下: (1)找到第二阶段两根粗线所对应的支付。 (2)比较这两个支付前面的数字,如果大的数字所 对应的那条“树枝”是细的,则男方存在单独偏离 的动机,则男方的策略选择用箭头标示。 (3)比较这两个支付后面的数字,其中对应第一阶 段“树枝”是细的那个数字可以不再考虑,因为男 方没选这个方向。它是“虚”的。 (4)因此只在男方选的那个“树丫”上进行比较女 方的支付,如果大的数字对应的“树枝”是细的, 则女方的策略选择“树枝”用箭头标示。(P142)
倒推法:(1)在上面一个枝桠上,由于最后一阶段是女方做 决策,因此比较女方的支付1和0,将0所对应的芭蕾策略砍掉, 没砍掉的打上箭头。(2)在下面一个枝桠上,由于最后一阶 段是女方做决策,因此比较女方的支付-1和2,将-1所对应的 足球策略砍掉,没砍掉的打上箭头。(3)回到第一个阶段, 比较带箭头的两个策略男方的支付(因为此时男方做决策), 将支付将较小的策略砍掉。
虚线排除确定法的缺陷

该方法可以找到纳什均衡,但找不到博弈的 最终结果。
均衡是策略的组合,而结果则是行动的组合。 (P143) 因此,我们一般用倒推法(Backwards Induction)来寻找序贯博弈的结果。


三、寻找序贯博弈的结果——倒推法



从动态博弈的最后一个阶段博弈方的行为开始分析, 逐步倒推回前一个阶段相应博弈方的行为选择,一 直到第一个阶段的分析方法,称为“倒推法” 或 者“逆推归纳法”。 倒推法是动态博弈分析最重要、基本的方法。 步骤: 从博弈的最后一个阶段开始分析,通过比较最 后一个参与决策的局中人的支付,推断他或她的选 择,从而将他不会选的策略——“枝桠”砍掉,从 而回到上一个阶段,比较该阶段参与决策的局中人 的支付,将他或她不会选的策略砍掉,依此类推…

上 甲 下

10,0
5,4
10,100
5,0
八种策略组合,纳什均衡在哪



该博弈有八种可能的策略组合: ( {足球},{(上)足球,(下)足球} ) ( {足球},{(上)足球,(下)芭蕾} ) ( {足球},{(上)芭蕾,(下)足球} ) ( {足球},{(上)芭蕾,(下)芭蕾} ) ( {芭蕾},{(上)足球,(下)足球} ) ( {芭蕾},{(上)足球,(下)芭蕾} ) ( {芭蕾},{(上)芭蕾,(下)足球} ) ( {芭蕾},{(上)芭蕾,(下)芭蕾} )

借 甲 分 (2,2) 不分 乙
不借 (1,0)

(-1,0)
不打 (0,4)
3.2.3 逆推归纳法


甲 分 不分
不借 (1,0)
(2,2)
(0,4)
3.2.3 逆推归纳法


(0,4)
不借 (1,0)
练习2:有法律保障的开金矿博弈
乙 借 甲 分 (2,2) 打 (1,0) 不分 乙 不打 (0,4) 不借 (1,0)
注:花括号第一项表示垄断者在上决策节点b,即进入者 选择进入时他要选择的行动,第二项表示垄断者在下决策 节点c,即进入者选择不进入时他要选择的行动。

假设垄断企业的老板交给你这样的策略: {对抗,容忍},你明白应该如何行动吗?
策略就是一个完整的行动计划,使得你可 以把它交给另外一个人,让他知道如何代 表你去执行这个策略。 什么是计划:“如果对手选A,我将采取行 动X,如果…,我将采取行动…。”


行动与策略

在同时决策博弈中,行动就是策略。
但在序贯决策博弈中,行动是指每一个决 策点上局中人的决策变量或行动的具体抉 择。策略就是一个完整的行动计划。
策略组合




该博弈有八种可能的策略组合: ( {进入},{(上)容忍,(下)容忍} ) ( {进入},{(上)对抗,(下)对抗} ) ( {进入},{(上)对抗,(下)容忍} ) ( {进入},{(上)容忍,(下)对抗} ) ( {不进},{(上)容忍,(下)容忍} ) ( {不进},{(上)对抗,(下)对抗} ) ( {不进},{(上)对抗,(下)容忍} ) ( {不进},{(上)容忍,(下)对抗} )
本章讨论动态博弈,所有博弈方都对博弈 过程和得益完全了解的完全且完美信息动 态博弈。这类博弈也是现实中常见的基本 博弈类型。由于动态博弈中博弈方的选择、 行为有先后次序,因此在表示方法、利益 关系、分析方法和均衡概念等方面,都与 静态博弈有很大区别。本章对动态博弈分 析的概念和方法,特别是子博弈完美均衡 和逆推归纳法作系统介绍,并介绍各种经 典的动态博弈模型。


当男方先动时,男方得2,女方得1,但当 女方先动时,男方得1,女方得2。 “先下手为强”
男 足球× 女
● ●
足球 芭蕾 × ×

(1,2) (-1,-1) (0,0)

芭蕾


足球 芭蕾

◆(2,1)
序贯博弈中的性别战

举例:情侣博弈中往往是先动一方具有优 势,因此男女双方往往要抢先一步,获得 主动权,比如女方已经买好了电影票,再 比如男方曾经多次告诉女方,世界杯就算 不上班也要看!
支付

进入者纯策略与垄断者的“计划型”策略 形成策略组合,构成一条路径。
支付对应每条路径,而不是对应每步选择、 行为。 支付向量中,数字的排列按局中人的出场 顺序出现。(进入者,垄断者)


八种策略组合对应的支付
( {进入},{(上)容忍,(下)容忍} )——(1,5) ( {进入},{(上)对抗,(下)对抗} )——(-2,2) ( {进入},{(上)对抗,(下)容忍} )——(-2,2) ( {进入},{(上)容忍,(下)对抗} )——(1,5) ( {不进},{(上)容忍,(下)容忍} )——(0,10) ( {不进},{(上)对抗,(下)对抗} )——(0,4) ( {不进},{(上)对抗,(下)容忍} )——(0,10) ( {不进},{(上)容忍,(下)对抗} )——(0,4)
女 足球 男
● ●
足球 芭蕾 × ×

(2,1) (0,0) (-1,-1)

芭蕾 ×
相关主题