当前位置:文档之家› __序贯决策

__序贯决策


本章讨论动态博弈,所有博弈方都对博弈
过程和得益完全了解的完全且完美信息动 态博弈。这类博弈也是现实中常见的基本 博弈类型。由于动态博弈中博弈方的选择、 行为有先后次序,因此在表示方法、利益 关系、分析方法和均衡概念等方面,都与 静态博弈有很大区别。本章对动态博弈分 析的概念和方法,特别是子博弈完美均衡 和逆推归纳法作系统介绍,并介绍各种经 典的动态博弈模型。
? 什么是计划:“如果对手选A,我将采取行 动X,如果…,我将采取行动…。”
行动与策略
? 在同时决策博弈中,行动就是策略。 ? 但在序贯决策博弈中,行动是指每一个决
策点上局中人的决策变量或行动的具体抉 择。策略就是一个完整的行动计划。
策略组合
? 该博弈有八种可能的策略组合: ? ( {进入},{(上)容忍,(下)容忍} ) ? ( {进入},{(上)对抗,(下)对抗} ) ? ( {进入},{(上)对抗,(下)容忍} ) ? ( {进入},{(上)容忍,(下)对抗} ) ? ( {不进},{(上)容忍,(下)容忍} ) ? ( {不进},{(上)对抗,(下)对抗} ) ? ( {不进},{(上)对抗,(下)容忍} ) ? ( {不进},{(上)容忍,(下)对抗} )
二、寻找序贯博弈的纳什均衡
? 例如:如图所示的情侣博弈,分析该博弈 的纳什均衡?
足球 男●
女 足球

芭蕾
◆ (2,1) ◆ (0,0)
芭蕾
足球

◆ (-1,-1)
芭蕾
◆(1,2)
男方和女方的纯策略
? 男方有两个纯策略:足球和芭蕾
? 女方有四个纯策略: ? 不管你怎样,我总是芭蕾——{芭蕾,芭蕾} ? 不管你怎样,我总是足球——{足球,足球} ? 你选择什么,我就选择什么——{足球,芭蕾} ? 你选择什么,我就不选择什么——{芭蕾,足球}
第四章 序贯决策博弈
序贯决策博弈:局中人做出策略选 择时知道对手的策略选择。
实验 : 枪手博弈1
三个快枪手相互之间的仇恨到了不可 调和的地步。这天他们三在街上不期而遇, 每个人的手都握住了枪把,一场生死决斗 马上就要开始……
已知这三个人中甲枪法精准,十发八 中;乙的枪法也不错,十发六中,丙的枪 法拙劣,十发四中。假如三个人同时开枪, 决一死战,一枪后谁最后活下来的机会大 一些?
主要内容
? 1、序贯博弈的定义和表示方法 ? 2、寻找序贯博弈纳什均衡的“箭头排除确
定法”(旧版教材上称为虚线排除确定法) ? 3、寻找序贯博弈纳什均衡的“倒推法” ? 4、先动优势和后动优势 ? 5、“倒推法”的缺陷
一、序贯博弈的定义和表示方法
? 假如某个垄断企业一年可以赚 10亿元的利润,假 定别的企业为了进入该行业需要投资 4亿元。当新 的企业准备进入时,原有垄断企业有两种决策
垄断者 容忍 ◆ (0,10)
● c
抵抗 ◆ (0,4)
“进入者”和“垄断者”的纯策略
? “进入者” 的有两个纯策略:进入和不进入 ? “垄断者”的有四个纯策略: ? 不管你怎样,我总是容忍——{容忍,容忍} ? 不管你怎样,我总是对抗——{对抗,对抗} ? 你进我对抗,你不进我忍——{对抗,容忍} ? 你进我忍,你不进我对抗——{容忍,对抗}
博弈树
? 用博弈树来表示序贯博弈。 ? 它描述了博弈参与人的一个序贯决策过程,
从博弈数的根开始,到末端点结束。 ? 拥有初始决策节点的局中人先做出决策,
他的决策引出博弈树的棱,而棱的末端将 是下一个局中人做出决策,依此类推。
进入障碍博弈
进入者 ●
a
进入 不进
容忍 垄断者
● b
抵抗
◆ (1,5) ◆ (-2,2)
支付
? 进入者纯策略与垄断者的“计划型”策略 形成策略组合,构成一条路径。
? 支付对应每条路径,而不是对应每步选择、 行为。
? 支付向量中,数字的排列按局中人的出场 顺序出现。(进入者,垄断者)
八种策略组合对应的支付
( {进入},{(上)容忍,(下)容忍 } )——(1,5) ( {进入},{(上)对抗,(下)对抗 } )——(-2,2) ( {进入},{(上)对抗,(下)容忍 } )——(-2,2) ( {进入},{(上)容忍,(下)对抗 } )——(1,5) ( {不进},{(上)容忍,(下)容忍 } )——(0,10) ( {不进},{(上)对抗,(下)对抗 } )——(0,4) ( {不进},{(上)对抗,(下)容忍 } )——(0,10) ( {不进},{(上)容忍,(下)对抗 } )——(0,4)
注:花括号第一项表示垄断者在上决策节点 b,即进入者 选择进入时他要选择的行动,第二项表示垄断者在下决策 节点c,即进入者选择不进入时他要选择的行动。
? 假设垄断企业的老板交给你这样的策略: {对抗,容忍},你明白应该如何行动吗?
? 策略就是一个完整的行动计划,使得你可 以把它交给另外一个人,让他知道如何代 表你去执行这个策略。
? (1)“容忍”,但利润要变为 5亿元。这时新的 企业可以得 5亿,减去 4亿投资,仍有 1亿。
? (2)“抵抗”,例如降低价格,企业的利润变为 2亿元,且新的企业也只得 2亿,但减去投资,亏 损2亿。
? 谁先动?潜在进入者,简称“进入者” ? 如何表示该博弈? ? 分析“进入者”和“垄断者”的纯策略。
八 ? ( {足球},{(上)足球,(下)足球 } ) ? ( {足球},{(上)足球,(下)芭蕾 } ) ? ( {足球},{(上)芭蕾,(下)足球 } ) ? ( {足球},{(上)芭蕾,(下)芭蕾 } ) ? ( {芭蕾},{(上)足球,(下)足球 } ) ? ( {芭蕾},{(上)足球,(下)芭蕾 } ) ? ( {芭蕾},{(上)芭蕾,(下)足球 } ) ? ( {芭蕾},{(上)芭蕾,(下)芭蕾 } )
实 验 : 枪手博弈2
假设现在三个枪手决定轮流开枪,谁活下 来的机会大一些?
实验:海盗分宝
五个海盗抢到100颗宝石,他们决定按如下方 法来分配:先抽签决定顺序(1,2,3,4,5); 然后先由1号提出分配方案,其余的人进行 表决,当且仅当半数和超过半数的人同意 时,则按1号所提方案分配,否则将1号扔进 大海喂鲨鱼,当1号方案被否决,则由2号提 出分配方案,其余的人进行表决,以此类 推,假定这些海盗都是理性人,问第一个 海盗应提出怎样的分配方案才能获得通过 并使自己的收益最大?
相关主题