当前位置:
文档之家› 经济博弈论 第二章扩展式博弈
经济博弈论 第二章扩展式博弈
Ⅰ Ⅱ
绑架 薇薇卡
不支付赎金 盖伊
Ⅲ
杀害 释放
Ⅳ
释放
杀害
释放 4 1
杀害
4 1
5 3
2 2
1 4
5 3
2 2
1 4
扩展式博弈:不完美信息——信息集
在节点3和节点4,盖伊需要作出如何对待奥兰多的决策, 但他并不知道薇薇卡是否交纳了赎金,换言之,盖伊并不 清楚自己处于节点3还是处于节点4。 参与人不能区分的所有节点组成的集合,称为信息集。 每个节点属于且只属于一个信息集。一个信息集至少包括 一个节点。 在任意一个扩展式博弈中,采取行动的参与者总是拥有一 个信息集,这个信息集表示参与者所知道的博弈状态。 所有的信息集只有一个节点的博弈,称为完美信息博弈。 至少有一个信息集包含多个节点的博弈,称为不完美信息 博弈。
2 1
不绑架 绑架, 支付赎金, 奥兰多被杀
绑架,支付赎金, 奥兰多被释放
绑架,不支付赎金, 奥兰多被杀 绑架,不支付赎金,奥兰多被释放
暴力盖伊 薇薇卡 3 5 5 1 4 3
2 1 2 4
扩展式博弈:完美信息——绑架案
假设盖伊仅仅只是想要得到一笔钱,如果拿不到赎金,出 于报复,他会杀害奥兰多。分析盖伊的处境。 假设盖伊认为如果奥兰多被杀死,他被逮捕的机会很小, 所以倾向于杀掉奥兰多。分析盖伊的处境。 假设薇薇卡关心丈夫胜过关心金钱。分析她的处境。 结果 盖伊 3 4 5 2 1 暴力盖伊 薇薇卡 3 5 4 2 1 5 1 3 2 4
特征1:每一个节点都是初始节点 的后续节点,同时,初始节点是 唯一具有这一特征的节点。 特征2:除初始节点之外的任何一 个节点都只有一个直接前臵节点。 初始节点没有前臵节点。 特征3:从一个节点引出的不同分 枝具有不同的行动标签。 特征4:每一个信息集只包含一个 参与人的节点。 特征5:每个信息集中所有节点必 须具有相同数量的直接后继节点, 而且其中的所有节点是通过具有 相同集合行动标签的分枝而到达 这些后继节点的。
第三节
扩展式博弈:完美信息
盖伊
因为博弈论的目的在于推 导人们行为的后果,所以 一个模型就应该重点关注 能够做出决策的个体。 在一个关于绑架的例子中, 我们重点关注绑架者盖伊 和被绑架者奥兰多的妻子 薇薇卡, 薇薇卡被通知交 付赎金。 思考问题:① 盖伊与薇薇 卡什么时候采取行动?② 当他们行动时有哪些可供 选择的行动方案?③当他 们采取行动时知道的信息 是什么?
盖伊 不绑架 盖伊 3 薇薇卡 5 支付赎金 盖伊 杀害 释放 绑架 薇薇卡 不支付赎金 盖伊 不绑架 盖伊
Ⅰ
绑架 薇薇卡
Ⅱ 盖伊 3 薇薇卡 5 支付赎金
Ⅲ
杀害 盖伊 释放
不支付赎金
Ⅳ
释放
杀害
杀害
释放 4 1 5 3 2 2
4 1
5 3
2 2
1 4
1 4
扩展式博弈:不完美信息——信息集
由于盖伊与薇薇卡同时决策,以下两种形式的扩 展式博弈是等价的。 本质相同:同一个博弈,有两个阶段,第一阶段 盖伊决策,第二阶段盖伊与薇薇卡同时决策。
扩展式博弈:完美信息——买车还价
上述扩展式博弈等同于以下所示的扩展式博弈
马库斯
马库斯
扩展式博弈:完美信息——小练习
思考一个包含两个参与者的博弈。在博弈中,父 亲可以选择是、否与可能;女儿随后做出选择, 她的选择方案有:待在家里和去超市。他们各自 的收益如下表所示。以扩展式写出这个博弈。
outcome
击球手
投手
击中的平均 概率
右 右
左 左
右 左
右 左
0.255 0.274
0.291 0.266
O队
JG JL
Y队
RJ
1 3
MR
3 1
2 O队 2 Y队
扩展式博弈:完美信息—审讯伽利略
天主教主乌尔 班八世决定是 否把伽利略带 到宗教法庭进 行审问,如果 决定要审问伽 利略,那么伽 利略决定是否 承认,而审讯 者需要决定采 取什么行动。
乌尔班八世
不提交法庭 提交给法庭
伽利略 乌尔班八世 3 伽利略 5 审讯者 3
认罪 5 不认罪 审讯者 用刑 不用刑 2
3 4
认罪
伽利略
不认罪 1
4 2
4
1 5
2 1
扩展式博弈:完美信息——买车还价
Macrus为售 车老板, Donna为顾客。 且PH>PM>PL 如果交易失 败,双方收 益均为0. 如果以价格P 成交,Donna 的收益为PMP,Macrus的 收益为2(P-PL)
盖伊 3 薇薇卡 5
支付赎金 盖伊 杀害
杀害
4 1 盖伊 不绑架
5 3
2 2
1 4
Ⅰ
绑架 薇薇卡 不支付赎金
Ⅱ 盖伊 3 薇薇卡 5 支付赎金 Ⅲ
杀害 盖伊 释放 5 3
Ⅳ
杀害 释放 1 4
4 1
2 2
扩展式博弈:错误的信息集举例
扩展式博弈:无限行动的情形
公司1首先决定在广告上投入多少费用,公司2在 观察到公司1的行动后,决定退出还是留在这个市 场。
第二章
扩展式博弈
本章的主要内容
博弈论的启示 实际模型与虚拟模型 扩展式博弈:完美信息 扩展式博弈:不完美信息 策略是什么
第一节
博弈论的启示
博弈论主要在两个方面给我们帮助: 1、模型 它提供了一个研究复杂社会现象的框架, 可将其简化为可供分析的模型 2、方法 它提供了从这些与人们如何采取行动及人 们该如何采取行动相关的模型中,总结命 题的方法。
策略是什么——例子1
一个策略规定了每种情形下参 与者选择的行动方案。 博弈中,盖伊面临三种情形: ①是否实施绑架;②实施绑架 且拿到赎金后,决定释放还是 杀害奥兰多;③实施绑架且没 有拿到赎金后,决定释放还是 杀害奥兰多。 他各有两种选择,所以他共有 8种策略:(绑架,释放,杀害); (绑架,释放,释放);(绑架,杀害, 释放);(绑架,杀害,杀害); (不 绑架,释放,杀害);(不绑架,释放, 释放);(不绑架,杀害,释放); (不绑架,杀害,杀害)
不绑架 盖伊 3
绑架
薇薇卡 不支付赎金 盖伊
薇薇卡 5 支付赎金 盖伊
杀害
释放
杀害 释放
4
1
5
2
1
3
2
4
绑架案
扩展式博弈:完美信息——绑架案
这个博弈有五种结果:每种结果对应博弈树的一个路径, 或者说一系列行动方案。如果盖伊没实施绑架,产生一个 结果;如果盖伊实施绑架,产生四种结果。这四种结果分 别取决于薇薇卡是否交付赎金与盖伊撕票还是释放。 五种结果中盖伊和薇薇卡的偏好不同:表 结果 盖伊 3 4 5
博弈论提供了对于人们行为背后逻辑的洞察, 还处于发展中。
第二节 实际模型与虚拟模型
实际模型 实际模型旨在呈现真实世界,是对真实世界的准确描 述,实际模型可能很复杂。 虚拟模型 虚拟模型是对真实模型的简化,并不一定是对真实模 型的准确描述。我们使用虚拟模型尽可能从本质上模 仿真实世界,并非复制真实世界。 构建虚拟模型 决定将哪些因素加入到虚拟模型中,就如同打包行李 去大学,你没有办法把所有需要的东西都塞进行李箱。 从本质上模仿,就是把最关键的因素加入模型,忽略 次要因素。有些时候,忽略次要因素更有助于研究关 键因素之间的关系。
虚拟模型的优势——举例
a有空气管,b牛顿管(真空) 现实中五米高扔铁球和纸片,落地时间不一样。 忽略空气阻力,才找到速度和重力之间的关系。 忽略空气阻力帮助我们揭示出本质。
神九与天宫一号进行交会对接:研究 设计的轨道时要考虑长度、宽度 (否),要研究卡口就不能不考虑。 根据研究问题决定选择哪些因素, 好的模型根据研究的问题选择一些因 素加入模型中 问题不同,选择的因素也不同。 博弈分析中都是虚拟模型,不是真实 模型
扩展式博弈:不完美信息——信息集
在左图中,盖伊在决定杀死还是释放奥兰多之前,知道薇薇卡 是否交纳了赎金。信息集都是单节点,是一个完美信息博弈 (左图) 如果盖伊在决定杀死还是释放奥兰多之前,不知道薇薇卡是否 交纳了赎金。节点3和4共同构成一个信息集,这个信息集中包 含了两个节点,是一个不完美信息博弈(右图)
在左图中,盖伊在决定杀死还是释放奥兰多之前,知 道薇薇卡是否交纳了赎金。(左图) 如果盖伊在决定杀死还是释放奥兰多之前,不知道薇 薇卡是否交纳了赎金。换言之,盖伊与薇薇卡同时决 策。(右图)
盖伊 不绑架 盖伊 3 薇薇卡 5 支付赎金 盖伊 杀害 释放 绑架 薇薇卡 不支付赎金 盖伊 不绑架 盖伊 3 薇薇卡 5 支付赎金 盖伊
若公司1与公司2同时决策采取行动呢?
扩展式博弈:不完美信息——小练习
返回到抢劫博弈中,假设劫匪不仅选择是否携 带和出示手枪,还选择是否给枪装上子弹。如 果西蒙看到劫匪持枪,但不知道枪里是否有子 弹。写下这个情境下的扩展式博弈(收益情况 可忽略)。
第五节
策略是什么
孙子:是故胜兵先胜而后求战,败兵先战而后求胜。 善用兵者,修道而保法,故能为胜败之政。强调策 略的重要性。 毛泽东:人不犯我,我不犯人;人若犯我,我必犯 人,这也是一种策略。 现实生活中,经常听到策略这个词,不同学科对策 略的概念有不同的定义,这里主要是从博弈论角度 谈策略的定义。 策略是参与者在博弈中完整详细的决策规则。策略 具有完备性。 策略考虑到任何一种可能性。不能只考虑部分可能 性。 策略不是一系列的行动集合,而是一系列的应变计 划。 一个参与人的策略描述的是,在它的每一个信息集 中,它所作出的决策。