第十一章博弈模型
第1节 博弈论概论│什么是博弈论
智猪博弈(两头猪都有智慧的前提下 )
猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下, 位于猪圈另一端的食槽中就会有10单位的猪食进槽,但是谁按按钮就会首 先付出2个单位的成本。如果大猪先到食槽,则大猪吃到9单位食物,小猪 仅能吃到1单位食物;如果两猪同时到食槽,则大猪吃7单位,小猪吃3单 位食物;如果小猪先到,大猪吃6单位而小猪吃4单位食物。给出这个博弈 的收益矩阵。
第1节 博弈论概论│什么是博弈论
“智猪博弈—搭便车”
小猪 按 按 大猪 不按
5, 1
4, 4
不按
9, -1
0, 0
第1节 博弈论概论│什么是博弈论
石头、剪刀、布
博弈方2 石头 石头 博弈方 1 剪刀 布 剪刀 布
0, 0 -1, 1 1,-1
1, -1 0, 0 -1,1
-1,1 1,-1 0 ,0
3
博弈论的表示方法
第1节 博弈论概论│博弈论表示方法
3.1 博弈论的两种表示方法
1
L
(2,2)
L
2 L S 5, 1 9, -1
S
4, 4 0, 0
1
L
2 S L 2 S
(-1,-1) (-1,-1)
S
(1,1)
战略式表述 (strategic form representation) 多用矩阵
第十一章 博弈论初步
Game Theory
1
什么是博弈论
决策问题(Decision Problem)
单一决策主体 决策变量
三要素
多个决策主体 博弈模型
目标函数
约束条件 决策主体的决策行 为发生直接相互作 用 (相互影响)
优化模型
(Optimization) 博弈模型
(Game Theory)
军事、政治、经济、企业管理和社会科学中应用广泛
第1节 博弈论概论│什么是博弈论
1.1 博弈论的意义
一个人的行为总是受到他人行为的影响。人们在追逐自己利益时,难免 要与他人发生利益冲突或矛盾。如何克服和解决人们之间的利益冲突? 如何才能实现一种既能让每个人都实现自己的利益,又能让每个人都不 妨碍和伤害他人利益的互利互惠的和谐局面?
博弈论(game theory)为解决这些问题提供了有力工具。
如果市场上有一栋楼出售:需求大时,每栋售价1.8亿;需求 小时,每栋售价1.1亿
给出这个博弈的支付矩阵。
第1节 博弈论概论│博弈论表示方法
需求大的情况
开发 开发 开发商A 不开发
开发商B 不开发
4000, 4000
8000, 0
0, 8000
0, 0
需求小的情况
开发
开发 开发商A 不开发
开发商B
不开发
D
而当A选择 Down, B 选择 Right ,那么A的收 益是2,B的收益是1。
Player B L R
U Player A (3,9) (1,8) (0,0) (2,1)
D
一次博弈对应一个策略组合例如(U,R),在此 第一个元素是参与者A选择的策略,第二个 元素是参与者B选择的策略。
Player B L R
博弈的特征表现为两个或两个以上具有利益冲突的当事人处于一种不相容 状态中,一方的行动取决于对方的行动,每个当事人的收益都取决于所有 当事人的行动。
当所有当事人都拿定主意作出决策时,博弈的局势便确定下来。
博弈论的目的是要研究人们之间这种不相容的行为,推广标准的一人决策 理论。
博弈论关注的问题
在每个当事人的收益都依赖于其他当事人的选择的情况下,追求个人收益最大化的当事人应 该如何采取行动?
Clyde 不坦白 不坦白 Bonnie 坦白 坦白
-1, -1 0, -10
-10, 0 -5, -5
两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警 察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖, 各判刑一年;如果两人都坦白,各判五年;如果两人中一个坦白而另一个抵 赖,坦白的放出去,抵赖的判十年。
从游戏到博弈:博弈就是策略对抗,或策略有关键作用的游戏。博弈
Game,博弈论Game Theory,Game即游戏、竞技。
第1节 博弈论概论│什么是博弈论
1.4 博弈论的研究对象
博弈是一种普遍现象,人们总会有意、无意地运用博弈的思想。
比如企业在决策时,总是会考虑竞争对手的反应;个人与政府之间 “上有政策,下有对策” ;金融监管与创新犹如“猫鼠博弈”;博弈还作为消遣游戏,让人们获得快乐。
果局中人不能在博弈中达成有约
束力的协议或合约,则称该博弈 为非合作博弈。非合作博弈强调 的是个体理性。
第1节 博弈论概论│博弈分类
静态博弈(static game) 博弈中局中人同时选择行动,或 虽然不是同时行动但后行动者并
动态博弈(dynamic game) 指局中人的行动有先后顺序,且 后行动者能够观察到先行动者所
不完全信息博
弈
交叉分类:以上分类方式的结合,比如二人零和有限博弈。
第1节 博弈论概论│博弈分类
二人博弈 在博弈中有两个局中人,称为二 人博弈。
多人博弈 在博弈中有两以上个局中人,称 为多人博弈。
第1节 博弈论概论│博弈分类
有限博弈 博弈被重复一个固定的次数称为 有限博弈。
无限博弈 博弈被重复,没有一个固定的次 数称为无限博弈。
才能再拿。
鬼谷子说完后,庞涓赶忙拿了2个饼,而孙膑从容地拿1个饼吃起来,庞 涓未吃完两个饼,孙膑已经吃完1个饼,孙膑第二次拿了2个饼,此时桌 上已经没有饼了,最后,孙膑吃了三个饼,而庞涓吃了两个饼。在这则典 故当中其实隐藏着一条生存法则。
第1节 博弈论概论│什么是博弈论
海滩选址博弈
在中国的大城市里,你会发现一个有意思的现象,当你在街边看到一个肯
第1节 博弈论概论│什么是博弈论
1.3 博弈论的概念
博弈论(game theory):研究利益存在冲突的决策主体在相互依
赖的条件下,如何选择适当的策略实施以获得最大利益的思想和方法。
1 研究对象不是客观规律,而是带有主动性的人的活动。
2 最优不是绝对的,而是现有主客观条件下的理想结果。
第1节 博弈论概论│什么是博弈论
双人博弈举例
一次博弈包含哪些组成部分 ?
• 一些参与者(players)
• 每一个参与者的可能策略 (strategies)
• 每个参与者的每一种可能的策略选择的 收益(payoffs)
双人博弈
• 只有两个参与者
• 两个参与者,两种策略,四种收益组合
双人博弈举例
• 参与者 A 和 B • A有两种策略“上”或“下” • B的两种策略为“左”或“右” • 表格中显示的是给参与者带来的四种可 能的策略组合的收益,即博弈的收益矩 阵(payoff matrix)。
扩展式表述 (extensive form representation)
多用博弈树
第1节 博弈论概论│博弈论表示方法
3.2 博弈论的表示方法示例
案例:房地产开发项目,假设有A、B两家开发商,市场需求可能大,也 可能小,投入需要1亿。 假定市场上有两栋楼出售:需求大时,每栋售价1.4亿;需求 小时,每栋售价7千万
第1节 博弈论概论│什么是博弈论
1.5 博弈论的基本概念
参与人:博弈论中选择行动以最大化自己效用的决策主体
行动:参与人的决策变量 战略:参与人选择行动的规则
信息:参与人在博弈中的知识,特别是有关其他参与人的特征和行动的
知识 支付函数:参与人从博弈中获得的效用水平
结果:博弈分析真正感兴趣的要素的集合
-3000, -3000 0, 1000来自1000, 0 0, 0
第1节 博弈论概论│博弈论表示方法
A
开发 不开发
完全信息 博弈
N
大
1/2
N
小
1/2
大
1/2
小
1/2
B
开发 不开发
B
开发 不开发
B
开发 不开发
B
开发 不开发
(4,4)
(8,0)
(-3,-3)
(1,0)
(0,8)
(0,0)
(0,1)
(0,0)
第1节 博弈论概论│什么是博弈论
要想在现代社会做一个有文化的人, 你必须对博弈论有一个大致了解。
保罗.萨缪尔森
第1节 博弈论概论│什么是博弈论
1.2 引例 孙膑与庞涓吃饼
一天鬼谷子想试孙膑与庞涓的智力,鬼谷子拿出5个饼,放在桌上,让他们 两人取来吃。鬼谷子说:每人一次最多拿两个饼,并且拿的饼全部吃完后
不了解前行动者采取了什么具体
行动。 “石头、剪刀、布”的游戏;
选择的行动。
下棋、打牌等游戏。
第1节 博弈论概论│博弈分类
完全信息博弈(completeⅠinformation) 不完全信息博弈(incompleteⅠinformation)
将各博弈方都完全了解所有博弈 方各种情况下得益的博弈称为“
将至少部分博弈方不完全了解其 他博弈方得益情况的博弈称为“
完全信息博弈” 。
不完全信息博弈”。
• 1994年,诺贝尔经济学奖授予三位博弈论专 家:纳什、泽尔滕和海萨尼。
– 纳什,50年代研究非合作博弈 – 泽尔滕,60年代研究动态博弈,提出“精炼纳什 均衡”概念 – 海萨尼,60年代末将不完全信息引入博弈论的研 究。
B L
U A
R
收益矩阵
(3,9) (1,8) (0,0) (2,1)
D
收益组合中第一项是A的收益,第二项是B的收益。
B L
U
R
收益矩阵