博弈论与策略思维
参与者 2 参与者 1
策略 a b c A 3,2 2,1 1,6 B 2,3 1,2 1,4 C 5,4 3,3 4,5
博弈论与策略思维
21
博弈论与策略思维
22
站到对手的立场上,想
参与者2会怎么做呢?
参与者2 没有占优策略! 但是参与者2应该能够推断出1会选择 “a” 因此参与者2会选择 “C”
博弈论与策略思维
30
5
2012/11/26
囚徒困境的应用--彩电价格大战
同质产品,价格竞争(伯特兰德寡头垄断模型) 海信 长虹
策略 低价 高价 低价 0,0 -1,3 高价 3,-1 1,1 纳什均衡
公共地悲剧
加利福尼亚大学生物学家哈丁:15-16世纪, 苏格兰地区大量草地,由于属公有土地导致过 度放牧,致使草地消失,生态破坏
27
同步一次博弈
囚徒困境(塔克)
囚徒B
坦白 不坦白
无期,无期 释放,死刑 死刑,释放 一年,一年
囚徒A
策略
坦白 不坦白
个体理性与集体理性的冲突
博弈论与策略思维
博弈论与策略思维
28
专栏1:囚徒困境背后的故事
作为博弈论先驱之一的哈罗德·库恩在1994年诺贝尔奖典礼的专题讨论会 上,讲述了下面的故事 那是1950年春天,塔克在斯坦福大学学术休假,由于办公室紧缺,他住 进了心理学系。有一天,一位心理学家敲开了他的房门,问他正在做什 么。塔克回答:“我正在研究博弈论”,心理学家就问他能否就他的研 究举办一次研讨会。为了那次研讨会,塔克发明了“囚徒困境”作为博 弈论、纳什均衡以及与之伴随而来的非社会意愿均衡的例子。作为一个 真正富有创意的例子,囚徒困境博弈激发了许多学术论文乃至几本巨著。 塔克的才华在于,他发明了这个故事来阐释数学原理。之所以称它为一 种才华,是因为它的展示方法可以形成或者打破一种思想;一种令人难 忘的展示方法能够传播开来,并被大多数思想家更好更快地吸收,而一 种乏味枯燥的展示方法可能会被人忽略、遗忘。(迪克西特、奈尔伯夫)
博弈论与策略思维
14
博弈论与策略思维
同步一次博弈--标准式博弈
构成标准式博弈的要素有:
参与者:参加博弈并做出决策的个体 策略:参与者可能采取的行动 得益:参与者采取不同策略带来的利益或损失 参与者 2
策略 a b c A 3,2 2,1 1,6 B 2,3 1,2 1,4 C 5,4 3,3 4,5
●同质竞争的零利润定理
博弈论与策略思维
31
公共资源的过度使用和产权界定的重要性(铁 篱笆:欧洲重大的社会进步) 污染排放,渔业捕捞
基本框架
博弈论导论
同步一次博弈
重复博弈:有限重 复博弈与无限重复 博弈
博弈论与策略思维
15
参与者 1
博弈论与策略思维
16
标准式博弈:均衡分析
假设参与者1认为参与者2选择 “A”
参与者 2
标准式博弈:均衡分析
则参与者1应该选择 “a” 参与者1对参与者2选择 “A”的最优反应是 “a”.
参与者 2
专栏的博弈分析(制药公司销售大战)
默克 辉瑞
策略 适中 庞大 适中 10,10 13,5 庞大 5,13 7, 7
站在对手的位置上思考问题
如果你没有占优策略,那么从你对手角度考虑博弈。 如果对手有占优策略,预期他将按占优策略行动
纳什均衡
我所做的是:给定你所做的,我所做的是最好的; 你所做的是:给定我所做的,你所做的是最好的。
简单发展史 基本分类 博弈论精髓 标准式博弈 均衡分析 应用
同步一次 博弈
重复博弈
博弈论与策略思维
无限重复博弈 有限重复博弈
7
8
博弈论导论—博弈论和诺贝尔经济学奖
1994:纳什(Nash)、海萨尼(J.Harsanyi)、泽尔腾(R.Selten) 纳什的基本贡献是证明了非合作博弈 均衡解及其存在性,建立了作为博弈 论基础的“纳什均衡”概念;海萨尼 则把不完全信息纳入到博弈论方法体 系中;泽尔腾的贡献在于将博弈论由 静态向动态的扩展,建立了“子博弈 精练纳什均衡”的概念。 1996莫里斯(James A.Mirrlees)和维克瑞(William Vickrey) 这两位经济学家的贡献集中于运用 博弈论对现实经济问题的解释。
博弈论与策略思维
9
博弈论导论—博弈论和诺贝尔经济学奖
2001:阿克洛夫(Akerlof)、斯宾塞(Spence)、斯蒂格利茨(Stiglitz ) 这三位作为不对称信息市场理论的 奠基人被授予诺贝尔经济学奖,以 表彰他们分别在柠檬品市场等不对 称信息理论研究领域做出的基础性 贡献。这些贡献发展了博弈论的方 法体系,拓宽了其经济解释范围。 2002:弗农史密斯(Smith) 贡献主要在于通过实验室实验来测试 根据经济学理论而做出预测的未知或 不确定性。是对以博弈论为基础构建 的理论模型进行实证证伪工作的一大 创举。
参与者 2 参与者 1
策略 a b c A 3,2 2,1 1,6 B 2,3 1,2 1,4 C 5,4 3,3 4,5
结果
参与者 2 参与者 1
策略 a b c A 3,2 2,1 1,6 B 2,3 1,2 1,4 C 5,4 3,3 4,5
“a” 是参与者1对 “C”的最优反应. “C” 是参与者2对 “a”的最优反应.
2,3 1,2 1,4 5,4 3,3 4,5
参与者 1
a b c
3,2 2,1 1,6
参与者 1
策略
A
B
C
策略 a b c
A 3,2 2,1 1,6
B 2,3 1,2 1,4
C 5,4 3,3 4,5
博弈论与策略思维
17
博弈论与策略思维
18
3
2012/11/26
标准式博弈:均衡分析
假设参与者1认为参与者2选择 “B”.
博弈论与策略思维
29
关键点 囚徒困境是20世纪出现的重要思想之一, 既简单得任何人都可以掌握,又具有极大的 重要性。囚徒困境会发生在生物学、心理学、 社会科学、经济学、法律等诸多领域,只要 有利益冲突的地方,就可能会有困境,它揭 示了个体理性与集体理性的冲突。困境对研 究解释人类社会甚至动物界为什么会有现在 这样的组织与结构极有好处。
参与者 2
标准式博弈:均衡分析
则参与者1应该选择 “a”. 参与者1对 参与者2选择“B”的最优反应是 “a”.
5,4 3,3 4,5
参与者 1
a b c
3,2 2,1 1,6
2,3 1,2 1,4
参与者 1
策略
A
B
C
参与者 2
策略 a b c A 3,2 2,1 1,6 B 2,3 1,2 1,4 C 5,4 3,3 4,5
起源可以追溯到1944年数学家冯·诺伊曼与经济学家摩根斯坦合著的《博弈论与 经济行为》,这是20世纪最有影响但读者却最少的书之一 冯·诺伊曼(1903-1957)六岁时以超强记忆力出名,10岁时读完世界史百科全 书,20多岁时已闻名世界数学界,对应用数学情有独钟(著名物理学家维格纳) 父亲是成功银行家(家庭小图书馆),(纺织厂穿孔卡片与巴赫的赋格艺术) 喜欢扑克,研究扑克和其他游戏的数学结构,认识到可以运用到经济、政治、军 事等领域,从而形成了博弈理论 计算机和原子弹是他的业余项目 最早应用博弈论是兰德公司,任务是研究州际核战争的战略,诺伊曼是兰德的常 客 20世纪70年代以来,博弈论在经济学中得到广泛的运用,成为经济学思想史上 与“边际分析”和“凯恩斯革命”并列的重大革命,为人类带来了一种全新的方 法论和思维方式 博弈论与策略思维
4
基本框架
博弈论导论 博弈论导论
同步一次博弈 重复博弈:有 限重复博弈与 无限重复博弈 多阶段博弈 不对称信息下 的博弈
基本框架
同步一次博弈
重复博弈:有 限重复博弈与 无限重复博弈
博弈论与策略思维
5
博弈论与策略思维
6
1
2012/11/26
课程主要内容
博 弈 论 与 策 略 思 维
博弈论 导论
博弈论导论—现代博弈论简单发展史
博弈论与策略思维
19
博弈论与策略思维
20
标准式博弈:均衡分析
如果参与者1认为参与者2选择 C… 参与者1对参与者2选择“C”的最优反应是“a”.
参与者 2 参与者 1
策略 a b c A 3,2 2,1 1,6 B 2,3 1,2 1,4 C 5,4 4,5 3,3
占优策略
不管参与者2是选择A、B还是C, 参与者1都会选择“a”! “a” 是参与者1的占优策略! 占优策略(上策) 不管对手做什么,对一个参与者都能获得最高得益的策略
11
博弈论与策略思维
博弈论与策略思维
12
2
2012/11/26
博弈论导论
标准式博弈与扩展式博弈 : 矩阵 博弈树 同步博弈与序列博弈 : 每个参与方不知对方决策情况下作出决策; 参 与方先观察对方行动,自己再行动。 一次博弈与重复博弈:基本博弈只进行一次;基本博弈重复进行,包括 有限重复和无限重复。 零和博弈与非零和博弈 : 一方的情况只有当另一方情况变得更差时才 能变得更好;另外一方情况不必变得更差,一方的情况就能变得更好。 完全信息博弈与不完全信息博弈 : 完全信息博弈是指参与人对其他参 与人的特征、策略和得益函数有准确知识,否则就是不完全信息博弈。 静态博弈与动态博弈:参与人同时选择行动或虽非同时但后行动者并 不知道前行动者采取什么行动;参与人的行动有先后顺序,且后行动 者能够观察到先行动者所选择的行动。
博弈论与策略思维
10
博弈论导论—博弈论和诺贝尔经济学奖