当前位置：文档之家› 博弈论与策略思维

博弈论与策略思维

参与者 2 参与者 1
策略 a b c A 3，2 2，1 1，6 B 2，3 1，2 1，4 C 5，4 3，3 4，5
博弈论与策略思维
21
博弈论与策略思维
22
站到对手的立场上，想
参与者2会怎么做呢?
参与者2 没有占优策略! 但是参与者2应该能够推断出1会选择 “a” 因此参与者2会选择 “C”
博弈论与策略思维
30
5
2012/11/26
囚徒困境的应用--彩电价格大战
同质产品，价格竞争(伯特兰德寡头垄断模型) 海信长虹
策略低价高价低价 0，0 -1，3 高价 3，-1 1，1 纳什均衡
公共地悲剧
加利福尼亚大学生物学家哈丁：15-16世纪，苏格兰地区大量草地，由于属公有土地导致过度放牧，致使草地消失，生态破坏
27
同步一次博弈
囚徒困境（塔克）
囚徒B
坦白不坦白
无期，无期释放，死刑死刑，释放一年，一年
囚徒A
策略
坦白不坦白
个体理性与集体理性的冲突
博弈论与策略思维
博弈论与策略思维
28
专栏1：囚徒困境背后的故事
作为博弈论先驱之一的哈罗德·库恩在1994年诺贝尔奖典礼的专题讨论会上，讲述了下面的故事那是1950年春天，塔克在斯坦福大学学术休假，由于办公室紧缺，他住进了心理学系。有一天，一位心理学家敲开了他的房门，问他正在做什么。塔克回答：“我正在研究博弈论”，心理学家就问他能否就他的研究举办一次研讨会。为了那次研讨会，塔克发明了“囚徒困境”作为博弈论、纳什均衡以及与之伴随而来的非社会意愿均衡的例子。作为一个真正富有创意的例子，囚徒困境博弈激发了许多学术论文乃至几本巨著。塔克的才华在于，他发明了这个故事来阐释数学原理。之所以称它为一种才华，是因为它的展示方法可以形成或者打破一种思想；一种令人难忘的展示方法能够传播开来，并被大多数思想家更好更快地吸收，而一种乏味枯燥的展示方法可能会被人忽略、遗忘。（迪克西特、奈尔伯夫）
博弈论与策略思维
14
博弈论与策略思维
同步一次博弈--标准式博弈
构成标准式博弈的要素有:
参与者：参加博弈并做出决策的个体策略：参与者可能采取的行动得益：参与者采取不同策略带来的利益或损失参与者 2
策略 a b c A 3，2 2，1 1，6 B 2，3 1，2 1，4 C 5，4 3，3 4，5
●同质竞争的零利润定理
博弈论与策略思维
31
公共资源的过度使用和产权界定的重要性（铁篱笆：欧洲重大的社会进步）污染排放，渔业捕捞
基本框架
博弈论导论
同步一次博弈
重复博弈：有限重复博弈与无限重复博弈
博弈论与策略思维
15
参与者 1
博弈论与策略思维
16
标准式博弈:均衡分析
假设参与者1认为参与者2选择 “A”
参与者 2
标准式博弈:均衡分析
则参与者1应该选择 “a” 参与者1对参与者2选择 “A”的最优反应是 “a”.
参与者 2
专栏的博弈分析（制药公司销售大战）
默克辉瑞
策略适中庞大适中 10，10 13，5 庞大 5，13 7， 7
站在对手的位置上思考问题
如果你没有占优策略，那么从你对手角度考虑博弈。如果对手有占优策略，预期他将按占优策略行动
纳什均衡
我所做的是：给定你所做的，我所做的是最好的；你所做的是：给定我所做的，你所做的是最好的。
简单发展史基本分类博弈论精髓标准式博弈均衡分析应用
同步一次博弈
重复博弈
博弈论与策略思维
无限重复博弈有限重复博弈
7
8
博弈论导论—博弈论和诺贝尔经济学奖
1994：纳什（Nash）、海萨尼（J.Harsanyi）、泽尔腾（R.Selten）纳什的基本贡献是证明了非合作博弈均衡解及其存在性，建立了作为博弈论基础的“纳什均衡”概念；海萨尼则把不完全信息纳入到博弈论方法体系中；泽尔腾的贡献在于将博弈论由静态向动态的扩展，建立了“子博弈精练纳什均衡”的概念。 1996莫里斯（James A.Mirrlees）和维克瑞（William Vickrey）这两位经济学家的贡献集中于运用博弈论对现实经济问题的解释。
博弈论与策略思维
9
博弈论导论—博弈论和诺贝尔经济学奖
2001：阿克洛夫（Akerlof）、斯宾塞（Spence）、斯蒂格利茨（Stiglitz ）这三位作为不对称信息市场理论的奠基人被授予诺贝尔经济学奖，以表彰他们分别在柠檬品市场等不对称信息理论研究领域做出的基础性贡献。这些贡献发展了博弈论的方法体系，拓宽了其经济解释范围。 2002：弗农史密斯（Smith）贡献主要在于通过实验室实验来测试根据经济学理论而做出预测的未知或不确定性。是对以博弈论为基础构建的理论模型进行实证证伪工作的一大创举。
参与者 2 参与者 1
策略 a b c A 3，2 2，1 1，6 B 2，3 1，2 1，4 C 5，4 3，3 4，5
结果
参与者 2 参与者 1
策略 a b c A 3，2 2，1 1，6 B 2，3 1，2 1，4 C 5，4 3，3 4，5
“a” 是参与者1对 “C”的最优反应. “C” 是参与者2对 “a”的最优反应.
2，3 1，2 1，4 5，4 3，3 4，5
参与者 1
a b c
3，2 2，1 1，6
参与者 1
策略
A
B
C
策略 a b c
A 3，2 2，1 1，6
B 2，3 1，2 1，4
C 5，4 3，3 4，5
博弈论与策略思维
17
博弈论与策略思维
18
3
2012/11/26
标准式博弈:均衡分析
假设参与者1认为参与者2选择 “B”.
博弈论与策略思维
29
关键点囚徒困境是20世纪出现的重要思想之一，既简单得任何人都可以掌握，又具有极大的重要性。囚徒困境会发生在生物学、心理学、社会科学、经济学、法律等诸多领域，只要有利益冲突的地方，就可能会有困境，它揭示了个体理性与集体理性的冲突。困境对研究解释人类社会甚至动物界为什么会有现在这样的组织与结构极有好处。
参与者 2
标准式博弈:均衡分析
则参与者1应该选择 “a”. 参与者1对参与者2选择“B”的最优反应是 “a”.
5，4 3，3 4，5

参与者 1
a b c
3，2 2，1 1，6
2，3 1，2 1，4
参与者 1
策略
A
B
C
参与者 2
策略 a b c A 3，2 2，1 1，6 B 2，3 1，2 1，4 C 5，4 3，3 4，5
起源可以追溯到1944年数学家冯·诺伊曼与经济学家摩根斯坦合著的《博弈论与经济行为》，这是20世纪最有影响但读者却最少的书之一冯·诺伊曼（1903-1957）六岁时以超强记忆力出名，10岁时读完世界史百科全书，20多岁时已闻名世界数学界，对应用数学情有独钟（著名物理学家维格纳）父亲是成功银行家（家庭小图书馆），（纺织厂穿孔卡片与巴赫的赋格艺术）喜欢扑克，研究扑克和其他游戏的数学结构，认识到可以运用到经济、政治、军事等领域，从而形成了博弈理论计算机和原子弹是他的业余项目最早应用博弈论是兰德公司，任务是研究州际核战争的战略，诺伊曼是兰德的常客 20世纪70年代以来，博弈论在经济学中得到广泛的运用，成为经济学思想史上与“边际分析”和“凯恩斯革命”并列的重大革命，为人类带来了一种全新的方法论和思维方式博弈论与策略思维
4
基本框架
博弈论导论博弈论导论
同步一次博弈重复博弈：有限重复博弈与无限重复博弈多阶段博弈不对称信息下的博弈
基本框架
同步一次博弈
重复博弈：有限重复博弈与无限重复博弈
博弈论与策略思维
5
博弈论与策略思维
6
1
2012/11/26
课程主要内容
博弈论与策略思维
博弈论导论
博弈论导论—现代博弈论简单发展史
博弈论与策略思维
19
博弈论与策略思维
20
标准式博弈:均衡分析
如果参与者1认为参与者2选择 C… 参与者1对参与者2选择“C”的最优反应是“a”.
参与者 2 参与者 1
策略 a b c A 3，2 2，1 1，6 B 2，3 1，2 1，4 C 5，4 4，5 3，3
占优策略
不管参与者2是选择A、B还是C, 参与者1都会选择“a”! “a” 是参与者1的占优策略! 占优策略（上策）不管对手做什么，对一个参与者都能获得最高得益的策略
11
博弈论与策略思维
博弈论与策略思维
12
2
2012/11/26
博弈论导论
标准式博弈与扩展式博弈 : 矩阵博弈树同步博弈与序列博弈 : 每个参与方不知对方决策情况下作出决策; 参与方先观察对方行动，自己再行动。一次博弈与重复博弈:基本博弈只进行一次;基本博弈重复进行，包括有限重复和无限重复。零和博弈与非零和博弈 : 一方的情况只有当另一方情况变得更差时才能变得更好;另外一方情况不必变得更差，一方的情况就能变得更好。完全信息博弈与不完全信息博弈 : 完全信息博弈是指参与人对其他参与人的特征、策略和得益函数有准确知识，否则就是不完全信息博弈。静态博弈与动态博弈:参与人同时选择行动或虽非同时但后行动者并不知道前行动者采取什么行动;参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。
博弈论与策略思维
10
博弈论导论—博弈论和诺贝尔经济学奖

e商务文档

博弈论与策略思维

相关文档推荐：