博弈论及其简单的应用
博弈论及其简单应用
2010年3月16日
陈敬灿
一、介绍博弈论
(一)概念,什么是博弈论
1.概念:博弈论Game Theo ry,又称对策论,是使用严谨的数学 模型研究冲突对抗条件下最优决策问题 的理论,是研究竞争的逻辑和规律的数 学分支。简单地说,博弈论是研究决策 主体在给定信息结构下如何决策以最大 化自己的效用,以及不同决策主体之间 决策的均衡。
10
虚拟参与人pseudo-player
为了分析方便,自然nature被当作虚拟参
与人。 自然代表决定外生随机变量的概率分布 的机制。比如房地产开发中市场需求的 大小。
11
行动 ACTIONS OR MOVES
参与人在博弈的某个时点的决策变量。
(坦白) N个参与人的行动的有序集称为行动组合 (坦白,抵赖)。
清华诚志 7
NASH均衡
1950年和1951年纳什的两篇关于非合作
博弈论的重要论文,彻底改变了人们对 竞争和市场的看法。他证明了非合作博 弈及其均衡解,并证明了均衡解的存在 性,即著名的纳什均衡。从而揭示了博 弈均衡与经济均衡的内在联系。因为在 现实世界中,非合作博弈要比合作博弈 普遍得多。
NASH均衡条件下的行为规则
逃税 纳 纳税人 税 人 不逃税
税收机关 检查 A-C+F,-A-F 不检查
A-C, -A
0,0
A,-A
30
纳税检查边际
S 为税务机关检查的概率,E为纳税人逃
税概率。给定E,税收机关选择检查与否 的期望收益: K(1,E)=(A-C+F)E+(A-C)(1-E) =EF+A-C K(0,E)=0E+A(1-E)=A(1-E) 解K(1,E)= K(0,E),得:E=C/(A+F)纳税人 逃税概率小于E,税收机关的最优决策是 不检查,否则则反。
31
逃税边际
给定S,纳税人选择逃税与否的期望收益
是: K(S,1)=(-A-F)S+0(1-S)=-(A+F)S K(S,0)=-AS+(-A)(1-S)=-A 解K(S,1)= K(S,0) ,得S=A/(A+F)即,如 果税收机关检查的概率小于S,纳税人的最 优选择是逃税,否则交税。 混合纳什均衡是S,E,即税收机关以S的概 率查税,而纳税人以E的概率逃税。
线,协议由A方提供生产汽车的技术,B方则 提供厂房和设备。在对技术和设备进行资产评 估时就形成非合作博弈,因为每一方都试图最 大化己方的评估值,这时B方如果能够获得A 方关于技术的真实估价或参考报价这类竞争情 报,则可以使自己在评估中获得优势;同理, A方也是一样。至于自己的资产评估是否会影 响合作企业的总体运行效率这样的"集体利益", 则不会非常重视。这就是非合作博弈,参与人 在选择自己的行动时,优先考虑的是如何维护 自己的利益。
12
行动的顺序
对于博弈的结果非常重要。有关静态和
动态博弈的区分就是基于行动的顺序做 出的。 同样的行动集合,行动的顺序不同,每 个参与人的最有决策就不同,博弈的结 果也不同。尤其在不完全信息博弈中, 后行动者依赖观察先行动者的行动来获 取信息。
13
信息 information
参与人有关博弈的知识,特别是有关自
清华诚志 6
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意
义。个人理性与集体理性的冲突,各人 追求利己行为而导致的最终结局是一个 “纳什均衡”,也是对所有人都不利的 结局。他们两人都是在坦白与抵赖策略 上首先想到自己,这样他们必然要服长 的刑期。只有当他们都首先替对方着想 时,或者相互合谋(串供)时,才可以得到 最短时间的监禁的结果。
22
顺序和信息
博弈论非常强调时间和信息的重要性,
认为时间和信息是影响博弈均衡的主要 因素。在博弈过程中,参与者之间的信 息传递决定了其行动空间和最优战略的 选择;同时,博弈过程中始终存在一个 先后问题SequenceOrd er,参与人的行动次序对博弈最后 的均衡有直接的影响。
23
分类
则,它规定参与人在什么时候选择什么 行动。 战略与行动:战略是行动的规则而不是 行动本身。 在静态博弈中,战略和行动是相同的。 战略必须是完备的,要给出参与人在每 一种可想象得到的情况下的行动选择。
16
支付payoff(效用utility)
在一个特定的战略组合下参与人得到的
确定效用水平,或是指参与人得到的期 望效用水平。
27
价格战
厂家价格大战的结局也是一个“纳什均衡”,而且价
格战的结果是谁都没钱赚。因为博弈双方的利润正好 是零。竞争的结果是稳定的,即是一个“纳什均衡”。 这个结果可能对消费者是有利的,但对厂商而言是灾 难性的。所以,价格战对厂商而言意味着自杀。 1996年3月26日,作风强悍,霸气十足的长虹董事长倪 润峰宣布,所有品种彩电一律大幅度让利销售,降价 幅度从8%到18%。随后,猝不及防的其他中国厂家纷 纷选择跟进。 2005年4月16日,长虹公布了2004年年报,抛出中国股 市有史以来上市公司亏损之最:36.81亿元。价格战的 发明者和坚决的拥护者,为最后的豪赌交出了最昂贵 的学费。
32
博弈论的重要性
博弈论是一个强有力的分析工具。现在,它不
仅在经济学领域、在军事、政治、商业征战、 社会科学领域以及生物学等自然科学领域都有 非常重大的影响,工程学中如控制论工程也少 不了它。帮助大家形成博弈论的基本概念,实 际上它是非常精深的。现在与它紧密联系的经 济学分支是信息经济学。信号游戏、拍卖形式、 激励机制、委托人--代理人理论和公共财政学 是博弈论和信息经济学研究的重要课题
28
纯战略与混合战略
如果一个战略规定参与人在每一个给定
的信息情况下只选择一种特定的行动, 称为纯战略。 如果一个战略规定参与人在给定的信息 情况下以某种概率分布随机地选择不同 的行动,称为A 为应纳税款,C为检查成本, F是偷税
罚款。假定 C<A+F。不存在纯战略纳什 均衡。
25
不完 全信 息
主要思想
博弈论并不是经济学的一个分支,它只是一种
方法,这也是为什么许多人将其看成数学的一 个分支的缘故。博弈论已经在政治、经济、外 交和社会学领域有了广泛的应用,它为解决不 同实体的冲突和合作提供了一个宝贵的方法。 在对参与者行为研究这一点上,博弈论和经济 学家的研究模式是完全一样的。经济学越来越 转向人与人关系的研究,特别是人与人之间行 为的相互影响和相互作用,人与人之间利益和 冲突、竞争与合作,而这正是博弈论的研究对 象。
然的选择,其他参与人的特征和行动的 知识。 完美信息perfect information:指一个参与 人对其他参与人的行动选择有准确的理 解,即每个信息集只包含一个值。
14
共同知识common knowledge
所有参与人知道每一步的信息集。
15
战略strategies
参与人在给定信息集的情况下的行动规
26
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的
思想,每个个体都是理性的,所以必须了解竞 争对手的思想。商业关系被认为是一种相互作 用。但博弈论并不是疗法,并不是处方,它并 不告诉你该付多少钱买东西,这是计算机或者 字典的任务。博弈论只是提供一些关系的例证, 一些有用的解决问题的方法。这种思维方法也 许是企业家应该学习的。对于经济学家,也许 需要学习它的理论模型,它的实验方式
博弈的划分可以从参与人行动的次序和
参与人对其它参与人的特征、战略空间 和支付的知识、信息,是否了解两个角 度进行。把两个角度结合就得到了4种 博弈:完全信息静态博弈,完全信息动 态博弈,不完全信息静态博弈,不完全 信息动态博弈
24
博弈的分类及对应的均衡
静态 完全 信息 完全信息静态博弈; 纳什均衡; Nash(1950) 不完全信息静态博弈; 贝叶斯纳什均衡; 海萨尼(1967-1968) 动态 完全信息动态博弈; 子博弈精炼纳什均衡; 泽尔腾(1965) 不完全信息动态博弈, 精炼贝叶斯纳什均衡; 泽尔腾(1975) Kreps,Wilson(1982), Fudenberg,Tirole(1991)
3
3.博弈论的通俗名称
博弈论的提法可能太过于学术化,容易让人们
退避三舍。其实它有一个非常通俗的名字--游 戏理论(博弈论的英文名字叫做"Game T heory",如果直译,就是"游戏理论")。 博弈论在我国还有一个名字,叫对策论。这些 名字都很好理解,博弈字面意思就是赌博、下 棋,赌博和下棋当然是游戏了,赌博和下棋的 时候常常要千方百计地应付对手,自然是要讲 究对策了。
33
四.博弈论与运筹学
运筹学是近代应用数学的一个分支,主要是将
生产、管理等事件中出现的一些带有普遍性的 运筹问题加以提炼,然后利用数学方法进行解 决。前者提供模型,后者提供理论和方法。 运筹学本身也在不断发展,现在已经是一个包 括好几个分支的数学部门了。比如:数学规划 (又包含线性规划;非线性规划;整数规划; 组合规划等)、图论、网络流、决策分析、排 队论、可靠性数学理论、库存论、对策论、搜 索论、模拟等等。
4、囚徒困境的例子
A. W. Tucker的囚犯困境(Prisoner‘s
Dilemma):
囚徒B 坦白 囚徒A 坦白 抵赖 抵赖
-8,-8 -10,0
0,-10 -1,-1
囚徒困境说明了什么
在(坦白、坦白)这个组合中,A和B都不能
通过单方面的改变行动增加自己的收益,于是 谁也没有动力游离这个组合,因此这个组合是 纳什均衡,也叫非合作均衡。 囚徒困境反映了个人理性和集体理性的矛盾。 如果A和B都选择抵赖,各判刑1年,显然比 都选择坦白各判刑8年好得多。当然,A和B 可以在被警察抓到之前订立一个"攻守同盟", 但是这可能不会有用,因为它不构成纳什均衡, 没有人有积极性遵守这个协定,显然最好的策略 是双方都抵赖.