博弈论简介PPT
1.3博弈论的理论体系
核心是策略选择
非合作博弈理论
博 弈 论
承诺的强制力不同 不 完 全 信 息 静 态 博 弈 不 完 全 信 息 动 态 博 弈
合作博弈理论
完 全 信 息 静 态 博 弈
完 全 信 息 动 态 博 弈
核心是利益分配
二、完全信息静态博弈
在博弈论中由抽象出来现实博弈中的最基本要素所构成的模型就 是所谓的策略型,或称标准型博弈。是整个博弈论的基石
多种定义:
(1)以严格的数学模型对人类斗智现象进行规范描述,并加 以数学分析。 (2)博弈论是关于策略相互作用的理论,就是说,它是关于 社会形势中理性行为的理论,其中每个局中人对自己行动的选择必须 以他对其他局中人将如何反应的判断为基础。——豪尔绍尼,1994诺 贝尔经济学奖得主 (3)博弈论研究的是人与人之间利益相互制约下策略选择时 的理性行为及相应结局。
引入市场进入博弈事例:
一种行业有两个相关企业,一个是垄断者(局中人1),另一个 是潜在的进入者(局中人2),局中人1决定是否建立一个新工厂, 而同时局中人 2决定是否进入这一行业。其中存在着不完全信息,局 中人2不知道局中人1的建厂成本是3还是1,而局中人1知道自己的成 本。这样形成的不完全信息博弈局势如下图。
豪尔 绍尼 转换
3.2联合概率分布实例
内容:
两个企业在一种产品市场竞争,它们彼此不清楚对方对 于相关事务的真实力量,而只知道自己的力量,双方力量的 不同会导致双方使用策略不变的情况下最终结局的不同。这 种局势的简化描述为:双方均有两种类型,即力量的强与 弱。
联合概率分布:
强 强 弱 0.3 0.1 弱 0.2 0.4
如果企业1为“强”类型,那么它对企业2的类型判断依据贝叶斯推断 原则有:企业2为“强”类型的概率为0.3/(0.3+0.2)=0.6;企业2为 “弱”类型的概率为0.2/(0.3+0.2)=0.4.而当企业1为“弱”时,它对企业2 类型的主观判断为企业2为强与弱的概率分别为0.2和0.8。以此类推。
发展壮大期:
20世纪60-80年代。这段时间,合作博弈理论继续充实和丰富,而 非合作博弈理论更是发展迅速,成为博弈论研究和应用的主流。50年 代冷战开始的背景下,博弈论主要应用与军事战略战术问题,50年代 后期,博弈论的主要应用领域开始转向经济学,60年代,博弈论与数 理经济学及经济领域的各个方面均建立起牢固而持久的联系。 兰德公司,《国际博弈论杂志》
核心:局中人策略选择的相互影响,即策略相 关性。
1.2博弈论的发展历程
萌芽期:
19世纪到20世纪30年代。早起发轫学者们对社会经济理论和现实问 题的一些思考,其思路和方法迥异于现代博弈论,但思想成果对博弈 论的发展起到积极的启发和推动作用。古诺(Cournot)是早期研究数 理经济学和博弈论的重要人物,其代表作是对垄断经济的数量分析是 数理经济学研究的经典之作,并被视为经济理论的起点。现代博弈论 中的纳什均衡也被称作古诺-纳什均衡。20世纪初,以数学家为主,研 究者们开始关注博弈问题,主要专注于严格竞争博弈,即双人零和博 弈,一个人的收益必然意味着另一个人等量的损失。值得一提的, 1913年泽梅罗(Zemelo)证明了,在对局者完全理性的情况下,
2.3.1性别战
内容:
夫妻要决定周末怎么消遣,丈夫喜欢足球,妻子喜欢芭蕾,但 他们同时又都希望能一起度过,对应的博弈局势如分析。
分析:
丈夫 足球 芭蕾 妻子 足球 (3,2) (0,0) 芭蕾 (0,0) (2,3)
(3,2)和(2,3)为两个纯策略纳什均衡点,不同夫妻不同心理状 态下最后的结局不同,这就告诉我们,为了回答人们的现实理性选择 问题,只有博弈论框架是不够的,这就是纳什均衡的弱点
2.2纳什均衡
定义:
纳什均衡(Nash Equilibrium),简称NE,这一概念是现代博弈 论中的核心内容和重要基础。
分析:
强纳什均衡是指每个局中人对于对手的策略有唯一的最佳反应,例 如囚徒困境中的(坦白,坦白) 纳什均衡最重要的性质是“自我强制性”,如果局中人就纳什均衡 结局达成协议,那么不需要任何外力的帮助,它自身就蕴含着保障实 现的力量。任何非纳什均衡的结局要成为协定都需要外在强制力量 (道德、法律等)的帮助,否则有的局中人将会有动机背叛协定。 纳什均衡的弱点是,它并不能保证唯一性,存在多个纳什均衡时哪 一个会在现实中出现是一个难以解决的问题。
Game Theory
一、什么是博弈论?
1 2
博弈论的研究对象 博弈论的发展历程
博弈论的理论体系
3
1.1博弈论的研究对象
研究问题:
博弈论,Game Theory,也译作对策论。作为一门现代学科体系, 博弈论建立的时间并不长,然而他所研究的问题却是包罗万象。小到 象棋之类的游戏,中到经济生活中的各种交易,大到国家之间的征伐 斗争,其间无不涉及到人与人之间的斗智,即参与方需要琢磨对方可 能的选择,由此来确定自己的对策。博弈论正是来自与人类对这种斗 智现象的观察和思考。
国际象棋的输赢是严格确定的。
体系建立期:
突出事件是1944年约翰· 冯· 诺依曼和奥斯卡· 摩根斯坦的巨著《博弈 论和经济行为》出版,标志着博弈论作为一门学科的建立,也被视为 经济学学科建立的里程碑。这一时期,合作博弈理论作为博弈论研究 的重点,但不久后约翰· 纳什的开创性工作使得博弈论的研究重心发生 了转移,它于1951年提出纳什均衡的概念,为非合作博弈的一般理论 和谈判理论奠定了基础。
2.3.2猎鹿博弈
内容:
猎鹿需要把守住两个关键位置,都坚守岗位,可以猎到鹿,各得 2,如果其中一人离开岗位,他可以抓住兔子,获得1,如果两人都 去猎兔,彼此的冲突会让大家什么也得不到。
分析:
猎人1 猎鹿 猎兔 猎人2 猎鹿 (2,2) (1,0) 猎兔 (0,1) (0,0)
(2,2)为一个纯纳什均衡点,这一理性结局是否能实现,取决于 人的互信。这一局势表明,即使在理论上看不到任何障碍的均衡博弈 局势,拿到实际中也可能产生复杂的变化,尤其是在涉及人的微妙心 理状态的时候。
市场进入博弈局势:
高成本支付矩阵
进入 建厂 不建厂 (0,-1) (2,1) 不进入 (2,0) (3,0)
பைடு நூலகம்
低成本支付矩阵
进入 (1,-1) (2,1) 不进入 (4,0) (3,0)
分析:
在例子中,如果局中人1的建厂成本高,那么惟一的纯策略纳什 均衡是:局中人1不建厂,局中人2进入;如果局中人1的建厂成本 低,那么唯一的纯策略纳什均衡是:局中人1建厂,局中人2不进 入。因此,建厂成本是高还是低对于两个局中人来说都很重要,他们 分别对应着不同的均衡结局。 因此,局中人需要对自己所不能确知的任何信息作出主观判断, 并在此基础上决定自己的行为。在不完全信息博弈中,并非所有人都 知道同样的信息,除了都知道的公共信息外,局中人各自还具有自己 的私有信息。于是进行策略选择时,局中人需要猜测其他局中人的私 有信息,也同时需要猜测其他局中人对自己私有信息的猜测,这种对 猜测的猜测序列还可以无限继续下去。 豪尔绍尼将这种由不完全信息引发的复杂问题称为“递阶期 望”,从初始的判断出发会形成原来越高阶的判断之判断的问题。
局中人2
坦白 (-6,-6) (-8,-1) 不坦白 (-1,-8) (-2,-2)
优超:如果一个局中人在任何情况下从某种策略中得到的支付均大于从另 一种策略中得到的支付,那么对他而言,前一种策略优于后一种策略。对 局中人1来讲,“坦白”策略优超“不坦白”策略。 利用优超概念,可以通过迭代剔除被严格优超策略的方法对博弈局势求 解。其方法是:对每个局中人寻找被严格优超的策略,由于它不会被局中 人选择实施,所以找到一种后就可以将其从博弈局势中剔除,从而得到一 种新的缩减后的博弈局势,对这种新局势重复上述过程,直到无法找到新 的被优超策略为止,策略剔除的顺序不影响结果,这在数学上已有证明。
博弈的参与者。i,博弈的决 策主体,根据自己的利益决定 自己的行为。可以是自然人, 也可以是各种社会组织团体或 者生物
局 中 人
策略型 博弈 三要素
纯策略和混合策略。 i的混合策略是其纯 策略空间上的一种概 率分布,表示局中人 实际博弈时根据这种 概率分布在纯策略中 随机选择加以实施
策 略
支 付
每个局中人从 各种策略组合 中获得的收 益,这里的收 益往往采用效 用概念,由于 它是策略组合 的函数,也被 称为支付函数
3.1豪尔绍尼转换
类型
不完全信息博弈
每个局中人所知道的是: 他的私有信息,即自己是何种 特定类型,以及其他各个局中 人的实际类型分别为相应若干 种可能类型中的一种,但不知 道具体是哪种。
不完美 信息的 完全信 息博弈
概率 模型
贝叶斯理论中设计了以后 总概率模型,假设局中人的 类型来自于一种类型上的联 合概率分布:p(θ1, θ2,,,θn)——共有信息; 局中人i知道自己的为θi的情 况下对对手类型形成的条件 概率分布 p(θ-i/θi),按贝叶斯推断即 为p(θ-i/θi)/p(θi) 在概率模型的基础上,引 入“自然”这一虚拟局中人, 所有局中人的实际类型均来自 于由“自然”根据类型上的联 合概率分布进行的一种初始抽 彩。
三、不完全信息静态博弈
不完全信息:
在现实社会经济背景中,在进行策略选择时对相关信息了解不充 分的情况随处可见,可以说是现实生活中的常态。博弈论早期因为其 缺乏处理不完全信息的一般性手段而饱受批评,认为其分析缺乏现实 基础,结论也失去了实用价值。这种局面知道豪尔绍尼提出了贝叶斯 博弈理论才得以改变。 从技术上来说,博弈论中的不完全信息表现为对博弈的基本数学 结构的了解不充分,也就是对三种组成部分,即局中人、策略和支付 有着不完全的了解。在理论上,各类不完全信息在博弈论分析中都可 以转化为不完全信息情势:局中人对其他局中人(甚至他自己)的支 付函数的不完全了解。