经济博弈论方法(1)
三位大师主要的贡献
1950年和1951年纳什的两篇关于非合作 博弈论的重要论文,彻底改变了人们对 竞争和市场的看法。他证明了非合作博 弈及其均衡解,并证明了均衡解的存在 性,即著名的纳什均衡。从而揭示了博 弈均衡与经济均衡的内在联系。因为在 现实世界中,非合作博弈要比合作博弈 普遍得多。
经济博弈论方法(1)
经济博弈论方法(1)
博弈的分类及对应的均衡
完全 信息
静态 完全信息静态博弈; 纳什均衡; Nash(1950)
动态
完全信息动态博弈; 子博弈精炼纳什均衡; 泽尔腾(1965)
不完 全信 息
不完全信息静态博弈; 贝叶斯纳什均衡;
海萨尼(1967-1968)
不完全信息动态博弈, 精炼贝叶斯纳什均衡; 泽尔腾(1975) Kreps,Wilson(1982), Fudenberg,Tirole(1991)
n 《国富论》:“通过追求(个人的)自身利 益,他常常会比其实际上想做的那样更 有效地促进社会利益。”
经济博弈论方法(1)
n 从“纳什均衡”我们引出了“看不见的 手”的原理的一个悖论:从利己目的出 发,结果损人不利己,既不利己也不利 他。两个囚徒的命运就是如此。从这个 意义上说,“纳什均衡”提出的悖论实 际上动摇了西方经济学的基石。
经济博弈论方法(1)
纳什均衡
n 纳什均衡的定义 n 纳什均衡的一致预测性 n 纳什均衡与严格下策反复消去法
经济博弈论方法(1)
纳什均衡的定义
各博弈方都不愿或不会单独改变自己 策略的策略组合,只要这种策略组合 存在且是唯一的,博弈就有绝对确定 的解。这种各博弈方都不愿单独改变 策略的策略组合就是博弈论中最重要 的一个概念——“纳什均衡”。
经济博弈论方法(1)
纯策略可以看作,选择相应纯策略 的概率为1,选择其余纯策略的概率 为0的混合策略。混合策略可以看作 纯策略的扩展。
经济博弈论方法(1)
引进了混合策略的概念以后,我们可将 纳什均衡的概念扩大到包括混合策略的 情况。对各博弈方的一个策略组合,不 管它是纯策略组成的还是混合策略组成 的,只要满足各博弈方都不会想要单独 偏离它,我们就称之为一个纳什均衡。 如果确实是一个严格意义上的混合策略
经济博弈论方法(1)
2020/12/12
经济博弈论方法(1)
第六章 完全信息静态博弈
n 博弈的基本概念 n 纳什均衡 n 纳什均衡应用 n 混合策略和混合策略纳什均衡
经济博弈论方法(1)
n 伐木工人的决策和一个将军的决策有什 么不同?
n 木头没有反抗。 n 将军的每一步计划都会引来抵抗,他必
须克服这种抵抗。 n 你!你的对手、竞争者都是聪明有主见
引言
n 博弈论 n 诺贝尔经济学奖 n 纳什(Nash) (1950-1951) n 泽尔腾(selten) (1965,1975) n 海萨尼(Harsanyi) (1967-1968) n 共同获得1994年诺贝尔经济学奖
经济博弈论方法(1)
数学界的梵高——“疯子天才”纳什
经济博弈论方法(1)
经济博弈论方法(1)
定义
在博弈
中;博弈
方i的策略空间为
,则博弃
方i以概率分布
随机在
其k个可选策略中选择的“策略”,称为
一个“混合策略”,其中
都成立,
且
经济博弈论方法(1)
相对于这种以一定概率分布在一些策略 中随机选择的混合策略,确定性的具体 的策略我们称为“纯策略”,而我们原 来意义上的纳什均衡,即任何博弈方都 不愿单独改变策略的纯策略组成的策略 组合现在可称为“纯策略纳什均衡”。 当然,纯策略也可以看作混合策略的特 例。
n 游戏的特征:规则,结果,策略,策略 和利益的依存性
经济博弈论方法(1)
什么是博弈论?
n博弈论:就是关于包含相互依存情况中理性 行为的研究。 n相互依存 :通常是指博弈中的任何一个局中 人受到其他局中人的行为的影响,反过来, 他的行为也影响到其他局中人。 n相互依存的另一个方面是局中人可以有某些 共同的兴趣或利益所在。 n“理性行为”的说明:博弈论中的所谓理性, 一般不是指道德标准。
经济博弈论方法(1)
纳什均衡应用
两个嫌犯受到指控,但除非至少一个招认, 否则警方不能将二人判有罪。警察把二人 分别带到不同的房间,告之后果:
如果二人均不坦白,将被判入狱一年。 如果双方均坦白,将被判入狱5年。 如果一方坦白,另一方不坦白,坦白一 方立即释放,另一方判入狱8年。
经济博弈论方法(1)
囚徒2
接近实际的不完全信息条件。他们的工作为
后人继续发展博弈论,提供了基本思路和模
型。
经济博弈论方法(1)
诺贝尔经济学奖
n 1968年,瑞典中央银行成立300周年, 是为了纪念诺贝尔奖奖金提供者,设 立诺贝尔经济学奖。
n 1969年开始颁发。
经济博弈论方法(1)
从游戏到博弈
n 游戏的特点:下棋,打牌,赌胜,田径, 球类等等,共同的特点是 策略 策略的好坏决定游戏的结果
方决策的好坏就会从平均得益上反映出
来,策略运用得当平均收益会较理想, 至少是不吃亏,否则平均得益就会很差。
经济博弈论方法(1)
ห้องสมุดไป่ตู้
概念的引进
经济博弈论方法(1)
在这种博弈中各博弈方决策的第一个 原则:自己的策略选择千万不能预先 被另一方侦知或猜到。
这就是说博弈方必须随机地选择策略。
其次,在本博弈中,如果盖硬币方虽然 是随机决定出正面还是反面,但如果 在总体上出正面多于出反面,即出正 面的概率大于出反面的概率,则猜硬 币方还是有机可乘。
经济博弈论方法(1)
定义
在博弈
中,如果
由各个博弈方的各一个策略组成的某个策略组
合
中,任一博弈方i的策略 ,都
是对其余博弈方策略的组合
的最佳策略,即
对任意
都成立,则称
为G
的一个“纳什均衡”。
经济博弈论方法(1)
纳什均衡的一致预测性
如果所有博弈方预测到一个特定的纳什 均衡将会出现,那么,没有人有兴趣作 不同的选择。 纳什均衡的特征:博弈方预测到均衡, 博弈方预测到其他博弈方预测到均衡, 等等。 一致性预测,并不意味着纳什均衡一定 是一个好的预测。
经济博弈论方法(1)
我们常用G表示一个博弈; 如G有n个博
弈方,每个博弈方的全部可选策略的集
合我们称策略空间,分别用
表示;
用 表示博弈方i的第j个策略,其中j可
取有限个值(有限策略博弈),也可取无限
个值(无限策略博弈);博弈方i的得益则
用 表示, 是各博弈方策略的多元函数。
n个博弈方的博弈G常写成
经济博弈论方法(1)
设盖硬币方出正面的概率为p,则出反面 的概率为1-p.出正面多于出反面,即 p>1-p或p>1/2。在这种情况下,如
猜硬币方全猜正面,则他的期望得益:
即平均来讲,猜硬币方一定是赢多输少。
经济博弈论方法(1)
双方都按照上述概率随机选择策略,即 在本博弈中,博弈方的决策内容不是确 定性的具体的策略,而是在一些策略中 随机选择的概率分布,这样的决策我们 称为“混合策略”。
经济博弈论方法(1)
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意 义。个人理性与集体理性的冲突,各人 追求利己行为而导致的最终结局是一个 “纳什均衡”,也是对所有人都不利的 结局。他们两人都是在坦白与不坦白策 略上首先想到自己,这样他们必然要服 长的刑期。只有当他们都首先替对方着 想时,或者相互合谋(串供)时,才可以得 到最短时间的监禁的结果。
经济博弈论方法(1)
该混合策略纳什均衡的期望结果(即双方的 期望得益)分别为:
经济博弈论方法(1)
虽然单独一次博弈的结果可能是四 组得益中的任何一组.但是多次独 立重复博弈的平均结果却应该是双 方各得2.6。
经济博弈论方法(1)
混合策略和混合策略均衡的概念不仅 可用在不存在纯策略纳什均衡的博弈 问题中(这种问题各博弈方之间的利益 总是有一定的对立性),在没有确定性 结果的博弈、即存在多个纯策略纳什 均衡的博弈(这种博弈中博弈方之间的 利益有相当的一致性)中也可运用。
经济博弈论方法(1)
博弈三要素
n 博弈方(局中人)----参与博弈但利益不完 全一致者。有二人博弈与多人博弈之分。
n 策略集----每个局中人都会有一系列的策略 可选,称为对应于每个局中人的策略集。 有限和无限个对策。
n 得益----在每策略组合下每一局中人的得益 情况,是选择策略的标准,称为得益函数 或支付函数。
的!
经济博弈论方法(1)
n 社会科学研究策略性决策制定过程的分 支称为- 博弈论。
n 严格讲,博弈论不是经济学的一个分支, 它是一种方法,涉及到很多领域:
n 实际上,博弈论是数学的一个分支。
经济博弈论方法(1)
策略故事
n 妙手传奇 n 给猫拴个铃铛 n 多管齐下 n 三思而后行
经济博弈论方法(1)
经济博弈论方法(1)
博弈的关键
局中人理性地采取或选择自己的策略 行为,在相互制约相互影响的依存关系 中,尽可能的提高自己的利益所得,这 样,博弈论就是关于包含相互依存情况 中理性行为的研究。
相互依存 理性行为
经济博弈论方法(1)
博弈的四种分类情况
n 完全信息静态博弈 n 完全信息动态博弈 n 不完全信息静态博弈 n 不完全信息动态博弈
经济博弈论方法(1)
设博弈方1选A的概率为pA,选B的概率为pB, 博根弃据方上2述选第C二的个概原率则为,pC博,弈选方D的1选概A率和为Bp的D。 概 率,一定要使博弈方2选C的期望得益和选D的
期望得益相等,即:
这是博弈方1的混合策略。
经济博弈论方法(1)
同理,博弈方2的混合策略为