最新第10讲合作博弈论
合作博弈的核心问题是参与人如何结盟以及 如何重新分配结盟的得益。
下面首先分析联盟的概念,与联盟相关联的 是特征函数。
•
在1950年到1953年间,纳什发表了四篇有关博弈论
的重要文献(纳什,1950a,1950b,1951,1953),文
献中很清楚地对合作博弈与非合作博弈进行了界定,他所
用的界定条件就是博弈者之间是否具有约束力的协议。他
第10讲合作博弈论
合作博弈的含义
• 前面介绍的各种博弈模型,都是非合作博弈模型; • 这些(非合作博弈)模型的一个共同特点是强调“
个体理性 (individual rationality)”; • 合作博弈则强调群体理性 (group rationality); • 群体理性的含义是:从一个群体整体角度,研究策
合作博弈的结果必须是一个帕累托改进,博 弈双方的利益都有所增加,或者至少是一方的利 益增加,而另一方的利益不受损害。合作博弈研 究人们达成合作时如何分配合作得到的收益,即 收益分配问题。合作博弈采取的是一种合作的方 式,合作之所以能够增进双方的利益,就是因为 合作博弈能够产生一种合作剩余。至于合作剩余 在博弈各方之间如何分配,取决于博弈各方的力 量对比和制度设计。因此,合作剩余的分配既是 合作的结果,又是达成合作的条件。
作博弈。实际上,合作博弈的出现和研究比非合作博弈要
早,早在1881年,Edgeworth在他的《数学心理学》一书 中就已经体现了合作博弈的思想。
• 合作博弈的运用研究主要涉及企业、城市、区域经济 以及国家之间的合作等多个方面问题。
• 虽然这些分析所针对的合作问题类型不同,研究重点或 在于阐明合作的内在逻辑,或在于揭示合作的动因,但是 研究结果则有助于加强企业的相互联系、完善城市的合作 模式、推动区域经济合作实践、促进国家之间的经济交往。
•
这里,我们首先介绍静态合作的基本概念,然后再介
绍各种静态合作博弈的不同解法,包括核心(core)与稳
定集(stable sets)、夏普利值(Shapley value)、谈判
集 ( negotiation sets ) 、 内 核 ( kernel ) 与 核 仁
(nucleolus),最后再举出静态合作在现实的经济方面的
如果两个参与人在博弈之前,签署了一个协议:两个人都 承诺选择抵抗,为保证承诺的实现,参与人双方向第三方支付 价值大于1的保证金;如果谁违背了这个协议,则放弃保证金。 有了这样一个协议,<抵抗,抵抗>就称为一个均衡,每个人的 收益都得到改善。
上述分析表明,通过一个有约束力的协议,原来不能实现 的合作方案现在可以实现。这就是合作博弈与非合作博弈的区 别。二者的主要区别在于人们的行为相互作用时,当事人是否达 成一个具有约束力的协议。如果有,就是合作博弈;反之,则是非 合作博弈。 因此,博弈可以划分为合作博弈与非合作博弈。
认为如果一个博弈当中的博弈者能够作出具有约束力的协
议,那么此博弈便是一个合作博弈,反之,则称为一个非
合作博弈。
•
根据纳什的这一界定条件,由于合作博弈中存在具有
约束力的协议,因此,每位博弈者都能够按自己的利益与
其他部分的博弈者组成一个小集团,彼此合作以谋求更大
的总支付。我们称这些小集团为联盟(coalition),而由
合作博弈的基本形式是联盟博弈,它隐含的假设是存在 一个在参与者之间可以自由流动的交换媒介(如货币),每个 参与者的效用与它是线性相关的。这些博弈被称为“单边 支付”博弈,或可转移效用(Transferable Utility ,TU)博弈。
例子:自行车交易博弈
非合作博弈解
乔伊
米 出让 奇 保留
出让 110,90 200,0
50
益
0
解集
50 80 100 150
乔伊的收益
解集:在存在两种或两种以上有效配置方案 时,所有的有效解的集合。
可行解范围的影响因素: (1)来自其他潜在交易者的竞争压力; (2)公平性; (3)讨价还价能力。
(3)可信的承诺 承诺不可信→协议不能达成→非合作博弈解; 承诺可信→协议能达成→联盟→合作博弈解.
保留 10,170 100,80
合作博弈解
两人达成一致,结成联盟,从而实现双赢。
米 出让 奇 保留
乔伊 出让
保留
110,90
10,170
200,0
100,80
每人都比非合作博弈时增加10单位的收益。
(1)旁支付
在合作博弈中,买卖双方的转让支付是与协议 联系在一起的,联盟成员用支付货币的方式弥补 参与者放弃单人联盟或其他联盟形式的损失,此 种货币支付叫做旁支付(side payment)。
以是否与货币联系在一起为标准,分为转移效 用与不存在转移效用两类。
旁支付的概念来自于赌博。上例中的合作博弈 解依靠协议达成,因此各自的旁支付为110和90。
(2)解集
即允许旁支付的情况下,在保证每个参与者 至少获得非合作博弈收益的基础上,使总收益达 到最大值的所有合作博弈联盟。
米 150 奇 的 100 收
第一节 合作博弈的基本概念
合作博弈是指参与者能够联合达成一个具有约束力且 可强制执行的协议的博弈类型。合作博弈强调的是集体理 性,强调效率、公正、公平。
合作博弈最重要的两个概念是联盟和分配。每个参与 者从联盟中分配的收益正好是各种联盟形式的最大总收益。 每个参与者从联盟中分配到的收益不小于单独经营所得收 益。
各种解法的应用例子。
导论
先回忆一下囚徒困境的例子:
在囚徒困境中,还有另外一个策略组合<抵抗,抵抗>, 该组合为参与人带来的支付是<-1,-1>。由<-8,-8>到 <-1,-1>,每个参与人的支付都增加了,即得到一个帕 累托改进。
<抵抗,抵抗>构不成一个均衡是基于参与人的个ห้องสมุดไป่ตู้理性。在参 与人选择抵抗的情况下,每个参与人都有动机偏离这个组合, 通过投机行为谋取超额收益1。
略的选择,使得整体效用最大. • 与非合作博弈相比,需要一个描述集体理性的效用
函数;
合作博弈
•
一般来说,博弈论可以分为合作博弈(cooperative
games)与非合作博弈(non-cooperative games),现
代大多经济学家谈到的博弈论往往指的是非合作博弈论,
很少提到合作博弈论,甚至很多博弈论教材也未曾提到合