博弈论研究博弈论研究的是什么?1994年10月11日,瑞典皇家科学院宣布,由于纳什博士对非合作博弈理论中的均衡问题进行了开创性分析,与哈尔萨尼教授(P rofessor JohnC.Harsanyi)和泽尔滕教授(P rofessorDr.Reinhard Selten)分享了该年度的诺贝尔经济学奖,奖金93万美元。
博弈论研究人们的策略互动行为。
博弈论认为:一、人是理性的,即人人都会在约束条件下最大化自身的利益;二、人们在交往合作中有冲突,行为互相影响,而且信息不对称。
博弈论研究人们的行为,在直接相互作用时的决策,以及决策的均衡问题。
换句话说,博弈论研究如何使得人们在市场经济中,自愿做出大家都遵守和实施的有效制度安排,以增进社会的福利的机制。
博弈论是深刻理解经济行为和社会问题的基础。
现在人们说的博弈论,一般指非合作博弈论。
它的特征是:人们行为相互作用时,当事人不能达成一个有约束力的协议。
或者说,行为人之间的合约对于签约人没有实质性约束力。
例如,现实中的非合作博弈问题的例子是,石油卡特尔欧佩克的产量协议,对于其成员国就没有约束力。
你心里想什么我不知道,我也不想让你知道我心里想什么。
因此,协议经常不能坚持到底,总有一国先行增产降价以谋求自己更高的利润。
纳什在1950年和1951年发表了两篇关于非合作博弈的论文,《n人博弈中的均衡点》和《非合作博弈》,定义了“纳什均衡”概念,与T ucker于1950年定义的“囚徒困境”一起,奠定了当代非合作博弈论的基石。
纳什获得诺贝尔经济学奖,就是基于这两篇论文。
在纳什的基础上,后来的泽尔滕精炼了纳什均衡概念,定义了完全信息动态博弈的“子博弈完备纳什均衡”(1965),以及进一步刻画不完全信息动态博弈的“完备贝叶斯纳什均衡”(1975)。
而哈尔萨尼则发展了刻画不完全信息静态博弈的“贝叶斯纳什均衡”(1967-1968)。
总之,他俩进一步将纳什均衡动态化,加入了接近实际的不完全信息条件。
他们的工作为后人继续发展博弈论,提供了基本思路和模型,因此他们也与纳什同时获得了诺贝尔经济学奖。
较为正式地说,纳什均衡是一种策略组合,给定对手的策略,每个参与人选择自己的最优策略。
也就是说,纳什均衡是一种僵局,其他参与人的策略一定,没有任何人有积极性偏离这种均衡的局面。
经济学中的完全竞争均衡,就是纳什均衡,因为买卖双方都是按照既定的价格进行交易量的选择,结果导致了零利润。
把上述思想应用于现实经济、政治等境况,可以得出许多有益的结果,加深我们对于人们的社会行为的认识。
博弈论的经典案例:“囚徒困境”“囚徒困境”说的是两个囚犯的故事。
这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。
在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。
这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。
但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。
而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。
当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。
那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。
但他们不得不仔细考虑对方可能采取什么选择。
A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。
这种想法的诱惑力实在太大了。
但他也意识到,他的同伙也不是傻子,也会这样来设想他。
所以,A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。
而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。
所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。
当然,在现实世界里,信任与合作很少达到如此两难的境地。
谈判、人际关系、强制性的合同和其他许多因素左右了当事人的决定。
但囚徒的两难境地确实抓住了不信任和需要相互防范背叛这种真实的一面。
让我们看看冷战时期两个超级大国将自己锁定在一场40年的军备竞赛中,其结果对双方都毫无益处。
还有各国的贸易保护主义的永恒倾向也很能说明问题。
比如贸易自由与壁垒,这个问题对于刚刚加入W TO的中国而言尤为重要。
任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。
贸易自由与壁垒问题,也是一个“纳什均衡”,这个均衡是贸易双方采取不合作博弈的策略,结果使双方因贸易战受到损害。
X国试图对Y国进行进口贸易限制,比如提高关税,则Y国必然会进行反击,也提高关税,结果谁也没有捞到好处。
反之,如X和Y能达成合作性均衡,即从互惠互利的原则出发,双方都减少关税限制,结果大家都从贸易自由中获得了最大利益,而且全球贸易的总收益也增加了。
博弈论已成为整个社会科学的一个方法我们可以看出,在上述博弈论及其应用中,没有“美丽的心灵”式的先验的道德的余地。
博弈论强调用互惠策略(一报还一报),促进行为人之间的合作,形成基于个体理性(利己动机)的集体理性结局(正的外部性或者利他行为),形成社会的道德共识。
简单说就是:你对我好,我就对你好;你对我不好,我也对你不好。
我对你好,是为了你能继续对我好。
我对你不好,不是睚眦必报的互相损害,而是要将对方重新拉回合作的轨道。
实现的机制是,通过对恶劣行为的惩罚,驱使行为人合作。
因为从多次博弈和演进的角度看,合作比不合作的收益大于成本,不合作比合作的收益小于成本。
这就是博弈论应用于经济制度设计的原理之一,也可以看做是可供选择的人类社会道德共识演进的机制。
在分析改革过程中各阶层或者群体利益消长和继续改革的态度时,博弈论为我们提供了一个简洁深刻的工具。
改革必须有人付出成本(包括风险),而改革结果的收益是大家共享。
有人认识到这一点,就不愿努力改革,生怕别人搭便车。
这样的人多了,就会出现人人希望改革,很少人投身改革的局面,都维持在旧体制下度日。
如此,怕别人搭便车,结果人人没有车搭,大家都步行。
这种思考方式,也可以用来分析公共物品的供给中的机会主义问题。
我们还可以将这里的思想引申到商品(包括股票)定价过程和制度。
市场的功能是缩小人与人之间的距离,使得个人很容易在议价过程中转向众多的潜在交易伙伴。
价格的制定,以非人格定价为好。
非人格定价,是指市场价格对任何人都一样。
明码标价就是一种非人格定价。
这表面看起来像是卖方定价,但是在法治较好的竞争性市场中,买者可以选择多个卖方,以用脚投票的方式间接定价。
股票市场的合法投机套利活动,可能促进非人格定价的形成,减少因人而异的人格定价行为,从而使机会主义行为减少,降低内生交易成本。
这符合我们大多数股民的共同利益,揭明了我们为什么要在股市交易中戒除腐败和违法活动的基本道理。
博弈论在过去二三十年中,是经济学理论中发展得最为成功的一部分,博弈论已成为整个社会科学的一个方法。
有人说,如果未来社会科学还有纯理论的话,那就是博弈论。
博弈论提供了一种系统的方法,使人们在其命运取决于他人的行为时制定出相应的战略。
特别是当许多相互依赖的因素共存,没有任何决策能独立于其它许多决策之外时,博弈论更是有用。
当然,博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。
好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。
其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。
博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。
所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。
学习管理学或经济学的人一定都了解一些博弈论方面的知识。
在博弈论中有一个经典案例——囚徒困境,非常耐人回味。
----“囚徒困境”说的是两个囚犯的故事。
这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。
在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。
这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。
但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。
而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。
当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。
----那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。
但他们不得不仔细考虑对方可能采取什么选择。
A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。
这种想法的诱惑力实在太大了。
但他也意识到,他的同伙也不是傻子,也会这样来设想他。
所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。
而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。
所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。
----当然,在现实世界里,信任与合作很少达到如此两难的境地。
谈判、人际关系、强制性的合同和其他许多因素左右了当事人的决定。
但囚徒的两难境地确实抓住了不信任和需要相互防范背叛这种真实的一面。
让我们看看冷战时期两个超级大国将自己锁定在一场40年的军备竞赛中,其结果对双方都毫无益处。
还有各国的贸易保护主义的永恒倾向。
----但是,无论在自然界还是在人类社会,“合作”都是一种随处可见的现象。
那么,问题就出现了:到底是何种机制促使生物体或者人类进行相互合作呢?----这个问题的答案大部分归功于美国密西根大学一位叫做罗伯特·爱克斯罗德的人。
爱克斯罗德是一个政治科学家,对合作的问题久有研究兴趣。