第22卷哈尔滨师范大学自然科学学报Vol .22,No .42006第4期NAT URAL SC I E NCES JOURNAL OF HARB I N NOR MAL UN I V ERSI TY博弈论与纳什均衡郭 鹏(中国矿业大学)杨晓琴(鸡西大学)【摘要】 纳什均衡的提出和不断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础.关键词:博弈论;纳什均衡;非合作博弈收稿日期:2006-02-150 引言博弈论又称对策论,是使用严谨的数学模型研究现实世界中冲突对抗条件下最优决策问题的理论.两千多年前,孙膑利用博弈论原理帮助田忌赛马取胜,就是早期博弈论的萌芽.作为一门正式学科,博弈论是在20世纪40年代形成并发展起来的,合作型博弈在20世纪50年代达到了巅峰期.然而,它过于抽象,实用性不强,其局限性日益暴露出来.50年代以来,纳什(Nash )、泽尔腾(Selten )、海萨尼(Harsanyi )等人使博弈论成熟并最终进入实用.最近三四十年,经济学经历了一场“博弈论革命”,引入博弈论的概念和方法改造经济学的思维,推进经济学的研究.1994年诺贝尔经济学奖授予3位博弈论专家纳什、泽尔腾和海萨尼,可以看作是一个标志,这也激发了人们了解博弈论的热情.博弈论作为现代经济学的前沿领域,已成为占据主流地位的基本分析工具.简单地说,博弈论研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间决策的均衡.博弈论由3个基本要素组成:一是决策主体(Player ),又可以译为参与人或局中人;二是给定的信息结构,可以理解为参与人可选择的策略和行动空间,又叫策略集;三是效用(U tility ),是可以定义或量化的参与人的利益,也是所有参与人真正关心的东西,又称偏好或支付函数.参与人、策略集和效用构成了一个基本的博弈.1 博弈论的主要思想一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织:第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失.博弈论模型可以用五个方面来描述:G ={P,A,S,I,U )P:为局中人,博弈的参与者,也称为“博弈方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标.A:为各局中人的所有可能的策略或行动的集合.根据该集合是有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策、重复博弈和微分对策等.S:博弈的进程,也是博弈进行的次序.局中人同时行动的一次性决策的博弈,称为静态博弈;局中人行动有先后次序,称为动态博弈.I:博弈信息,能够影响最后博弈结局的所有局中人的情报.信息在博弈中占重要的地位,博弈的赢得很大程度上依赖于信息的准确度与多寡.得益信息是博弈中的重要信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈.反之为不完全信息博弈.在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动.如果完全了解则称之为“具有完美信息”的博弈.反之称为“不完美信息的动态博弈”.由于信息不完美,博弈的结果只能是概率期望,而不能像完美信息博弈那样有确定的结果.U:为局中人获得利益,也是博弈各方追求的最终目标.根据各方得益的不同情况,分为零和博弈与变和博弈.零和博弈中各方利益之间是完全对立的.变和博弈有可能存在合作关系,争取双赢的局面.博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论.前者主要强调的是团体理性;而后者主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,即策略选择问题,强调的是个人理性.两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议.倘若不能,则称非合作博弈,非合作博弈是现代博弈论的研究重点.博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识(信息)是否了解两个角度进行.把两个角度结合就得到了4种博弈:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈.严格地讲,博弈论并不是经济学的一个分支,它只是一种方法,这也是为什么许多人将其看成数学的一个分支的缘故.博弈论已经在政治、经济、外交和社会学领域有了广泛的应用,它为解决不同实体的冲突和合作提供了一个宝贵的方法.目前谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益最大化,最后达到力量均衡.在这一点上,博弈论和经济学家的研究模式是完全一样的.经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响和相互作用,人与人之间利益和中突、竞争与合作,而这正是博弈论的研究对象.2 博弈论的代表人物博弈论主要是由冯・诺依曼(1903~1957)所创立的.他是一位出生于匈牙利的天才的数学家.他不仅创立了经济博弈论,而且发明了计算机.早在20世纪初,塞梅鲁(Zer mel o)、鲍罗(Borel)和冯・诺伊曼(Von Neumann)已经开始研究博弈的准确的数学表达,直到1939年,冯・诺依曼遇到经济学家奥斯卡・摩根斯坦思(O skar Morgenstern)并与其合作才使博弈论进入经济学的广阔领域.1944年他与奥斯卡・摩根斯坦恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的初步形成.书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础.合作型博弈在20世纪50年代达到了巅峰期.然而,诺依曼博弈论的局限性也日益暴露出来,它过于抽象,应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,影响力很有限.正是在这个时候,非合作博弈———“纳什均衡”应运而生了,它标志着博弈论的新时代的开始.纳什是一位天才式的人物,上大学时就开始从事纯数学的博弈论研究,特别是在经济博弈论领域,他做出了划时代的贡献,是继冯・诺依曼之后最伟大的博弈论大师之一.他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用.后续的研究者对博弈论的贡献,都是建立在这一概念之上的.由于纳什均衡的提出和不断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础.纳什博士1950年11月刊登在美国全国科学院每月公报上的两篇论文将冯・诺依曼的“最小最大原理”推广到非合作博弈领域,找到了普遍化的方法和均衡点,比冯・诺伊曼的合作博弈理论更能反映现实的情况.20世纪50年代以后,泽尔腾、海萨尼等人对博弈论作了进一步的完善,使之更为实用.近20年来,博弈论作为分析和解决冲突和合作的工具,在管理科学、国际政治、生态学等领域得到广泛的应用.3 纳什均衡与博弈论的应用“囚徒困境”(Pris oner’s D ile mma)至今仍然是博弈研究的重要课题.两个嫌疑犯作案后被警察62哈尔滨师范大学自然科学学报 2006年逮捕,分别关在不同的屋子里审讯,警察告诉他们,如果两个人都坦白,那么每人判刑8年;如果两个人都抵赖,每人各判刑1年;如果其中一人坦白,另一人抵赖的话,坦白的人释放,抵赖的人判刑10年.这里每个囚徒都有两种战略:坦白或抵赖;在这个博弈中,纳什均衡是(坦白,坦白),尽管从总体上看,(抵赖、抵赖)是对两个人都有益的结果,但由于不构成纳什均衡,所以不是该博弈的解,给定B坦白的情况下,A的最优战略是坦白;同样,A坦白的前提下,B的最优战略是坦白, AU最优战略的组合却不是总体最优的选择,有没有可能其中一个选:择抵赖呢?按照人是理性的假设,没有人会积极地这么做,因为如果对方坦白的话,自己就可能判刑10年,理性的人是不会冒这种险的。
囚徒困境反映了一个深刻的哲学问题:个人理性和集体理性的矛盾。
个体为了自己的利益最大,而不愿意改变决策(改变决策的结果是不划算,招了之后惩罚严重),导致整体利益最小。
这样的情景就是个体与环境博弈的结果,这种状态就是博弈论中所讲的“纳什均衡”,又叫做“全局博弈均衡”。
纳什均衡是局中人理智选择的结果。
在现代经济生活中,纳什均衡的思想经常被应用,如投资、消费和雇用关系分析,生产、库存和维修关系分析,标价、拍卖和谈判策略制订,自然资源和污染关系分析,委托与代理关系分析等都涉及到纳什均衡的概念.囚徒困境在生活中最常见的表现就是挤公共汽车.从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,纳什均衡就是大家都挤,结果上车就更慢了,每个人采取的都是最优的战略,但是结果却是最劣,原因在于个人理性和集体理性的冲突.囚徒困境在企业间最典型的例子就是“竟相杀价”,在某种产品市场容量一定的前提下,A、B 企业本可以订一个协议价格来维护共同的长期利润,但A会为自己的近期利益而采取“低价倾销”策略,B也会效仿降价,不遵守事先达成的价格协定,结果使市场过早枯竭,A、B都没有出路了.但是如果A事先获知B的产量和价格这类竞争情报,就可以采取保护措施(如动用反倾销法案,甚至可以“威胁”用更低的价格“报复”),这样就能避免“两败俱伤”,形成新的协定.在“囚徒困境”中我们得到一个重要的结论:一种制度(体制)安排,要发生效力,必须是一种纳什均衡,否则这种制度安排便不能成立.两家企业A、B合作建设一条VCD的生产线,协议由A方提供生产VCD的技术,B方则提供厂房和设备.在对技术和设备进行资产评估时就形成非合作博弈,因为每一方都试图最大化己方的评估值,这时B方如果能够获得A方关于技术的真实估价或参考报价这类竞争情报,则可以使自己在评估中获得优势;同理, A方也是一样.至于自己的资产评估是否会影响合作企业的总体运行效率这样的“集体利益”,则不会非常重视.这就是非合作博弈,参与人在选择自己的行动时,优先考虑的是如何维护自己的利益.合作博弈强调的是集体主义,团体理性(Collectivc Ratli onality),是效率、公平、公正;而非合作博弈则强调个人理性,个人最优决策,其结果是有时有效率,有时则不然.现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者.厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚.因为博弈双方的利润正好是零.竞争的结果是稳定的,即是一个“纳什均衡”.这个结果可能对消费者是有利的,但对厂商而言是灾难性的.所以,价格战对厂商而言意味着自杀.从这个案例中我们可以引伸出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局.二是如果不采取价格战,作为一种敌对博弈其结果会如何呢?每一个企业,都会考虑是采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润.如果垄断可以形成,则博弈双方的共同利润最大.这种情况就是垄断经营所做的,通常会抬高价格.另一个极端的情况是厂商用正常的价格,双方都可以获得利润.从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”.事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”.在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策.在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本.在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态.如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏.这就是为什么W T O和各国政府要加强反垄断的意义所在.72第4期 博弈论与纳什均衡除了“囚徒困境”以外,博弈论学者还总结出许多博弈的模型.如智猪博弈(Boxed Pigs)来解释多劳者不多得;性别战(Battle of Sexes)来解释互动博弈;斗鸡博弈(Chicken Ga me)来解释一方的妥协等等.博弈论在现实中的应用很多.首先,它是一种数学理论,可以用于经济学等领域;再者,它作为一种理论,并非产生直接具体的影响,而是理论指导学科,进而影响某些方面.博弈论对人类的贡献是加强了国际间的交流合作机会和人类社会文明的发展.此外,博弈论的哲学思维方式推动了人类思维模式向前发展,这一点是博弈论对人类的最大贡献.参 考 文 献1 张维迎.博弈论和信息经济学.上海:三联书社,1996.2 赵景柱,叶天祥.对策论理论和应用.北京:科学出版社,1995. 3 谢识予.经济博弈论.复旦大学出版社,2001.4 王则柯.新编博弈论平话.中信出版社,2003.ON THE GA M E THE OR Y AN D THE NASH EQUI L I BRI U MGuo Peng(China University of M ining and Technol ogy) Yang Xiaoqin(J ixi University)ABSTRACTW ith the Nash equilibrium being put f or ward and i m p r oved constantly and it is taken as the theoretical foundati on of the Ga me theory,it is possible that the Ga me theory can be widely used in Econom ics, Manage ment,Politics,Sci ol ogy Srategics,etc.Keywords:The Ga me theory;Nash equilibriu m;Non-cooperative Ga me(责任编辑:李双臻) 82哈尔滨师范大学自然科学学报 2006年。