当前位置:文档之家› 博弈论

博弈论

2.2.1 博弈论的定义现代经济学的最新发展有一个特别引人注目的特点,那就是博弈论在经济学中越来越受到重视。

博弈论,又称为对策论,它是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题①。

简单地说,就是研究决策主体的行为在发生直接相互作用时,他们如何进行决策,以及这种决策的均衡问题。

1944 年冯·诺依曼和摩根斯特恩(Morgenstern)合作出版了《博弈论与经济行为》(The Theory of Games and Economic Behavior),开始将博弈论引入经济学,成为现代经济博弈论研究的开端。

20 世纪50 年代纳什(John F. Nash)、塔克(Tucker)等人的研究,奠定了现代博弈论的基石。

在其后的几十年里,许多经济学家致力于博弈论的研究,1965 年泽尔腾(Reinhard Selten)将纳什均衡的概念引入了动态分析;1967-1968 年,海萨尼(John C. Harsanyi)把不完全信息分析引入博弈论的研究;1982 年克瑞普斯(David M. Kreps)和威尔逊(RobertWilson)分析了动态不完全信息条件下的博弈问题。

1994 年诺贝尔经济学奖授予了纳什、泽尔腾和海萨尼三位博弈论专家,此后在2001 年诺贝尔经济学奖同样授予了三位博弈论的专家②。

博弈论是一种关于行为主体策略相互作用的理论,它已形成了一套完整的理论体系和方法论体系。

它具有基本假设的合理性、研究对象的普遍性、研究结论的真实性、方法论的实证性等特点。

正是因为这些特点,博弈论的产生和发展引发了一场深刻的经济学革命,使得现代经济学从方法论,到概念和分析的方法体系,都发生了很大的变化。

正如克瑞普斯(Kreps)在《博弈论与经济模型》一书中指出“在过去一二十年中,经济学在方法论,以及语言、概念等等方面,经历了一场温和的革命,非合作博弈已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不①懂纳什均衡能够‘消化’近代文献的领域。

”张维迎:《博弈论与信息经济学》,上海人民出版社2004 年版,第3 页。

②2001 年诺贝尔经济学奖授予了在不对称信息市场理论方面做出杰出贡献的三位博弈论专家,他们是美国加利福尼亚大学伯克利分校的阿克诺夫(GorgeAkerlof)教授、斯坦福大学的斯宾塞(A. M. Spence)教授和哥伦比亚大学的斯蒂格利茨(J. Stiglitz)教授。

在博弈论分析中,一定场合下的每个博弈者在决定采取何种行动时都策略地、有目的地行事,他既要考虑其他博弈者对自己决策行为的影响,又要考虑自己的决策对其他博弈者决策的可能影响,并在寻求自身效益最大化的前提下,来确定自己的决策。

一个博弈所包括的要素有:参与人、信息、策略、行动的次序、收益、结果。

1、参与人:参与人是博弈的决策主体,他们的目的是通过选择行动(或策略)以最大化自己的支付(效用)水平。

参与人可以是自然人,也可以是各种社会组织,如企业、政府、社团等。

2、信息:信息是参与人有关博弈的知识,特别是有关“自然①”的选择、其他参与人的特征和行动的知识。

信息对于博弈参与者的意义和作用至关重要,掌握信息的多少将直接影响到决策的准确性,从而关系到整个博弈的成败。

3、策略:策略是指在博弈的每一环上,参与者的行事规则,即按什么规则选择行动。

在不同的博弈中可供博弈方选择的策略或行动很不相同。

即使在同一博弈中,不同博弈方的可选策略或行为也常常不同,有时只有有限的几种,甚至只有一种,而有时又可能有许多种,甚至无限多种。

4、行动的次序:在现实的各种决策中,当多个独立博弈方进行决策时,有时候这些博弈方必须同时做出选择(这样能保证公平合理),但有时候各博弈方的决策又必须有先后之分。

并且,在一些博弈中每个博弈方还要不止一次地做出选择,这就免不了有一个次序问题。

因此,规定一个博弈就必须规定其中的次序,不同的次序必然是不同的博弈,即使其他方面都相同。

5、收益:在博弈论中,收益或者是指在一个特定的战略组合下参与人得到的确定效用水平,或者是指参与人得到的期望效用水平。

收益可以是正值,也可以是负值。

虽然各博弈方在各种情况下的收益是客观存在的,但这并不意味着各博弈方都充分了解各方的收益情况。

在许多博弈中,总存在某些博弈方对其他博弈方的收益无法肯定的情况。

6、结果:结果是指博弈中参与者的行动所产生的每一种可能性,包括策略的组合、行动组合以及支付组合等。

①这里所说的“自然”是指代表随机选择作用的博弈方。

2.2.2 纳什均衡纳什在他1950 年的经典论文中,首先提出了他自己称为“均衡点(Equilibrium Point)”的纳什均衡概念,并且同时证明了在相当广泛的博弈类型中,混合策略意义上的纳什均衡是普遍存在的。

纳什均衡可以描述为:如果一个博弈存在一个战略组合,任何参与人要改变这一战略组合都可能导致降低自身的效用水平(或只能保持原有的效用水平),因而任何参与人都没有积极去改变这一战略组合,这一战略组合称为该博弈的纳什均衡。

纳什均衡揭示了博弈均衡与经济均衡的内在联系,它奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开。

纳什均衡的普遍存在性,意味着纳什均衡在分析大多数博弈问题中,都是一种基本的分析方法。

因此,在本文的分析中也把纳什均衡作为基本的分析工具之一。

一博弈理论概述经典博弈论概述博弈论又被称为对策论,它是研究决策者在决策主体各方相互作用情况下如何进行决策及有关这种决策的均衡问题的理论。

与其他理论不同,博弈论强调决策主体各方策略的相互依存性,即任何一个决策主体必须在考虑其他局中人可能的策略选择基础上来确定自己的最优行动策略。

其精髓在于博弈中的一个理性决策者必须考虑局中其他人反应的基础之上来选择自己最理想的行动方案。

所谓均衡即所有局中参与人的最优策略组合,各方博弈产生的结果是一个均衡结局,它可能不是局中各方及整体的利益最大化,但它是在已给定信息与知识条件下的一种必然结果,因为任何一方改变策略而导致均衡的变化都有可能使自己得到一个更差的结果。

博弈论研究人们的行为在直接相互作用时的决策以及决策的均衡问题。

经典博弈论预设人是完全理性的,即人人都会在给定的约束条件下最大化自身的利益,人们的行为互相影响且通常信息不对称。

博弈的结局往往是一种博弈策略组合所产生的均衡结果,我们称之为纳什均衡。

,即给定对手的策略,每个参与人选择自己的最优策略。

本文根据理性假设依据的不同,把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈论,它是依据完全理性的经济人出发来研究均衡问题的将经典博弈论与生态演化论相结合的博弈理论称之为演化博弈论,它是依据有限理性的社会人出发来研究均衡问题的。

演化博弈论概述演化博弈论概念。

演化博弈论又称进化博弈论,是经典博弈论与生态演化论相结合的研究成果,它从有限理性的社会人出发来分析参与人的资源配置行为,并以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的演化趋势。

演化博弈理论基本均衡概念一进化稳定策略。

进化稳定策略,,是由梅纳德·史密斯和普赖斯在年引入,并由史密斯在著作《演化与博弈论》中得到了进一步的发展。

其直观思想是如果一个群体原群体的行为模式能够消除任何小的突变群体,那么这种行为模式一定能够获得比突变群体更高的期望支付,随着时间的演化,突变者群体最终会从原群体中消失,原群体所选择的策略就是进化稳定策略。

如果用于分析人类的群体行为,那么进化的结果将是那些选择突变策略的群体最终会改变策略而选择进化稳定策略。

演化博弈论基本动态概念一模仿者动态。

进化博弈论用系统论的观点看待群体行为的调整过程,主要研究群体行为演化系统的变化,如何描述动态系统的状态变化是进化博弈论的关键,对此经济学家从不同的方面对演化系统的过程进行了描述,提出了不同的动态模型。

到目前为止,在进化博弈论中应用得最多的还是由在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态即。

所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。

经典博弈论与演化博弈论的区别理性假定不同。

经典博弈论从完全理性出发,把经济中参与人之间的行为关系看作为一种原子式的互动或者机械式的反应。

该理论认为在任何情况下,参与人都能对环境的任何变化做出最优反应,然而在多数情况下这个理性假定是难以满足的。

演化博弈论从有限理性出发,认为经济中参与人只能知道世界状态的一部分而不可能知道世界的所有状态,参与人也不可能知道各种状态出现的客观概率及不同状态对自己支付的意义,在多数情况下参与人并不能对环境的任何变化做出最优反应,其决策是基于某种常规而非理性的计算结果,这种常规一般来自于博弈的历史,因为历史已经包含了对手如何行动的相关信息,同时通过对历史的观察有助于参与人知道什么是成功策略什么是不成功策略。

研究对象及方法不同。

经典博弈论以参与者个人为研究对象,它虽然认为个人之间的行为是相互影响的,但却在假定其他参与人行为选择一定的情况下来考察个人最优化行为。

即假定每个参与人都能从对手的选择中正确地推断出博弈的支付结构进而预测到均衡结果,所以不需要考察达到均衡的动态过程。

演化博弈论以参与人群体为研究对象,假定各群体、个体之间的行为相互影响且不同群体的个体之间进行重复博弈,个体在给定信息下并不一定选择最优化行为,而是通过学习、模仿等动态调整过程做出决策,其均衡的结果依赖于博弈的历史及博弈所处的社会环境等。

达到均衡的过程影响均衡的结果,因而演化博弈论主要利用动态方法研究群体达到均衡的行为调整过程,这种方法可以把从个体行为到集体行为的形成机制、组织和制度等因素都纳入到模型中,因此能够更真实地反应经济主体行为的多样性和复杂性。

动态概念不同。

经典博弈论虽然也研究动态博弈,但与演化博弈论所研究的动态不同。

经典博弈论的动态博弈假定各参与人都有特定的对手,以参与人行为的时间顺序及信息的传递为依据。

在动态博弈中后行动者通过观察选择先行动者的选择而做出最优反应决策,先行动者也会预期到自己的行动会传递自己的信息,因而先行动者在给定预期后行动者的行为反应下选择自己的最优策略,后行动者在给定先行动者行为所传递的信息下做出自己的最优选择。

显然这种动态博弈并不涉及达到均衡的调整过程也不涉及外在因素对均衡的影响。

演化博弈论假定参与人并没有特定的博弈对手,它所强调的动态是相对于群体行为达到均衡的调整过程。

相关主题