当前位置:文档之家› %BA经典博弈理论与进化博弈理论之关系

%BA经典博弈理论与进化博弈理论之关系

理性与有限理性:论经典博弈理论与进化博弈理论之关系张良桥 冯从文3 内容提要 本文以理性与有限理性为线索,主要介绍进化博弈理论(evo lu ti onary gam etheo ry )与经典博弈理论(gam e theo ry )①的区别与联系。

在指出经典博弈理论的缺陷以后,给出进化博弈理论产生的必要性及可能性,并给出进化博弈理论的基本概念——进化稳定策略的定义,并把两种理论进行对比。

关键词 理性 有限理性 进化稳定策略 纳什均衡 3张良桥、冯从文:中山大学岭南学院 电话:020-******** 电子信箱:W enkang 1@ 中山大学岭南学院经济学系数量经济九八级研 510275。

本文在写作过程中始终得到了王则柯教授的悉心指导,在此谨向他表示感谢。

文中如有不当之处概由作者负责。

①本文把源于V on N eum ann 与M o rgenster m 经N ash 发展而形成的博弈论称为经典博弈理论。

20世纪60年代生物学家们就已经用进化博弈理论来解释生态现象了,特别是M aynard 和P rice (1973)及M aynard (1974)提出进化稳定策略(Evo lu ti Stab le Strategy ,ESS )这一基本概念以后,该理论逐渐被广泛地用于生态学、社会学、经济学等领域。

1992年关于进化博弈理论的国际学术会议在康奈尔大学召开,此后进化博弈理论在经济学上的应用得到迅速的发展,越来越多的经济学家应用该理论来研究经济活动中经济主体的群体行为。

与经典博弈理论不同,进化博弈理论并不要求经济主体是完全理性的,也不要求经济主体的行为满足预期一致性原则。

因此进化博弈理论比经典博弈理论能更准确地预测经济主体的行为,所以在短短的二十几年里进化博弈理论就获得了迅速的发展。

本文主要介绍进化博弈理论的发展、基本内容及其与经典博弈论的区别。

一、经典博弈理论的困惑新古典经济学假定参与人是完全理性的,即生产者在给定技术和资源下能够找到一个可获得最大利润的最优生产方案;消费者在既定的预算约束下能够找到一个可获得最大效用的消费方案。

经典博弈理论在此基础上引入了经济主体之间的互动作用,从而使得理论与现实更为接近,但还是没能跳出新古典理论的基本框架,它在预测经济主体行为时存在着三大缺陷:1.在做均衡分析时,经典博弈理论假设参与人是完全理性的,并且每个参与人对博弈的结构及对方的支付有完全的了解,求解子博弈精炼纳什均衡时所利用的后向归纳法(backw ard inducti on )不但要求参与人完全理性,而且还要求序贯理性(sequen tial rati onality )。

显然这个比理性概念要求更强的假定与现实相差太远。

2.经典博弈理论在处理不完全信息问题时有两种方法:(1)假定各参与人知道“真实模型”的结构,但模型中的各参数是不可观察的(Savage ,1954);(2)假定各参与人知道各种可能状态客观的概率分布,给定一个先验信念,当出现任何新信・47・ 期8第年1002 3济经界世 息时,每个参与人都能够应用贝叶斯法则修正自己的先验信念(H arsanyi,1967)。

这两种处理不完全信息的方法有三大缺陷:其一,必须假定参与人知道世界的各种可能状态;其二,必须假定参与人知道在随机抽取状态上的客观概率分布;其三,必须假定参与人具有很强的计算、推理能力,且能够在一个大的状态空间上应用贝叶斯法则解决复杂问题。

显然,这三个假定与现实是不相符的。

3.经典博弈理论作为预测工具的理论基础是纳什均衡②及其精炼,它不但要求各参与人完全理性,而且还要求参与人的预期满足一致性原则。

所谓一致性原则要求每个参与人正确地知道其他参与人将会如何选择。

然而,这些知识从何而来呢?经典博弈理论对此有过许多研究并形成了几种共同的观点,如博弈前的交流(p rep lay comm un icati on)、自我实现的预期(self2fu lfilling p rophecies)、聚点(focal po in ts)等。

博弈前交流(A um ann,1990)与自我实现预期(M yerson, 1991)不能说明参与人的知识从何而来,因而缺乏说服力。

聚点是由Schelling(1960)提出的,他认为:如果博弈存在一个显式博弈规则(obvi ou s w ay to p lay),③那么每个参与人知道其他参与人将做出何种选择,但这种所谓的“显式博弈规则”又意味着什么呢?这又是一个难以回答的问题。

在现实中人并不是完全理性的。

大量的心理学实验和近年来实验经济学的迅速发展表明:人类在做出经济决策时总是存在着系统的推理误差,而这些误差产生的原因大多来自于如信息成本、思考成本、激动和经验等因素的影响。

心理学研究表明:人类的认知能力有着心理的临界极限,认知作为一种资源是稀缺的,使用它时必须支付一定的成本,然而人们在决策时很少把这种成本考虑进去。

Si m on(1990)认为:人类的推理能力是一种相对稀缺的资源(推理过程中要消耗大量的能量),这就隐含着思考活动也需要花费一定的成本。

大量对消费者行为分析的实验也表明,人们在进行消费选择时并不总是能够获得最大效用。

现实中的人并不是也不可能严格按照利润或效用最大化的要求做出决策,在多数情况下参与人通过了解博弈的历史及模仿其他参与人的行为而进行决策。

Young(1998)认为:现实中利润或者效用最大化只是影响决策的一个因素,决策时还必须考虑其他许多因素,其中一个特别重要的因素便是决策者所处的环境(如历史背景、社会环境等)。

二、进化博弈理论的基本内容进化博弈理论以达尔文的生物进化论和拉马克的遗传基因理论为基本思想。

在生物进化过程中,只有那些在竞争中能够获得较高支付(繁殖成活率)的物种才能幸存下来;获得较低支付的物种在竞争中被淘汰,即优胜劣汰。

我们知道生物进化遵循优胜劣汰的原则,在这种原则下生物的行为趋于纳什均衡,那么能否把进化理论与博弈论结合起来研究人的行为呢?利用进化博弈理论研究参与人群体行为时,只要求参与人知道什么是成功的行为及什么是不成功的行为,而不必知道为什么是成功与不成功行为。

该理论对参与人的理性要求较少因而与现实更接近,由此得出的结论可能对人类的群体行为做出更好的预测。

典型的进化博弈模型包括参与人群体集合,各群体个体之间进行重复匿名博弈。

④根据个体在博弈中属于不同角色(如参与人的行动空间)来划分群体。

按博弈中群体数的不同,我们可以将博弈分为对称博弈与非对称博弈。

对称博弈即是指单一群体(m onom o rph ic popu lati on)的情形,在博弈过程中同一群体不同个体之间进行对称博弈,因而支付矩阵是对称的,在博弈的任何阶段选择不同策略的个体对应于一个群体分布,该分布又可理解为群体所处的状态,状态一般用一个n 维向量表示(其中n表示行动空间中纯策略的个・57・期8第年123济经界世张良桥 冯从文 ②③④H ines(1980)首次考察了参与人进行重复非匿名博弈,非匿名即假定支付不仅依赖于不同策略在群体中的分布,而且依赖于选择不同策略的参与人,不同的参与人选择同一个策略进行同一个博弈也可能得到不同的支付。

这种方式可能来自于博弈本身的结构或者来自于博弈所处的环境(历史背景、文化习惯、公平、效率等)。

给定各参与人认为其他参与人的策略选择不变的情况下,任何参与人都没有转换策略的激励,因为均衡时任何参与人单独改变策略都不会变得比原来更好,更何况在多数情况下还必须考虑转换成本。

数)。

在具体博弈中每个个体都好像面对一个选择混合策略的对手,其实质是个体与群体状态之间的博弈。

非对称博弈即是指多群体(po lym o rp h ic popu lati on s )的情形,在博弈过程中不同群体、个体之间进行非对称博弈,因而支付矩阵是非对称的。

非对称博弈的状态空间比较复杂,一般用R k 1×k 2×…×k m空间中的点来表示(其中k 1,k 2,…,k m 表示不同群体中纯策略的个数)。

进化博弈理论的关键假定是:参与人群体并不是行为最优化者而是幼稚的(naive ),即参与人不相信他们现在的行为会影响对手未来的选择;参与人也不理会对手是否与他们进行同样的行为调整(因为各参与人之间进行的是匿名博弈,所以他不知道以后的对手是什么人)。

各群体个体之间进行重复博弈,在博弈的任何时点上选择不同策略的个体在群体中都有一个概率分布与之对应,严格地说这个概率分布是一个经验分布,但由于我们考察的是无限群体,所以可以把这个经验分布近似看做一个概率分布。

在进化博弈中,我们也用这个概率分布表示群体所处的状态,随着时间的演化这种状态是不断变化的。

如果参与人(参与人群体)知道这种状态且能够采取最大化行为,那么他(他们)会选择一个最大化自己期望支付的最优反应策略;如果他(他们)不知道这个群体所处的状态,那么他(他们)必须根据自己所掌握的信息对群体的状态进行推断,他(他们)所能利用的信息只能来自博弈的历史,因为这种历史传达着对手将会如何做出选择的有关信息,同时通过对历史的观察使参与人知道哪些策略是成功的、哪些策略是不成功的,参与人以此作为决策的依据。

由于选择压力及参与人对成功行为的模仿,本期中成功的行为下期将会被更多的个体采用。

进化博弈理论的基本概念是进化稳定策略(Evo lu ti onarily Stab le Strategy ,ESS ),该概念最早是由M aynard 和P rice (1973)及M aynard (1974)在解释生态现象时提出的,其直观思想是:如果一个群体(原群体)的行为模式能够消除任何小的突变群体,那么这种行为模式一定能够获得比突变群体更高的期望支付,随着时间的演化,突变者群体最终会从原群体中消失,原群体所选择的策略就是进化稳定策略。

就分析生态现象而言,由于我们把每一个种群的行为都程式化为一个策略,因此进化的结果将是突变种群的消失。

如果用于分析人类的群体行为,那么进化的结果将是那些选择突变策略的群体最终会改变策略而选择进化稳定策略。

进化稳定策略是从分析生态现象中得来的,我们知道在对生态现象进行分析时,常常把某个生态环境中所有种群看作为一个大群体,因而种群之间进行的是对称博弈,所以原初的进化稳定策略概念一般只适用于单群体的情形。

另外我们可以从定义看出进化稳定策略是一个静态概念但却能描述动态系统的局部性质。

进化博弈理论用系统论的观点看待群体行为的调整过程,主要研究群体行为演化系统的变化,如何描述动态系统的状态变化是进化博弈理论的关键,对此经济学家从不同的方面对演化系统的过程进行了描述:T ayler 和Jonker (1978)提出的模仿者动态(rep licato r 2dynam ics )模型;Bo rgers 和Sarin (1995)提出的刺激-反应动态(sti m u lu s -respon se dynam ics );Sw inkels (1993)提出的近视调整动态(m yop ic 2adju stm en t dynam ics )等利用不同的行为模式描述了群体行为的动态调整过程。

相关主题