当前位置：文档之家› 张良桥-进化博弈基本动态理论及其应用

张良桥-进化博弈基本动态理论及其应用

张良桥（顺德德职业技术学院528300）摘要本文主要介绍进化博弈理论的基本动态模型：对称博弈模拟者动态模型和非对称博弈模拟者动态模型及其相关结论。

为了便于理解，在文中引用了一些简单的例子说明它们之间的区别与联系。

在此基础上文中还介绍了理论家们对随机动态所进行的相关研究及其所取得的理论成果。

最后本文比较了经典博弈理论1与进化博弈理论在动态概念上的差别。

关键词：动态博弈；非对称博弈；模拟者动态；随机稳定集英文标题：The basic dynamics theorie s of evolutionary game and it’s applications Abstract：This paper mainly introduces the basic dynamics model of evolutionary game theory: symmetric replicator dynamic model, asymmetric replicator dynamic model and its relative conclusion. For better understanding, the sample cases are applied to describe the differences between them. Based on the models, this paper also introduced theorists’ study and its achievements on stochastic evolutionary dynamics. Finally, We also give the differences on the concept of dynamics of classic game theory and evolutionary game theory.Keywords: Dynamic Games; Asymmetric Games; Replicator Dynamics; Stochastic Stable Sets作者简介：张良桥，顺德职业技术学院，硕士联系方式：顺德市职业技术学院通信地址：顺德职业技术学院经济管理系 523800电话： 013660431173； 0765--2338178E - Mail: zlbridge@张良桥（顺德德职业技术学院528300）摘要本文主要介绍进化博弈理论的基本动态模型：对称博弈模拟者动态模型和非对称博弈模拟者动态模型及其相关结论。

为了便于理解，在文中引用了一些简单的例子说明它们之间的区别与联系。

在此基础上文中还介绍了理论家们对随机动态所进行的相关研究及其所取得的理论成果。

最后本文比较了经典博弈理论2与进化博弈理论在动态概念上的差别。

关键词：经典博弈理论；进化博弈理论；非对称博弈；模拟者动态；随机稳定集引言进化博弈理论至少自Lewontin（1960）用于解释生态现象就已经产生了，特别是Maynard Smith and Price (1973)和Maynard Smith (1974)提出该理论的基本均衡概念----进化稳定策略（Evolutionarily stable strategy ESS）以后，该理论被广泛应用于生态学、社会学及经济学等领域来研究群体行为的演化过程及其结果。

进化博弈理论从有限理性的个体出发，以群体为研究对象，认为现实中个体并不是行为最优化者，个体的决策是通过个体之间模仿、学习和突变等动态过程来实现的。

进化博弈理论强调系统达到均衡的动态调整过程，认为系统的均衡是达到均衡过程的函数，也就说均衡依赖于达到均衡的路径。

动态概念在进化博弈理论中占有相当重要的地位，许多博弈理论家对群体行为调整过程进行了广泛而深入的研究，由于他们考虑问题的角度不同，对群体行为调整过程的研究重点也就不同，提出的动态模型也就不同，如Weibull(1995) 提出了模仿动态（Imitation Dynamics）模型，认为人们常常模仿其他人的行为尤其是能够产生较高支付的行为；Börgers and Sarin(1995，1997)等提出并应用强化动态3（Reinforcement Dynamics）来研究现实中参与人的学习过程；Friedman and Robert(1986)为了解释在实验中观察到的偏离纳什均衡的现象，他们利用两群体、双线性重复匿名博弈而引入了迁移动态（Migration Dynamics），并对实验现象作出了合理的解释；Skyrms (1986)利用进化模型对哲学中的理性问题进行了讨论，由此引入了意向动态（Deliberational Dynamics）；Swinkels(1993)提出了近似调整动态（Myopic Adjustment Dynamics）；Borgers and Sarin(1995)提出了刺激—反应动态（Stimulus-Response Dynamics）等等。

但到目前为止，在进化博弈理论中应用得最多的还是由Taylor and Jonker(1978)在对生态现象进行解释时首次提出的模拟者动态（Replicator Dynamics）。

模拟者动态是进化博弈理论的基本动态，它能较好地描绘出有限理性个体的群体行为变化趋势，由之得出的结论能够比较准确地预测个体的群体行为，因而倍受博弈论理论家们的重视。

下面本文就介绍模拟者动态概念、模型及其简单应用。

一、模拟者动态一般的进化过程都包括两个可能的行为演化机制：选择机制(Selection Mechanism)和突变机制（Mutation mechanism）。

选择机制是指本期中能够获得较高支付的策略，在下期被更多参与者选择。

选择包括许多可能的形成机制，这些机制可能是生态意义上的繁殖成活率；也可能是个人意义上的试验、刺激及反应等；也可能是社会意义上的学习、试验及模仿等。

突变是指参与者以随机（无目的性）的方式选择策略，因此突变策略可能是能够获得较高支付的策略，也可能是获得较低支付的策略，突变一般很少发生。

新的突变也必须经过选择，并且只有获得较高支付的策略才能生存（Survive）下来。

进化博弈理论的动态模型大体上可以分为三大类：第一类是支付导向型动态（Payoff-positive Dynamics）模型，该类模型认为，所有获得高于群体平均支付的纯策略都有正的增长率，所有获得低于群体平均支付的纯策略都有负的增长率；第二类是凸单调动态（Convex-Monotone Dynamics），与前者不同，在这里把混合策略也纳入到模型中，即认为如果混合策略能够获得比纯策略更高的支付，那么它就比纯策略有更高的增长率；第三类是弱支付导向动态（Weakly Payoff-positive Dynamics ），该类模型认为，只要存在获得高于群体平均支付的纯策略，它就可以获得正的增长率。

显然，第三类动态包含了前二类动态。

博弈论理论家们研究得最多的主要是第一类动态模型。

按群体数目不同，进化博弈动态模型可分为两大类：单群体(Monomorphic Population)动态模型与多群体(Polymorphic Populations )动态模型。

单群体动态模型是指所考察的对象只含有一个群体，并且群体中个体都有相同的纯策略集，个体与虚拟的参与人4进行对称博弈。

博弈中个体选择纯策略所得的支付随着群体状态的变化而变化。

多群体动态模型5是指所考察的对象中含有多个群体，不同群体个体可能有不同的纯策略集，不同群体个体之间进行的是非对称博弈。

博弈中个体选择纯策略所得的支付不仅随其所在群体的状态变化而变化，而且也随其他群体状态的变化而变化。

下面重点单群体与多群体动态模型。

1.1、单群体模拟者动态模型单群体模拟者动态模型是由Taylor and Jonker (1978)在考察生态演化现象时首次提出的。

他们把一个生态环境中所有的种群看作为一个大群体，而把群体中每个种群都想象或程式化为一个特定的纯策略6。

群体在不同时刻所处的状态一般用混合策略7来表示。

所谓模拟者动态是指使用某一纯策略的人数所占比例的增长率等于使用该策略时所得支付8与群体平均支付之差，或者与平均支付成正比例。

为了说明的方便，本文首先给出一些符号，然后给出Taylor and Jonker (1978)模拟者动态公式的推导过程。

假定群体中每一个个体在任何时候只选择一个纯策略9，比如，第j 个个体在某时刻选择纯策略is （当然由于突变或策略转移，同一个体在不同时刻可以选择不同的纯策略）。

},,,{21k k s s s S =表示群体中各个体可供选择的纯策略集；N 表示群体中个体总数；n i (t )表示在时刻t 选择纯策略i 的个体数。

),,,(21k x x x x =表示群体在时刻t 所处的状态，其中i x 表示在该时刻选择纯策略i 的人数在群体中所占的比例，即N t n x i i )(=。

),(x s f i 表示群体中个体进行随机配对匿名博弈时，群体中选择纯策略i s 的个体所得的期望支付。

∑=i i i x s f xx x f ),(),(表示群体平均期望支付。

下面给出连续时间10模拟者动态公式，此时动态系统的演化过程可以用微分方程来表示。

在对称博弈中每一个个体都认为其对手来自于状态为x 的群体。

事实上，每个个体所面的对手是代表群体状态的虚拟个体11。

假定选择纯策略i s 的个体数的增长率等于),(x s f i ，那么可以得到如下的等式：4 其实质就是个体与群体进行博弈，即个体通过对群体选择不同策略的个体数的观察来确定自己的选择。

5 Selten(1980)通过对个体引入角色限制，首次考察了非对称博弈中的均衡问题，并证明了“在非对称博弈中进化稳定均衡等价于严格纳什均衡”。

6 Taylor and Jonker(1978)所给出的模拟者动态是假定每一个个体都代表一个纯策略，因为他们认为生物的行为是由其遗传基因完全确定的，但Taylor and Jonker(1982)对原初的模拟者动态模型进行了推广，并允许个体选择混合策略，纯策略可以看作混合策略的退化。

7 在这里所说的混合策略与经典博弈理论中所说的混合策略有不同的意义。

在经典博弈中，混合策略是指纯策略上的一个概率分布；而在进化博弈理论中，混合策略是指群体中选择不同纯策略人数在群体总数所占的比例。

它们虽然有相同的形式但却有不同的内容。

8 在这里所说的支付与生态学里所说的繁殖成活率或适应度（f itness ）是一个等价的概念。

9 在生态意义上来说，由于个体的策略是由其遗传基因完全确定的，所以个体不会改变其策略的，所谓改变策略实际就是指一个种群的消失；而用于分析人的群体行为，人是可以改变策略的，因而，所谓的改变策略就是指参与人从选择一个策略到选择另一个策略。

e商务文档

张良桥-进化博弈基本动态理论及其应用

相关文档推荐：