当前位置：文档之家› 演化博弈

演化博弈

Taylor和Jonker提出了演化博弈理论的基本动态概念——复制动态
• 经济学家把演化博弈理论引入到经济学领域，用于分析社会制度变迁、产业演化以及股票市场等，同时对演化博弈理论的研究也开始由对称博弈向非对称博弈深入，并取得了一定
1980s
的成果
演化博弈的产生与发展
• 演化博弈理论的发展进入了一个新的阶段。Weibull(1995)比较系统、完整地总结了演 1990s 化博弈理论，其中包含了一些最新的理论研究成果。
则竞争者群体的复制动态方程F1(x)：
dx/dt dx/dt 1 x y=1/2 y>1/2 1 dx/dt
x 1 x
y<1/2
复制动态中的非对称博弈
对于博弈方2：博弈方2 打击博弈方 1 容忍
进入
不进
0, 0
1, 5
2, 2
1, 5
则在位者群体的复制动态方程F2(y)：dy/dt 1 x演化博弈的基本分析过程
一般的演化博弈模型的建立主要基于两个方面：选择(Selection)和突变 (Mutation)。选择是指能够获得较高支付的策略在以后将被更多的参与者采用；突变是指部分个体以随机的方式选择不同于群体的策略（可能是能够获得高支付的策略，也可能是获得较低支付的策略）。突变其实也是一种选择，但只有好的策略才能生存下来。突变是一种不断试错的过程，也是一种学习与模仿的过程，这个过程是适应性且是不断改进的。
目录页
PART TWO
最优反应动态
协调博弈的有限博弈方快速学习模型
模型：博弈 A 方 B 1 博弈方2 A B 50，50 49，0 0，49 60，60 协调博弈
1 5 4 3 2
5个博弈方，相邻者彼此博弈，初始策略组合为32种。
实际上为8种：无A，1A，相邻2A，不相邻2A，3连A，非3连A，4A，5A
dy/dt
1 x=0 x=0
x
复制动态中的非对称博弈
两群体复制动态的关系和稳定性图例
y 1 1/2
通过分析可知：ESS为x*=1，y*=0 即无论两个群体的初始状态落在哪个区域，
最终的演化博弈结果为竞争者“进入”，在位者“不打击” 1 x
0
博弈方 1
dx/dt 1 x
11/16
复制动态中的非对称博弈
• 如果一个群体中成员之间的地位不一样，那么博弈方之间进行就是非对称博弈。 • 非对称博弈是用两个（或多个）有差别的有限理性博弈方群体的成员，相互之间随机配对博弈。 • 以市场阻入博弈为例进入 2 打击（0，0）容忍（2，2） 1 不进（1，5）博弈方 1 进入不进博弈方2 打击 0, 0 1, 5 容忍 2, 2 1, 5
演化博弈的产生与发展
• Alchian(1950)建议在经济分析中用自然选择的概念代替利润最大化的概念。Nash(1950)
1950s
的“群体行为解释” 是包含较完整的演化博弈思想的最早理论成果。
• 1973年，Smith发表了《博弈论和动物冲突的进化》，这标志着演化博弈论的诞生。1974 年，Smith和Price提出演化博弈理论中的基本概“演化稳定策略”。1978年，生态学家 1970s
演化稳定策略（ESS）
分析：
C
C 2,2
D 0,3
D
3,0
1,1
假定一个群体由背叛者构成，由于基因变异出现了比例为ε的合作者。此时背叛者的收益为：(1-ε)*1+ε*3=1+2ε 合作者的收益为：(1-ε)*0+ε*2=2ε 由于合作者的收益低于背叛者的收益，合作者会逐渐消亡，因此背叛是一个演化稳定策略。
演化博弈思想
为什么将演化思想引入到博弈论中？（1）博弈论对生物学的影响。博弈论的策略对应生物学中的基因，博弈论的收益对应生物学中的适应度。在生物学中应用的博弈论与经济学中的传统博弈论最大区别就是非完全理性的选择。（2）演化思想对社会科学的影响。例如，在市场竞争中，我们不必要去理性的想那个策略才是最优的，最后能够在市场存活下来的企业，一定是适应能力最强的公司。
一般两人对称博弈复制动态和进化稳定策略
复制动态分析
博弈方2 策略1 策略2 博 b, c 弈策略1 a, a 方策略2 c, b d, d 1 一般2X2对称博弈
dx/dt 复制动态相位图
x
1
x
协调博弈的复制动态和进化稳定博弈
博弈方2 策略1 策略2
策略1 50，50 49，0 策略2 0，49 60，60 一般2*2对称博弈复制动态进化博弈的结果常常取决与带有很大偶然性的初始状态。
签协议博弈的复制动态和进化稳定策略
经济活动中的各种合作都可以用签协议博弈描述。特点理性层次低，大规模群体随机配对反复博弈。博弈方 1
博弈方2 同意同意不同意 1 ，1 0 ，0 不同意 0，0 0，0
假设群体中采用“同意”比例为x，则不同策略期望得益和平均得益为：
签协议博弈的复制动态和进化稳定策略
演化博弈简介
CONTENTS
目录
1 2
有限理性与演化博弈最优反应动态复制动态
3
目录页
PART ONE
有限理性与演化博弈
有限理性
在新古典经济学和大多数的博弈论中都假定，人是追求收益最大化的，并且
可以无误地选择最优反应战略。
20世纪40年代，赫伯特·西蒙详尽而深刻地指出了新古典经济学理论的不现实之处，分析了它的两个致命弱点: (1)假定目前状况与未来变化具有必然的一致性； (2)假定全部可供选择的“备选方案”和“策略”的可能结果都是已知的。事实上这些都是不可能的。他认为，如果人们在某一问题有满意解时，就不会再去寻找最优解。
复制动态中的非对称博弈
进入 1 不进
由于是非对称博弈，问题中实际上有两个不同的博弈方，博弈方1是潜在的进入者，博弈方2是阻入者，每次博弈实际都是前
一群体的一个成员与后一群体的一个成员进行的。
分析框架：反复在两个群体中各随机抽取一个成员配对进行。博弈方的学习和策略模仿局限在他们所在群体内部，策略调整
进化稳定策略的检验
博弈同意 1，1 方不同意 0，0 1
博弈方2 同意不同意 0，0
0，0
一般两人对称博弈复制动态和进化稳定策略
一般模型博弈方2 策略1 策略2 博 b, c 弈策略1 a, a 方策略2 c, b d, d 1 一般2X2对称博弈 • 进化博弈设定是在一个大群体的成员中进行随机配对的反复博弈。 • 基本模型是两个博弈方之间的对称博弈。含义是两个博弈位置是无差异的。 • 其中abcd可以是任何得益，根据问题设定。
令xi(t)为t时期博弈方 i 采用策略A的邻居的数量，则xi(t) = 0,1,2.
协调博弈的有限博弈方快速学习模型
初次博弈1个A
A B B B B A B B B A B A A B A A A
B A
A A A
A
A A
初次博弈为相邻两个A
B A A B A B A A A A A
A
A A
B
初次博弈相连3个A
有限理性对博弈论的影响
有限理性意味着一般至少有部分博弈方不会采用完全理性博弈的均衡策略
有限理性意味着均衡是不断调整和改进而不是一次性选择的结果，而
且即使到达了均衡也可能再次偏离有限理性博弈方会在博弈过程中学习博弈通过试错寻找较好的策略
演化博弈思想
传统博弈理论的两个苛刻假设：（1）完全理性（2）完全信息与传统博弈理论不同，演化博弈理论并不要求参与人是完全理性的，也不要求完全信息的条件。演化博弈论（Evolutionary Game Theory）把博弈理论分析和动态演化过程分析结合起来的一种理论。在方法论上，它不同于博弈论将重点放在静态均衡和比较静态均衡上，强调的是一种动态的均衡。演化博弈理论源于生物进化论。
合作是否是一种演化稳定策略？
演化稳定策略（ESS）
分析：
博弈方 1 博弈方2
C C D 2,2 3,0
D 0,3 1,1
假定一个群体由合作者构成，由于基因变异出现了比例为ε的背叛者。此时合作者的收益为：(1-ε)*2+ε*0=2-2ε 背叛者的收益为：(1-ε)*3+ε*1=3-2ε 由于背叛者的收益高于合作者的收益，背叛者不仅不会消亡，反而会越来越多。因此，合作不是一个演化稳定策略。
• 博弈方策略类型比例动态变化是有限理性博弈分析的核心，其关
键是动态变化的速度 • 以采用“同意”策略类型博弈方的比例为例，其动态变化速度可用下列微分方程反映：
签协议博弈的复制动态和进化稳定策略
动态微分方程的相位图
dx/dt
0 0.5
1
x
稳定状态、不动点：x*=0, x*=1
签协议博弈的复制动态和进化稳定策略
2 打击容忍
（1，5）
的机制仍然是与对称博弈中相似的复制动态。
分别对两个群体成员进行复制动态和演化稳定策略分析。假设博弈方1中，采用“进入”策略的占的比例为x；在博弈方
（0，0）
（2，2）
2中，采用“打击”策略的占的比例为y。
复制动态中的非对称博弈
对于博弈方1：博弈方2 打击博弈方 1 进入不进 0, 0 1, 5 容忍 2, 2 1, 5
• 演化博弈的发展出现了一些新的思路，对演化稳定策略和合作演化博弈的研究不断深入，学者开始关注带有随机因素影响的演化过程。进入2l世纪以来，国内的学者也开始 21世纪关注演化博弈论，也做出了大量的研究。
演化博弈分析框架
最优反应动态：有快速学习能力的小群体成员的反复博弈复制动态：学习速度很慢的成员组成的大群体随机配对的反复博弈演化稳定策略（ESS）

e商务文档

演化博弈

相关文档推荐：