当前位置:文档之家› 第三章-第五节-演化博弈模型

第三章-第五节-演化博弈模型


A
20
进入 A
不进
B 打击
0 ,0
1 ,5
不打击
2 ,2 1 ,5
A:“进入”的群体比例为x “不进”的群体比例为1-x
B:“打击”的群体比例为y “不打击”的群体比例为1-y
在位者群体的复制动态方程: F B y d d y t y U B s U B y 1 y 2 x
在位者的群体复制动态相位图为:
A
18
进入 A
不进
B 打击
0 ,0
1 ,5
不打击
2 ,2 1 ,5
A:“进入”的群体比例为x “不进”的群体比例为1-x
B:“打击”的群体比例为y “不打击”的群体比例为1-y
竞争者群体的复制动态方程: F A x d d x t x U A e U A x 1 x 1 2 y
竞争者的群体复制动态相位图为:
m-z ,1-m
1-m,m-z
0 ,0
➢ m、P为求偶成功的概率 ➢ z为机会成本(体力消耗、危险性等)
满足:m ∈ (0.5,1],m<P≤1
令x为采用“鸣”策略的群体比例,1-x为采用“不鸣”策略的群体 比例 则复制动态方程F(x):
F xd d x tx1 x m z 1 P x
稳定状态:x*=0,x*=1,x*=(m-z)/(1-P)
则: dx x2 x3
dx dt
xUY
U
dt
当x=0时,稳定;
复制动态A方程
当x>0时,最终稳定于x*6=1
dx/dt
dx x2 x3
dt
甲Y
N

Y
N
1,1
0 ,0
0, 0
0,0
0
1x
图1 签协议博弈的复制动态相位图
x*=0,x*=1为稳定状态,此时,dx/dt=0 但x*=1为ESS,即最终所有人都将选择“Y”
Fxddxt x1xxac1xbd x1xxv2c1x2v
当F(x) =0时,x*=0,x*=1,x*=v/c为稳定状态
A
11



鹰 (v-c)/2,(v-c)/2 v ,0

鸽 0 ,v
v/2 ,v/2
F xd d x tx1x xv 2c1x2 v
① 假设v=2,c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)
A
7
(二)一般两人对称博弈
甲 S1 S2

S1
S2
a,a
b ,c
c, b
d,d
群体中采用S1的比例为x,S2的比例为1-x,对于甲
U1xa1xb
U2xc1xd UxU 11xU 2
则复制动态方程F(x):
Fxddxt xU1U x 1 x x a c 1 x b d
当F(x) =0时,
dx/dt
0
ESS: x*=1
1
x
0
1v时,种群间宁可发生冲突,也不愿意和平共处以获得更多的收益。主要原
因在于当一方忍让时,另一方可获得更多收益。
A
这是一种悲剧。目前,人类的现状和理性尚不能解决这种悲剧。
13
(四)蛙鸣博弈的复制动态和ESS
蛙鸣 A 不鸣
蛙B

不鸣
P-z ,P-z
复制动态实际上是描述某一特定策略在一个种群中被采用 的频数或频度的动态微分方程,可以用下式表示:
dxi dt
xi[(usi ,x)u(x,x)]
A
4
演化博弈关注的问题
当时间趋于无穷大时,博弈参与方策略选择行为是怎样的? 这就是演化博弈稳定性问题,一个稳定状态必须对微小扰 动具有稳健性才能称为演化稳定策略。也就是说,如果我 们假定为演化稳定策略的稳定点,则该点除了本身必须是 均衡状态以外,还必须具有这样的性质:如果某些博弈方 由于偶然的错误偏离了它们,复制动态仍然会使x回复到 x*。在数学上,这相当于要求:当干扰使x低于时x* , dx/dt必须大于0;当干扰使得x出现高于时x*, dx/dt必 须小于0,这就要求这些稳定状态处于的导数必须小于0。
B:“打击”的群体比例为y “不打击”的群体比例为1-y
对A而言: U A e y 0 1 y 2 2 2 y
U A ny11y11
U A x U A e 1 x U A n 2 x 1 y 1 x
则竞争者群体的复制动态方程FA(x):
F A x d d x t x U A e U A x 1 x 1 2 y
(一) 市场阻入博弈
有两个群体:竞争者和在位者
竞争者
不进入
进入
竞 进入 争 者 不进
在位者
打击
不打击
0 ,0
2 ,2
1 ,5
1 ,5
(1,5) 打击
在位者 不打击
(0,0) (2,2)
A
17
采用A表示竞争者,B表示在位者
B
打击
不打击
进入 A
不进
0 ,0 1 ,5
2 ,2 1 ,5
假设:
A:“进入”的群体比例为x “不进”的群体比例为1-x
dy/dt
dy/dt
0
1y
(a) x=0 y*∈[0,1]
0
1y
(b) x≠0
ESS: y*=0
A
21
进入 A
不进
B 打击
0 ,0
1 ,5
不打击
2 ,2 1 ,5
A:“进入”的群体比例为x “不进”的群体比例为1-x
B:“打击”的群体比例为y “不打击”的群体比例为1-y
最后,得到竞争者和在位者两群体复制动态的关系和稳定性图例
dx/dt
1/6 0
1x
F ‘(0) >0, F’(1)>0,而 F‘(1/6)<0,
则ESS为: x*=1/6
当冲突损失严重时,例如c/v=6时,两个种群发生战争的可能性为1/36;和平共处
的可能性为25/36;一方霸道、一方忍让的可能性为10/36。
发生战争的可能性随着c/v比值的增加而A降低,即:和平共处的可能性也随着1增2 加。



鹰 (v-c)/2,(v-c)/2 v ,0

鸽 0 ,v
v/2 ,v/2
F xd d x tx1x xv 2c1x2 v
② 假设v=8,c=8(表示种群间和平共
处所得到的收益等于两者冲突导致的损失)
dx/dt
③ 假设v=8,c=4(表示种群间和平共
处所得到的收益大于两者冲突导致的损失)
dx/dt
dx/dt
0
1
x
0
1
x
ESS: x*=0
ESS: x*=1
显然,当机会成本小于收益时,所有的雄蛙将选择“不鸣叫”。 当“鸣叫”的收益大于群体鸣叫而个别A雄蛙“搭便车”的收益时,所有雄蛙都16将鸣
叫。
三、复制动态中的非对称博弈
➢ 对称博弈:相似/相同群体中的演化博弈行为 ➢ 非对称博弈:不同群体间的演化博弈行为
对B而言: U B s x0 1 x 5 5 5 x
U B n x2 1 x 5 5 3 x
U B y U B s 1 y U B n 5 2 x y 3 x
则在位者群体的复制动态方程FB(x):
F B y d d y t y U B s U B y 1 y 2 x
x*=0和x*=1为ESS
这意味着: 当初始x<11/61时,ESS为x*=0; 当初始x>11/61时,ESS 为1x0*=1.
(四)鹰鸽博弈的复制动态和ESS



鹰 (v-c)/2,(v-c)/2 v ,0

鸽 0 ,v
v/2 ,v/2
令x为采用“鹰”策略的群体比例,1-x为采用“鸽”策略的群体比 例 则复制动态方程F(x):
dx/dt
dx/dt
dx/dt
0
1x
(a) y=1/2 x*∈[0,1]
0
1x
(b) y>1/2 ESS: x*=0
A
0
1x
(c) y<1/2 ESS: x*=1
19
进入 A
不进
B 打击
0 ,0
1 ,5
不打击
2 ,2 1 ,5
A:“进入”的群体比例为x “不进”的群体比例为1-x
B:“打击”的群体比例为y “不打击”的群体比例为1-y
A
3
在演化博弈理论中,演化稳定策略 (Evolutionary Stable Strategy, ESS)和复制动态(Replication Dynamics)是两个核 心概念。演化稳定策略是指在博弈的过程中,博弈双方由于有 限理性,博弈方不可能一开始就找到最优策略以及最优均衡点。 于是,博弈方在博弈的过程中需要不断进行学习,有过策略失 误会逐渐改正,并不断模仿和改进过去自己和别人的最有利策 略。经过一段时间的模仿和改错,所有的博弈方都会趋于某个 稳定的策略。
当个别雄蛙“搭便车”的收益大于群体雄蛙“鸣叫”所获得的收益时,则总会存
A
15
在搭便车“不鸣叫”的雄蛙。
蛙鸣 A 不鸣
蛙B

不鸣
P-z ,P-z
m-z ,1-m
1-m,m-z
0 ,0
② 若(m-z)/(1-P) <0,即z>m
F xd d x tx1 x m z 1 P x
③ 若(m-z)/(1-P) >1,即m-z>1-P
若简化问题分析,令v1=10,v2=2,c=12


相关主题