当前位置：文档之家› 第五章有限理性和进化博弈

第五章有限理性和进化博弈

最优反应动态模拟：初次博弈1个A
A
B
A
B
BA
AB
B
B
B
B
B
A
A
A
B
A
A
A
A
A
A
A
A
初次博弈相邻2个A
B
A
A
B
AB
AA
A
B
A
A
A
A
A
初次博弈相连3个A
A
B
A
B
A
A
A
A
A
A
5.2.2 古诺调整过程
古诺模型反应函数
q1
3
q2 2
最优反应动态模拟
q2
3
q1 2
1 博弈方1 2.5 博弈方2 3
2 1.5 1.75
❖ 它探讨种群选择的策略是否获得最佳的收益，并消除任何小的突变群体的扰动。
一个例子：对称博弈演化博弈
❖ 首先假定群体中的参与人都是完全相同的（对称博弈）。
❖ 其次，假定每个参与人只能机械地选择某种策略（而无法改变自己的策略）。如果某种策略获得了成功，采用这种策略的参与人将越来越多，反之如果某种策略不成功，采用这种策略的参与人就越来越少。
问题2：此博弈是否存在演化稳定策略
AB
A 0,0 2,1
B 1,2 0,0
混合策略下演化稳定策略的定义
在二人对称博弈中，混合策略P*是演化稳定策略，如果以下两式成立：
1U P*, P* U P ', P* 2若U P*, P* =U P ', P*，则U P*, P ' U P ', P '
❖ 这个领域的开创性工作是由英国生物学家约翰·梅纳德·史密斯（John Maynard Smith）和G.R. 普莱斯（G.R.Price）1973年进行的。
❖ 演化博弈现在正逐渐被广泛应用于社会经济学领域。
演化博弈的关注内容
❖ 演化博弈强调经济变迁过程中以个体多样性变异机制和偏好选择机制为代表的种群研究。
❖ 二是人对环境的计算能力和认识能力是有限的，人不可能无所不知；
❖ 20世纪40年代，西蒙详尽而深刻地指出了新古典经济学理论的不现实之处，分析了它的两个致命弱点:
❖ (1)假定目前状况与未来变化具有必然的一致性；
❖ (2)假定全部可供选择的“备选方案”和“策略”的可能结果都是已知的。
❖ 而事实上这些都是不可能的。
适应基因适应性（fitness）繁殖灭绝变异
自然界中的博弈
❖ 吸血蝙蝠夜间去大型哺乳动物那里吸血，有些个体偶尔会空腹而归，此时吸饱血的个体就会吐出胃内的血液喂给饥饿的个体，尽管它们之间并没有直接血缘关系。
❖ 吸血蝙蝠更有可能回吐血液给以前曾经回吐过血液的蝙蝠，而骗子（拒绝分享的蝙蝠）将被蝙蝠群体记住，并且被排除在这种协作之外。
❖ 在演化博弈中，认为参与人的选择行为可以依据前人的经验、学习与模仿他人行为、受遗传因素的决定等。
❖ 因而演化博弈把具有主观选择行为的参与人扩展为包括动物、植物在内的有机体，动植物参与者的支付可被理解为为某种适应程度。
❖ 把博弈论的分析与应用从研究人类的竞争行为扩展为研究有机体的策略互动关系。
❖ 西蒙的分析结论使整个新古典经济学理论和管理学理论失去了存在的基础。
❖ 西蒙指出传统经济理论假定了一种“经济人”。
❖ 他们具有一个很有条理的、稳定的偏好体系，并拥有很强的计算能力，靠此能计算出在他们的备选行动方案中，哪个可以达到尺寸上的最高点。
❖ 西蒙认为人们在决定过程中寻找的并非是 “最大”或“最优”的标准，而只是“满意”的标准。
❖ 进化稳定策略（ESS）
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方快速学习模型
5.2.2 古诺调整过程
5.2.1 协调博弈的有限博弈方快速学习模型
模型：
1 博弈方2
A
B
2
A
50，50 49，0
5
B
0，49 60，60
4
3
协调博弈
反应、策略调整规则推导
xi (t) t时刻博弈方i的邻居中采用A策略的数量， xi (t) 0,1,2 2 xi (t) t时刻博弈方i的邻居中采用B策略的数量，采用A的得益：xi (t) 50 [2 xi (t)] 49 采用B的得益：xi (t) 0 [2 xi (t)] 60 当xi (t) 22 / 61时，博弈方i在t 1时刻采用A；当xi (t) 22 / 61时，博弈方i在t 1时刻采用B
❖ 假定在每个时期dt，每个个体i都以α dt的概率发现某个随机个体j的收益，如果i发现j的收益比自己高，就以pijt的概率转变为j的策略。
pitj
(
t j
0
t i
)
当
t j
t i
当
t j
t i
此时在t+dt期使用si策略的局中人所占比例的期望值Epit+dt为：
n
i
Epitdt pit dtpit
经济学与生物学
❖ 经济学和生物学的历史从来就交织在一起。
❖ 二者研究的都是个体在给定环境下的最优策略。它们包含的内在逻辑相当一致：所有生命体的行为看上去总好像设法使其基因的遗传频率最大化，正如企业最大化其利润一样。
经济学与生物学
经济学企业最优化策略利润扩张倒闭创新
生物学物种（或个体）
（2）（2/3,1/3）是否是一个严格纳什均衡？（3）（2/3,1/3）是否是ESS？
鹰鸽博弈
H
D
H
(v-c)/2,(v-c)/2
v,0
D
0,v
v/2,v/2
博弈的演化稳定策略是什么？
当v>c时，(H,H)是严格纳什均衡，因此H是演化稳定策略。
当v=c时，(H,H)是弱纳什均衡，因为U(H,D)>U(D,D)，因此H是演化稳定策略当v<c时，不存在纯策略演化稳定策略。此时是否存在混合策略ESS？首先找出混合策略纳什均衡(v/c,1-v/c)，其次验证其是否为ESS。
3
4………
2.125 1.875
2.25 1.9375
收敛条件
| dr1 || dr2 | 1 dq2 dq1
问题：两寡头始终假设对方产量不变
5.3 复制动态和进化稳定性：两人对称博弈
5.3.1 签协议博弈的复制动态和进化稳定策略 5.3.2一般两人对称博弈复制动态和进化稳定
策略 5.3.3 协调博弈的复制动态和进化稳定博弈
un x 0 (1 x) 0 0 u x u y (1 x) un x2
❖ 博弈方策略类型比例动态变化是有限理性博弈分析的核心，其关键是动态变化的速度
❖ 以采用“同意”策略类型博弈方的比例为例，其动态变化速度可用下列微分方程反映（复制动态方程）
dx dt
x(u y
u)
本章分四节
5.1有限理性博弈及其分析框架 5.2最优反应动态 5.3复制动态和进化稳定性：
两人对称博弈 5.4复制动态和进化稳定性：
两人非对称博弈
5.1 有限理性博弈及其分析框架
5.1.1 有限理性及其对博弈的影响 5.1.2 有限理性博弈分析框架
5.1.1 有限理性及其对博弈的影响
❖ 有限理性意味着一般至少有部分博弈方不会采用完全理性博弈的均衡策略
❖ 有限理性意味着均衡是不断调整和改进而不是一次性选择的结果，而且即使到达了均衡也可能再次偏离
❖ 有限理性博弈方会在博弈过程中学习博弈通过试错寻找较好的策略
5.1.2 有限理性博弈分析框架
❖ 最优反应动态：有快速学习能力的小群体成员的反复博弈
❖ 复制动态：学习速度很慢的成员组成的大群体随机配对的反复博弈
演化稳定策略是
C
D
什么呢？
C 2,2 0,3
D 3,0 1,1
假定一个群体由背叛者构成，由于基因变异出现了比例为ε的合作者。此时背叛者的收益为：(1-ε)*1+ε*3=1+2ε
合作者的收益为：(1-ε)*0+ε*2=2ε 由于合作者的收益低于背叛者的收益，合作者会逐渐消亡，因此背叛是一个演化稳定策略。
找出以下博弈的混合策略ESS
AB
A 0,0 2,1
B 1,2 0,0
（1）找出博弈的混合策略纳什均衡。由于博弈的对称性，双方的混合策略纳什均衡必然是相同
的，设为（p，1-p）给定局中人1的策略（p，1-p）局中人2选择A的收益：p*0+(1-p)*2=2-2p 局中人2选择B的收益：p*1+(1-p)*0=p 根据2-p=p，解出p=2/3
pit
(
t i
t )
这个式子称为复制者动态（replicator dynamic）方程
5.3.1 签协议博弈的复制动态和进化稳定策略
签协议博弈：
假设群体中采用“同意” 比例x(t)
同意不同意
博弈方2 同意不同意
1，1 0，0 0，0 0，0
则不同策略期望得益和平均得益为：
uy x 1 (1 x) 0 x
p
t j
(
t j
t i
)
dtpit
ptj
(
t i
t j
)
j i 1
j 1
n
pit dtpit
p
t j
(
t i
t j
)
j 1
pit
Hale Waihona Puke dtpit(t i
t)
其中 t
1t p1t

e商务文档

第五章有限理性和进化博弈

相关文档推荐：

e商务文档

第五章 有限理性和进化博弈

相关文档推荐：

第五章有限理性和进化博弈