当前位置:文档之家› 第五章 有限理性和进化博弈

第五章 有限理性和进化博弈


最优反应动态模拟:初次博弈1个A
A
B
A
B
BA
AB
B
B
B
B
B
A
A
A
B
A
A
A
A
A
A
A
A
初次博弈相邻2个A
B
A
A
B
AB
AA
A
B
A
A
A
A
A
初次博弈相连3个A
A
B
A
B
A
A
A
A
A
A
5.2.2 古诺调整过程
古诺模型反应函数
q1
3
q2 2
最优反应动态模拟
q2
3
q1 2
1 博弈方1 2.5 博弈方2 3
2 1.5 1.75
❖ 它探讨种群选择的策略是否获得最佳的收 益,并消除任何小的突变群体的扰动。
一个例子:对称博弈演化博弈
❖ 首先假定群体中的参与人都是完全相同的 (对称博弈) 。
❖ 其次,假定每个参与人只能机械地选择某种 策略(而无法改变自己的策略)。如果某种 策略获得了成功,采用这种策略的参与人将 越来越多,反之如果某种策略不成功,采用 这种策略的参与人就越来越少。
问题2:此博弈是否存在演化稳定策略
AB
A 0,0 2,1
B 1,2 0,0
混合策略下演化稳定策略的定义
在二人对称博弈中,混合策略P*是演化稳定策略,如果 以下两式成立:
1U P*, P* U P ', P* 2若U P*, P* =U P ', P*,则U P*, P ' U P ', P '
❖ 这个领域的开创性工作是由英国生物学家约翰·梅 纳德·史密斯(John Maynard Smith)和G.R. 普莱斯(G.R.Price)1973年进行的。
❖ 演化博弈现在正逐渐被广泛应用于社会经济学领域。
演化博弈的关注内容
❖ 演化博弈强调经济变迁过程中以个体多样 性变异机制和偏好选择机制为代表的种群 研究。
❖ 二是人对环境的计算能力和认识能力是有限 的,人不可能无所不知;
❖ 20世纪40年代,西蒙详尽而深刻地指出了 新古典经济学理论的不现实之处,分析了它 的两个致命弱点:
❖ (1)假定目前状况与未来变化具有必然的一致 性;
❖ (2)假定全部可供选择的“备选方案”和“策 略”的可能结果都是已知的。
❖ 而事实上这些都是不可能的。
适应 基因 适应性(fitness) 繁殖 灭绝 变异
自然界中的博弈
❖ 吸血蝙蝠夜间去大型哺乳动物那里吸血,有些个 体偶尔会空腹而归,此时吸饱血的个体就会吐出 胃内的血液喂给饥饿的个体,尽管它们之间并没 有直接血缘关系。
❖ 吸血蝙蝠更有可能回吐血液给以前曾经回吐过血 液的蝙蝠,而骗子(拒绝分享的蝙蝠)将被蝙蝠 群体记住,并且被排除在这种协作之外。
❖ 在演化博弈中,认为参与人的选择行为可以 依据前人的经验、学习与模仿他人行为、受 遗传因素的决定等。
❖ 因而演化博弈把具有主观选择行为的参与人 扩展为包括动物、植物在内的有机体,动植 物参与者的支付可被理解为为某种适应程度。
❖ 把博弈论的分析与应用从研究人类的竞争行为扩展 为研究有机体的策略互动关系。
❖ 西蒙的分析结论使整个新古典经济学理论和 管理学理论失去了存在的基础。
❖ 西蒙指出传统经济理论假定了一种“经济 人”。
❖ 他们具有一个很有条理的、稳定的偏好体 系,并拥有很强的计算能力,靠此能计算 出在他们的备选行动方案中,哪个可以达 到尺寸上的最高点。
❖ 西蒙认为人们在决定过程中寻找的并非是 “最大”或“最优”的标准,而只是“满 意”的标准。
❖ 进化稳定策略(ESS)
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方 快速学习模型
5.2.2 古诺调整过程
5.2.1 协调博弈的有限博弈方快速学习模型
模型:
1 博弈方2
A
B
2
A
50,50 49,0
5
B
0,49 60,60
4
3
协调博弈
反应、策略调整规则推导
xi (t) t时刻博弈方i的邻居中采用A策略的数量, xi (t) 0,1,2 2 xi (t) t时刻博弈方i的邻居中采用B策略的数量, 采用A的得益:xi (t) 50 [2 xi (t)] 49 采用B的得益:xi (t) 0 [2 xi (t)] 60 当xi (t) 22 / 61时,博弈方i在t 1时刻采用A; 当xi (t) 22 / 61时,博弈方i在t 1时刻采用B
❖ 假定在每个时期dt,每个个体i都以α dt的概率发现某个随 机个体j的收益,如果i发现j的收益比自己高,就以pijt的概 率转变为j的策略。
pitj
(
t j
0
t i
)

t j
t i

t j
t i
此时在t+dt期使用si策略的局中人所占比例的期望 值Epit+dt为:
n
i
Epitdt pit dtpit
经济学与生物学
❖ 经济学和生物学的历史从来就交织在一起。
❖ 二者研究的都是个体在给定环境下的最优策 略。它们包含的内在逻辑相当一致:所有生 命体的行为看上去总好像设法使其基因的遗 传频率最大化,正如企业最大化其利润一样。
经济学与生物学
经济学 企业 最优化 策略 利润 扩张 倒闭 创新
生物学 物种(或个体)
(2)(2/3,1/3)是否是一个严格纳什均衡? (3)(2/3,1/3)是否是ESS?
鹰鸽博弈
H
D
H
(v-c)/2,(v-c)/2
v,0
D
0,v
v/2,v/2
博弈的演化稳定策略是什么?
当v>c时,(H,H)是严格纳什均衡,因此H是演化稳定策 略。
当v=c时,(H,H)是弱纳什均衡,因为U(H,D)>U(D,D), 因此H是演化稳定策略 当v<c时,不存在纯策略演化稳定策略。 此时是否存在混合策略ESS? 首先找出混合策略纳什均衡(v/c,1-v/c), 其次验证其是否为ESS。
3
4………
2.125 1.875
2.25 1.9375
收敛条件
| dr1 || dr2 | 1 dq2 dq1
问题:两寡头始终假设对方产量不变
5.3 复制动态和进化稳定性: 两人对称博弈
5.3.1 签协议博弈的复制动态和进化稳定策略 5.3.2一般两人对称博弈复制动态和进化稳定
策略 5.3.3 协调博弈的复制动态和进化稳定博弈
un x 0 (1 x) 0 0 u x u y (1 x) un x2
❖ 博弈方策略类型比例动态变化是有限理性博 弈分析的核心,其关键是动态变化的速度
❖ 以采用“同意”策略类型博弈方的比例为例, 其动态变化速度可用下列微分方程反映(复 制动态方程)
dx dt
x(u y
u)
本章分四节
5.1有限理性博弈及其分析框架 5.2最优反应动态 5.3复制动态和进化稳定性:
两人对称博弈 5.4复制动态和进化稳定性:
两人非对称博弈
5.1 有限理性博弈及其分析框架
5.1.1 有限理性及其对博弈的影响 5.1.2 有限理性博弈分析框架
5.1.1 有限理性及其对博弈的影响
❖ 有限理性意味着一般至少有部分博弈方不会采 用完全理性博弈的均衡策略
❖ 有限理性意味着均衡是不断调整和改进而不是 一次性选择的结果,而且即使到达了均衡也可 能再次偏离
❖ 有限理性博弈方会在博弈过程中学习博弈通过 试错寻找较好的策略
5.1.2 有限理性博弈分析框架
❖ 最优反应动态:有快速学习能力的小群体 成员的反复博弈
❖ 复制动态:学习速度很慢的成员组成的大 群体随机配对的反复博弈
演化稳定策略是
C
D
什么呢?
C 2,2 0,3
D 3,0 1,1
假定一个群体由背叛者构成,由于基因变异出现 了比例为ε的合作者。 此时背叛者的收益为:(1-ε)*1+ε*3=1+2ε
合作者的收益为:(1-ε)*0+ε*2=2ε 由于合作者的收益低于背叛者的收益,合作者会 逐渐消亡,因此背叛是一个演化稳定策略。
找出以下博弈的混合策略ESS
AB
A 0,0 2,1
B 1,2 0,0
(1)找出博弈的混合策略纳什均衡。 由于博弈的对称性,双方的混合策略纳什均衡必然是相同
的,设为(p,1-p) 给定局中人1的策略(p,1-p) 局中人2选择A的收益:p*0+(1-p)*2=2-2p 局中人2选择B的收益:p*1+(1-p)*0=p 根据2-p=p,解出p=2/3
pit
(
t i
t )
这个式子称为复制者动态(replicator dynamic)方程
5.3.1 签协议博弈的复制动态和进化稳定策略
签协议博弈:
假设群体中采用“同意” 比例x(t)
同意 不同意
博弈方2 同意 不同意
1,1 0,0 0,0 0,0
则不同策略期望得益和 平均得益为:
uy x 1 (1 x) 0 x
p
t j
(
t j
t i
)
dtpit
ptj
(
t i
t j
)
j i 1
j 1
n
pit dtpit
p
t j
(
t i
t j
)
j 1
pit
Hale Waihona Puke dtpit(t i
t)
其中 t
1t p1t
相关主题