两人非对称博弈的复制动态和进化稳定性1.人是完全理性的还是有限理性的?经济学通常假设人们有完全理性,有始终追求最大利益的完美意识、分析推理和准确行为能力。
现实是这样的吗?这种假设的现实性是有问题的。
事实上人们只是在分析处理简单问题时接近完全理性要求,在分析处理复杂问题时理性的局限性很明显。
不能满足完全理性要求的就是有限理性的。
以有限理性为基础的博弈称为有限理性博弈。
有限理性的博弈方往往不会一开始就找到最优策略,均衡通常是调整改进的结果,而且即使达到也可能再偏离。
2.有限理性博弈是怎样形成的?有限理性博弈的有效分析框架是借鉴生物进化博弈理论发展起来的进化博弈论,也称为“经济学中的进化博弈论”。
生物进化博弈理论是以达尔文的自然选择思想为基础的生物学理论,研究生物种群通过变异和增殖的共同作用,拥有增殖成功率较高形状的个体在种群中比例的变化、稳定及其对生物进化的影响。
有限理性博弈方的学习和策略调整与生物进化博弈研究的生物特征动态变化很相似,而有限理性博弈的均衡稳定性则与生物进化博弈中描述性状特征频数、比例稳定性的“进化稳定策略”概念相似,因此借鉴生物进化博弈的分析方法讨论有限理性博弈是最有效的分析框架。
有限理性博弈的核心不是博弈方的最优策略选择,而是群体成员采用特定策略比例的变化趋势和稳定性。
3.进化博弈论与传统完全理性博弈理论的联系一方面进化博弈论是以传统的完全理性博弈论为基础的,进化博弈论研究的许多博弈问题和模型都是完全理性博弈的经典模型,而且在进化博弈分析中仍需要用完全理性博弈分析方法分析博弈方的策略和得益。
另一方面进化博弈论中的两人非对称博弈的进化博弈分析对应的是两个(或多个)有差别的有限理性博弈方群体成员之间的随机配对博弈。
一、一般两人非对称博弈的复制动态和进化稳定策略。
1. 写出复制动态方程。
1>博弈方1的复制动态方程111111d ()(,)()()d x x t F x t u u t=-x y1α2α1β2β1y 2y 1x 2x 博弈方1博弈方2222121d ()(,)()()d x x t F x t u u t =-x y111111112111212112111112112 =(1,0) =(0,1)1 =(,)a b y u c d y a b y u c d y a b y u x x c d y αα⎧⎛⎫⎛⎫⎪ ⎪⎪⎝⎭⎝⎭⎪⎪⎛⎫⎛⎫⎪⎨ ⎪⎪⎝⎭⎝⎭⎪⎪⎛⎫⎛⎫⎪ ⎪⎪⎪⎝⎭⎝⎭⎩其中采用的人的期望得益采用的人的期望得益博弈方群体的平均得益 2>博弈方2的复制动态方程111212d ()(,)()()d y y t F y t u u t =-x y 222222d ()(,)()()d y y t F y t u u t =-x y2212112222222212222212122221 =(,)00 =(,)12 =(,)a b u x x c d a b u x x c d a b y u x x c d y ββ⎧⎛⎫⎛⎫⎪⎪⎪⎝⎭⎝⎭⎪⎪⎛⎫⎛⎫⎪⎨⎪⎪⎝⎭⎝⎭⎪⎪⎛⎫⎛⎫⎪ ⎪⎪⎪⎝⎭⎝⎭⎩其中采用的人的期望得益采用的人的期望得益博弈方群体的平均得益2.进化策略稳定性分析以博弈方1的复制动态方程为例,令1(,)0x F =x y ,求得稳定状态*x ,通过“稳定性定理”(在稳定状态处1(,)x F 'x y 必须小于0,也就是说,当干扰使得x 出现高于*x 时,1(,)x F x y 必须大于0,当干扰使得x 出现低于*x 时,1(,)x F x y 必须小于0)判断*x 是否为ESS 。
二、例子(一)市场阻入博弈的复制动态和进化稳定策略。
打击不打y 1-y x 1-x 博弈方1博弈方2xESS()F x x解:1.首先分析博弈方1。
1>博弈方1的复制动态方程[][]111d ()(,)()()=x()1()12()d x x t F x y x t u u t x t y t t=---其中1112102 =(1,0)=2-2111-02 =(0,1)1111-021 =(,1-)2(1)(1)111-y u y y y u y y u x x x y x y ⎧⎛⎫⎛⎫⎪⎪⎪⎝⎭⎝⎭⎪⎪⎛⎫⎛⎫⎪=⎨ ⎪⎪⎝⎭⎝⎭⎪⎪⎛⎫⎛⎫⎪=-+- ⎪⎪⎪⎝⎭⎝⎭⎩采用进入的人的期望得益采用不进入的人的期望得益博弈方群体的平均得益2>博弈方1的进化策略稳定性分析。
1)当12y =时,[][][]1122(,)|x()1()12()|()1()(11)0x y y F x y t x t y t x t x t ===--=--≡,即所有x 水平都是稳定状态。
2)当12y >时,令[][](,)x()1()12()0x F x y t x t y t =--=,得*0x =和*1x =两个稳定状态,又因为[][](,)=12()12()x F x y x t y t '--,故[](0,)=12()0x F y y t -<',[](1,)=-12()0x F y y t '->,所以*0x =是ESS 。
x(,)x F x yx(,)x F x yx3) 当12y <时,令(,)0x F x y =,得*0x =和*1x =两个稳定状态,同2)可得*1x =是ESS 。
2.对博弈方2进行进化博弈分析。
1>博弈方2的复制动态方程[][]212dy()(,)()()=()1()2()d y t F x y y t u u y t y t x t t=---其中21222021 =(,1)=5-5550020 =(,1)53551021 =(,1-)(1)(2)551-u x x xu x x xy u x x y y x y ⎧⎛⎫⎛⎫-⎪ ⎪⎪⎝⎭⎝⎭⎪⎪⎛⎫⎛⎫⎪-=-⎨ ⎪⎪⎝⎭⎝⎭⎪⎪⎛⎫⎛⎫⎪=-- ⎪⎪⎪⎝⎭⎝⎭⎩采用进入的人的期望得益采用不进入的人的期望得益博弈方群体的平均得益 2>博弈方2的进化策略稳定性分析。
1)当0x =时,[]()0(,)|=()1()200y x F x y y t y t =--⨯≡,即所有y 水平都是稳定状态。
2)当0x ≠时,必然有0x >,令[][](,)=()1()2()0y F x y y t y t x t --=,得到*0y =和*1y =两个稳定状态,又因为[][][][][](,)=1()2()()2()12()2()y F x y y t x t y t x t y t x t '----=--,故[][](,0)1202()0y F x x t '=-⨯-<,[][](,1)1212()2()0y F x x t x t '=-⨯-=>,所以*0y =是ESS 。
y(,)y F x yxy(,)y F x y y3、结合对两博弈方的进化策略稳定性分析,以x 和y 为坐标的坐标平面如下由上图可以看出,博弈的进化稳定策略只有*1x =和*0y =一点,其他点都不是复制动态中收敛和具有抗扰动的稳定状态。
这意味着有限理性的博弈方通过长期反复博弈,学习和调整策略的结果是,潜在的进入者最终都会进入市场竞争,而先占领市场的阻入一方则会放弃采取不理智的报复措施。
这与完全理性条件下博弈的淄博一完美纳什均衡完全一致,说明在这个问题上有限理性的博弈方通过学习是能够掌握淄博一完美纳什均衡策略的。
(二)非对称鹰鸽博弈的进化博弈分析。
解:1、对博弈方1的进化博弈进行分析。
1>博弈方1的复制动态方程。
[][]111d ()(,)()()=()1()56()d x x t F x y x t u u x t x t y t t=---xy鹰(入侵) 鸽(不入侵)y 1-yx 1-x博弈方1博弈方2 鹰(抗击) 鸽(不抗击其中11121-110 =(1,0)=10-11051--110 =(0,1)5-5051--1101 =(,1-)5556051-y u y y y u yy y u x x x y xyy ⎧⎛⎫⎛⎫⎪ ⎪⎪⎝⎭⎝⎭⎪⎪⎛⎫⎛⎫⎪=⎨ ⎪⎪⎝⎭⎝⎭⎪⎪⎛⎫⎛⎫⎪=+-- ⎪⎪⎪⎝⎭⎝⎭⎩采用鹰(抗击)的人的期望得益采用鹰(不抗击)的人的期望得益博弈方群体的平均得益 2>博弈方1的进化策略稳定性分析。
1)当56y =时,[][][]1526(,)|()1()56()|()1()(55)0x y y F x y x t x t y t x t x t ===--=--≡,即所有x 水平都是稳定状态。
2)当56y >时,令[][](,)()1()56()0x F x y x t x t y t =--=,得*0x =和*1x =两个稳定状态,又因[][](,)=12()56()x F x y x t y t '--,故[][](0,)=1056()0x F y y t '-<-,[](1,)=56()0x F y y t '-->,所以*0x =是ESS 。
3) 当56y <时,令[][](,)()1()56()0x F x y x t x t y t =--=,得*0x =和*1x =两个稳定状态,同2)可得*1x =是ESS 。
x(,)x F x yx(,)x F x yx x2、对博弈方2的进化博弈进行分析。
1>博弈方2的复制动态方程[][]212dy()(,)()()=()1()16()d y t F x y y t u u y t y t x t t=---其中21222501 =(,1)=2-7210500 =(,1)1211501 =(,1-)16211-u x x xu x x xy u x x x y xyy ⎧-⎛⎫⎛⎫-⎪ ⎪⎪⎝⎭⎝⎭⎪⎪-⎛⎫⎛⎫⎪-=-⎨ ⎪⎪⎝⎭⎝⎭⎪⎪-⎛⎫⎛⎫⎪=-+- ⎪⎪⎪⎝⎭⎝⎭⎩采用进入的人的期望得益采用不进入的人的期望得益博弈方群体的平均得益 2>博弈方2的进化策略稳定性分析。
1)当16x =时,[][][][]00(,)|=()1()16()|()1()110y x x F x y y t y t x t y t y t ==--=--≡,即所有y 水平都是稳定状态。
2)当16x >,令[][](,)=()1()16()0y F x y y t y t x t --=,得到*0y =和*1y =两个稳定状态,又因为[][](,)=12()16()y F x y y t x t '--,故[][](,0)1016()0y F x x t '=--<,[][](,1)1216()0y F x x t '=-->,所以*0y =是ESS 。