博弈论分析思考
∵v1>0,c1>0,(1—p1)>0∴当p1<p3时,v1(p1—p3)/c1(1—p1)<0,二次项系数始终大于0,所以此时无论y是何种水平,x=0都是进化稳定策略,即申请人会进化到“真实”申请的状态。
但是实际应用中,因为1.申请人数量众多且呈上升趋势,监察人员难以全面兼顾;2.造假的材料往往比不造假材料编制得更好;3.监察人员本身调查率有限,因此使得在实际中往往p1>p3。当p1>p3时,假设p1、p3已知,y也已知y=a,由y=(p1v1—p3v1)/(c1—p1c1)解出c1'=v1(p1—p3)/a(1—p1),同理,当c1>c1'时,申请人同样会进化为全部“真实”申请的状态。
设监察人员不调查的概率为PC,则调查的概率为1—PC。因此申请人的期望得益=F*pc+(—D)(1—pc)。申请人“不真实”申报时,最低收益是—D,最高收益是F,两者相连,就为申请人的期望收益曲线,如下:
申请人的期望收益直线与横轴的交点就是监察人员的最佳决策pc*,因为当检察人员不调查概率小于pc*时,申请人收益为负,则申请人会增加“真实”申报,“真实”申报一增加,那么监察人员会因为其数量增多而相信材料信息,从而减少调查,不调查的概率会增加;当pc一旦大于pc*时,申请人收益为正,有利可图,则申请人会增加“不真实”申报,监察人员就又要增加调查,降低不调查的概率直到pc*,因此直线与横轴的交点就是监察人员的最佳决策。
博弈论分析与思考
本文讨论的是基金申报管理中如何杜绝项目申请人信息造假的问题,从完全信息静态博弈和有限理性的进化博弈两个分析框架下给出了具体建议,给了相关管理问题很好的解决思路。
一、完全信息静态博弈
完全信息静态博弈,是指各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。文章中给出了三个假设:申请人的申报与监察人员的调查在时间上看为同时决策,双方对各方的收益都了解,双方也都完全理性,可以根据自己的判断自行改变决策选择的概率。有了这三个条件的限制,就满足了完全信息静态博弈的基础,基金申请中的申请人与监察人员之间就构成了一种完全信息静态博弈。
二、有限理性的进化博弈
因为各种因素的影响,人不可能是完全理性的,因此文章又给出了下列假设:1.申请人与监察人员都是有限理性的;2.他们双方都不可能在一开始就找到最优策略,而是通过一系列的博弈和学习过程最终进化到稳定策略;3.监察人员是尽职的,不调查是因为客观调查的不允许。在这样的假设下,就成为一个有限理性动态博弈。
由上述理论同理可得直线与横轴的交点就是申请人的最佳决策。
令监察人员的期望得益为0,解得ps*=S/(P+S),1—pc*=P/(P+S),因此申请人选择“真实”与“不真实”申报的概率为(S/(P+S),P/(P+S))。
由于S和P都是监察人员不调查的得益,所以申请人的决策实际上只与这两者有关。
现行的做法是加大对申请人“不真实”申报的惩罚来规避虚假材料,而这样的加大惩罚只会使申请人的负得益更差,但这只会影响监察人员的决策,就像文章中给出的下降的点—D,短期内可以降低造假,但只会使博弈在长期中又重新在新的点达到均衡,而不影响申请人的决策,因为申请人在达到新的均衡后重新决定策略时,其决策只是由监察人员不调查的S和P的收益决定的。所以要在长期中规避“不真实”申报的问题,就要加大对监察人员失职的处罚,使点—P降低,这时候在项目申请人的混合策略中重新形成的均衡点才会使得申请人“不真实”申报的概率真正的有效的降低。
y
监察人员不调查
1—y
群体和群体的博弈方随机配对博弈,因此可以得到申请人“不真实”申报的期望收益uf==[p1( v1+ c1)-c1]y + ( 1-y) p1v1=p1c1y-c1y-p1v1;“真实”申报的期望收益ut=p3v1。
又因为“不真实”信息申报的人比例为X,“真实”申报的人比例为(1—x),所以申请人群体平均得益为 =xuf+(1—x)uf。
带入复制动态方程得到dx/dt=x(uf— )=x(1—x)[(p1v1—p3v1)—y(c1—p1c1)]
其相位图如下:
(根据常微分方程理论,切线斜率小于0的点为稳定点)
当y=(p1v1—p3v1)/(c1—p1c1)时,dx/dt始终为0,X始终稳定:
当y<(p1v1—p3v1)/(c1—p1c1)时,x=1是进化稳定策略:
(3)如申请人“真实”申报,监察人员不调查,则申请人有0效用,监察人员有正效用S(S>0);
(4)如申请人“真实”申报,监察人员调查,则申请人与监察人员各有0效用;
即
监察人员
调查(1—PC)
不调查(PC)
申请人
不真实(PS)
(—D,0)
(F,—P)
真实(1—PS)
(0,0)
(0,S)
在这样的模型下,文章中用的箭头法,而我用划线法同样也可以看出是不存在纯粹策略的纳什均衡的。
文章中用完全信息静态模型的分析,其实就像课上讲的小偷和守卫的博弈。
文章中的模型描述可以归纳为:
(1)申请人“不真实”申报,监察人员不调查,则申请人获得基金F(F>0),监察人员有负效用-P(管理部门对监察人员的惩罚P>0);
(2)如申请人“不真实”申报,监察人员调查,则申请人被惩罚有损失-D(管理部门对申请人的惩罚D>0),监察人员有0效用;
当y>(p1v1—p3v1)/(c1—p1c1)时,x=0是进化稳定策略:
所以要使x=0为进化稳定策略,也就是要使申请人最终都会选择“真实”申报,则要控制监察人员的调查概率y,使y>(p1v1—p3v1)/(c1—p1c1)。
然而要进一步考虑到客观的条件,如果要使y最小的情况下,也就是最小的减少调查投入的情况下让申请人不以“不真实”信息申报,而y又是由四个变量共同决定的,即v1、c1、p1、p3,因此对这四个变量展开讨论:y=(p1v1—p3v1)/(c1—p1c1)可化为y=v1(p1—p3)/c1(1—p1)
令申请人的期望得益为0,解得pc*=D/(F+D),1—pc*=F/(F+D),因此检察人员选择不调查与调查的概率为(D/(F+D),F/(F+D))。
由于D和F都是申请人“不真实”申报的得益,所以监察人员的决策实际上只与这两者有关。
设申请人“真实”申报的概率为Ps,则“不真实”申报的概率为1—Ps。因此监察人员的期望得益=(—P)ps+s(1—ps)。监察人员不调查时,最低收益是—P,最高收益是S,两者相连,就为监察人员的期望收益曲线,如下:
真实
(P3V1,C2)
(P1V1,0)
值得解释的是,因为上述假设3,因此在这里监查人员调查出不真实的申请时,效用其实是为0的,如果他调查了真实申请材料,付出了精力与时间等成本,材料又是真实的,效用为负,有C2的损失。
接下来,文章又给出下列条件:
比例
“不真实”信息申报
x
“真实”信息申报
1—x
监察人员调查
文章中给出的条件总结如下:
申请人
检查人员
备注
博弈价值
V1
V2
V1>V2>0
博弈失败损失
C1
C2
—
获得资金的概率
P3
—
—
概率
监察人员调查出造假
P2
监察人员调查不出造价
P1
因此进一步列出申请人与监察人员的博弈:
监察人员
调+C1)—C2,P2(V2+C2)—C2)
(P1V1,0)
所以由动态博弈得出的结论是,一是控制监察人员的调查概率尽可能高,二是在客观条件限制调查概率的情况下要制定加大对申请人的惩罚。这两者都是使申请人进化为“真实”申请的有效措施。
三、可应用范围的扩展思考
对于管理学而言,以上两个模型不仅是可以用于分析本文所提出的基金申报审查中,也可以类似的用在许多有关管理信息申报的双方博弈上,例如人力资源管理招聘模块的简历申报和背景调查,其实原理都是如此。文章的思考与结论也给招聘模块中的简历申报和背景调查提供了很好的规范思路,也就是在完全信息静态博弈模型中应加大对招聘申请材料审核不力的HR,来杜绝长期中的应聘者信息造假,而在有限理性的进化博弈分析中,HR应该尽可能多的使调查率控制在一定范围,如果客观条件不允许,则可以加大对造假的应聘者的惩罚,也可以有效避免信息造假。这样合理的多范围思考的运用,也就能达到举一反三的目的。