中国股市中证监会⑴和庄家⑵行为的博弈分析*西北大学应用社会科学系赵铁山[内容提要]本文以“父子博弈”模型为基础,通过对此模型作一定的改变来对我国股市情况作出分析,从而给出我国股市中始终存在大量庄家炒作和操纵行为的原因及治理对策。
本文认为:我国证监会的双重职能导致了股市监管者——证监会在与庄家之间的博弈中产生了纳什均衡(Nash equilibrium),并由此造成了证监会的信用危机,从而进一步刺激了庄家的炒作行为,出现了股市中投机盛行⑶和庄家持续炒作、操纵股市⑷的不正常状态。
针对上述纳什均衡结果,本文建议采取以下治理对策:一、变当前的政府主导型股票市场监管模式为综合型股票市场监管模式。
二、改变股市中的准入制度和建立退出制度。
三、加大当前的监管力度。
[关键词]股市证监会的职能博弈一、父子博弈在分析我国股市情况之前,需先给出博弈论中的一个模型“父子博弈”。
在这一博弈中,我们假设参与者序贯行动,即一方做出行动后,另一方再做出行动,然后每个参与者得到各自的结果,即各自取得一定的效用收益。
同时,参与者在行为中具有完全信息,即每一个参与者的收益函数在所有参与者之间是“共同知识”(common knowledge)。
这一模型的内容表述如下:一家四口。
周末,母亲加班去了。
父亲打算带两个小孩去饭店。
可是两个孩子不停地闹摩擦,打架。
父亲很恼火,对他们说:“不要打架,如果你们再打架,我们就不去饭店吃饭了”。
孩子们知道,当爹的只会下面条,一个星期下来,老吃面条,一家人都吃倒了胃口,早就想去饭店改善一下。
让我们来研究一下,父亲和孩子们会做出什么样的行动?如果孩子们认为父亲说话算数,那么,为了去饭店吃饭,他们会停止打架。
如果孩子们认为父亲只是在吓唬人,说了也不算,那么,他们将不会理会父亲的警告,照打不误。
现在父亲的行动战略为:去饭店吃饭或不去饭店吃饭;子们的行动战略为:打架或不打架。
总共有四种可能的组合。
当然,父亲和孩子们对这四种可能的组合具有不同的偏好序列,且因行为的不同而得到不同的效用收益。
表1如表1所示,我们以数字来表示这些偏好序列和效用收益。
数字越大表示他们越喜欢这种选择,得到的效用收益也越多。
假设,父亲很希望去饭店吃饭,因此,他对去饭店的效用收益为2;他希望孩子们不要打架,对此的效用收益为1;他对孩子们打架的效用收益为0;他对不去饭店的效用收益也为0。
对孩子们来说,他们和父亲一样也希望去饭店,对此的效用收益为2,对不去饭店的效用收益为0。
在是否打架的问题上他们的偏好序列和父亲的略有不同。
要他们不打架比较困难,所以他们不打架的效用收益为0,而打架的效用收益为1。
表1列出了父亲和孩子们在各自不同的行为战略下的效用收益。
*本文写作过程中得到了英国贝尔法斯特大学董志勇博士和西北大学经济管理学院雷晓康博士的大力支持,在此特对他们表示感谢。
孩子们的行为去饭店父亲的行为不去饭店表2表2双变量得益矩阵给出四种可能的组合方式。
把上述的效用收益带入表格之中,在①中表示:全家去饭店和孩子们打架,父亲的效用收益为2,孩子的效用收益为3。
在②中表示:全家去饭店和孩子们不打架,父亲的效用收益为3,孩子们的效用收益为2。
依次类推。
对于父亲来说,②是最佳状态:全家去饭店,孩子们不打架;③是最糟的:全家不去饭店,孩子们打架。
对于孩子们来说,①是最佳状态:全家去饭店,还用不着约束自己;④是最糟的:不打架,还要在家吃面条。
博弈的序贯行动过程是:首先父亲宣布警告,要是孩子们再打架全家就不去饭店吃饭了。
然后,孩子们作出决策,是否约束自己,暂时不打架。
最后父亲再决定是否去饭店。
这一博弈将按下面的程序展开:如果孩子们选择打架(在表格中是第一列),父亲面临去或不去饭店的选择,因为父亲对①的效用收益是2,对③的效用收益是0,所以父亲会选择①,仍然去饭店。
如果孩子们选择不打架(在表格中是第二列),父亲将在②和④之中选择,对于父亲来说,②的效用收益为3,而④的效用收益为1,所以父亲将选择②。
这意味着还是去饭店,既然不论孩子们打架还是不打架,父亲都会决定去饭店,那么对孩子们来说他们的选择实际上是在第一行的①和②之间做一选择。
没有约束比有约束好,所以他们选择打架。
按照上述的假定,博弈过程的最终结果发生在①,即此博弈的均衡解(纳什均衡)为全家去饭店,孩子们打架。
最终,此博弈的行为结果和父亲的最初目的相反。
父亲发出警告的目的是防止孩子们打架,其结果是孩子们选择了打架。
对孩子们来说,打架比不打架要好玩。
父亲的警告完全落空了。
他的话对孩子们是没有信用的。
如果父亲很聪明、理智的话,最好他在一开始就不要作出这样的警告。
为什么孩子们不相信父亲的诺言呢?因为父亲在这场博弈中扮演了双重角色:他要监督孩子们的表现,又拥有自己的切身利益。
双重角色导致父亲在行动中出现了内在逻辑上的冲突,破坏了他的信用基础,结果导致“裁判上场踢球”的现象,所以孩子们并不认真地考虑他的警告。
能不能让父亲的警告生效呢?或者说,能否让父亲在孩子们面前有信用呢?关键在于要把父亲的一部分决策权分离出去,使得父亲的警告必然会被履行。
假定告诉孩子们,妈妈上班时把家里的钱都带走了,如果妈妈在吃饭前接到父亲的电话,说明孩子们在今天没有打架,那么,她会请人把钱送回去。
如果孩子们打架,她会非常生气,绝对不会送钱来。
那样,父子三人就只好在家吃面条了。
如果附加了这样一个条件,上述的博弈会发生什么样的变化呢?当父亲宣布了警告和附加条件以后,孩子们知道,如果他们打架的话,父亲将毫无选择余地,只好呆在家里。
如果他们选择不打架,那么父亲可以在②和④之间选择。
孩子们知道,父亲将带他们去饭店。
对于孩子们来说,他们也情愿选择②(去饭店,不打架)。
他们会尽力避免选择最糟糕的④(不去饭店,不打架)。
孩子们的选择和父母的意愿达成了一致。
现在引进了母亲的作用之后,父亲的信用危机就解决了。
原来由父亲一个人承担的角色分为了两半,父亲并不能完全做主。
一旦孩子们打架,父亲也要受到惩罚,呆在家里吃面条。
如此处理,父亲的权威反而加强了。
结果,孩子们作出了符合父母亲愿望的行动。
中国股市证监会和庄家之间的博弈和“父子博弈”有许多相似之处。
下面我们将上述的“父子博弈”模型中的“父亲”改换为股市的监管者----证监会,把“孩子们”改换为庄家,就可以来分析证监会和庄家之间的博弈行为和博弈的纳什均衡(Nash equilibrium)了。
二、证监会和庄家博弈下面引用“父子博弈”来分析我国股市中投机盛行、市盈率过高⑸的狂炒过热现象和持续不断出现的庄家炒作和操纵股市的现象。
在分析前我们假设:在这一博弈中,我国股市的总体业绩是参与者双方的“共同知识”,博弈双方在行为中是信息完全和对称的,即博弈双方参与者对另一方行动策略空间是完全知晓的。
首先,我国股市监管体制是政府主导型的股市监督管理机构。
对于证监会来说,它是我国股市规则的具体执行和维持者,但是它没有完全独立的决策权力(独立系数约为1/2—2),仍然受到政府行政力量的干预,从而使得股市监管职能依附于政府行政职能。
证监会的目标中包含了政府的行政目标,它在很大程度上按照政府的意愿行为。
由于我国在一开始建立股市时,政府就把股市定位为改造国有企业治理结构和使国有企业脱困的工具。
因此,证监会在政府的意愿下就具有了双重的职能(目标)和任务:①使股市成为一个有效的资金配置场所,保持股市有序、高效地运行,充分保护投资者利益,有效地遏制市场炒作、股市操纵和欺诈等行为,从而使股市有效率地配置资金,为上市公司融资。
这是证监会作为股市监管者原本应有的职能;②为国有企业进行治理结构的改革、效益的提高创造条件,尤其是当前把股市作为为国有企业脱困低成本融资的场所或工具。
这样一来,我国的证监会在股市监管中的行动战略就有了两个:①对股市加强监管,严厉打击庄家的炒作行为,保持股市正常秩序⑹;②对庄家的炒作行为睁一眼闭一眼⑺。
对于庄家来说,根据一项研究,2000年我国股票市场全部上市公司只有800亿人民币的利润,当中分红只有100亿,而印花税和证券公司的佣金就已达900亿,全部的利润还抵不上印花税和证券公司的手续费。
按周其仁教授的测算:考虑到当下股市的全部市值约为5万亿,那么即使印花税和佣金为零,上市公司的利润全部分配给投资人,在这样一个股市上投资,收回本金也要40年以上,因而,庄家获利的唯一途径就是通过对股票的炒作使股票价格上升或下降。
因此,对理性的追求预期利润最大化的庄家来说,在股市中也只有两个行动战略:炒作或不炒作。
现在我们进一步假设证监会的偏好序列:证监会的效用函数是连续函数;证监会对职能②的偏好严格优于对职能①的偏好⑻,即他们从职能②得到的效用收益为U(2),从职能①得到的效用收益为U(1),且U(2)与U(1)成负相关关系,U(2)>U(1),因而证监会的总效用收益U(T)⑼由两部分组成,等于从职能①中获得的效用收益U(1)和职能②中获得的效用收益U(2)的加权平均,即U(T)=μ1U(1)+μ2U(2),且μ2>μ1,μ1+μ2=1;同时,假设庄家的偏好序列:炒作时效用收益为U(C),不炒作时效用收益为U(B),且U(C)>U(B)⑽。
为了简化这一分析,我们取μ1=1/3, μ2=2/3,则证监会的总效用收益函数U(T)=1/3*U(1)+2/3*U(2)。
下面我们具体分析博弈各参与者的收益情况。
当庄家炒作时,如果证监会采取“严厉监管,保持股市正常规则”的行为,也就是偏好执行职能①,弱化职能②的执行,造成股市规则得到执行,实现了证监会原本应有的职能,维护自身的信用和权威,但同时造成上市的国有企业融资困难,难以脱困,即效用收益U(1)的提高必引起效用收益U(2)的降低,且ΔU(2)(下降量)>ΔU(1)(上升量),因为U(2)在总效用收益函数U(T)中所占权数较大,故证监会的总效用收益U(T)下降了,值为1。
对庄家来说,证监会严格的监管行为使他们炒作时只能得到较少的效用收益,U(C)值为3。
当庄家炒作,证监会如采取“睁一眼闭一眼”的行为,它通过牺牲股市的部分规则和自身的信用来在股市中为国有企业的融资脱困创造良好条件,这时,U(1)降低了,但U(2)提高了,且ΔU(2)(上升量)>ΔU(1)(下降量),故证监会总效用收益U(T)提高了,值为3。
庄家因证监会放松了监管,通过炒作效用收益U(C)大大提高了,值为9。
当庄家不炒作时,不论证监会的行为如何,因我国股市的实际赢利情况,庄家只能获得较低的效用收益,U(B)值为1。
同时,当证监会以牺牲在股市中为国有企业脱困融资创造条件为代价,来加强自身的信用时,证监会总效用收益U(T)为2,反之为4。
因此,这一博弈的双变量得益矩阵为表3。
庄家(非零和博弈)炒作不炒作证监会睁一眼闭一眼表3对于证监会来说,最优行为是效用收益为4——(证监会睁一眼闭一眼,庄家不炒作);对庄家来说,最优行为是效用收益为9——(证监会睁一眼闭一眼,庄家炒作)。