我今天讲的是博弈理论,这也是实验研究的一个重要基础。
首先是博弈论的起源,它来自德国冯·诺依曼1928年的文章。
但博弈论的真正开始是冯·诺依曼和摩根斯腾(John von Neumann-Oskar Morgenstern)1944年的著作《博弈论和经济行为》。
先来讲一下什么是博弈论,博弈论是基于目标导向的冲突和合作中交互作用的数学建模和分析方法,即一种数学建模的分析方法。
博弈论研究的情况发生在几个参与者发生目标导向交互作用的时候,交互作用包括冲突、合作或者二者并存。
参与者可以是人,也可以是动物,还可以是人类构成的组织,如企业间的冲突和合作等。
下面,我们需要澄清一些误解,即博弈论不是什么。
为何它不是帮助我们赢得纸牌赌博或者轮盘赌的学问?从长期来讲,你是不会赢得这些人机游戏的,它们不是多个参与者的活动。
博弈论也不是告诉人们如何通过投机在股票市场上致富的理论。
另外,博弈论给你一些基本的思考原则和启示,但也不是帮你赢得下棋或者扑克等复杂游戏的理论。
那么,博弈论对于什么有帮助呢?博弈论是一种提供参与者在交互过程中策略和行动的内在逻辑洞察力的学问,可以应用到人类社会的经济理论、政治理论、军事理论或者生态演化理论中,也可以用于机制设计和成本会计等具体领域。
接下来,我们通过一个例子来说明博弈论的一些基本概念。
这里有三个企业(i =1, 2, 3)互相竞争,处在一种求大于供的市场,x i (x i 的取值区间为0到20)为各个企业的产品供应数量,总供应量x 为三者之和,即x =x 1+x 2+x 3。
当x ≤20时,价格由公式p =20-x 给出,其它情况价格为0。
各个厂商的利润P i 为x i 乘以p 。
这个实验可以以学生为对象参与进行,获得结果后随机分博弈论与实验研究○ (德)莱茵哈德·泽尔滕第一种情况下,三个厂商供应量分别为4、8、6个单位,总量为18,所以价格为2,三个厂商的利润分别为8、16和12。
第一问题是谁表现最出色?是否为厂商2?因为在此次博弈中它的利润比其他两个厂商高。
不过,我们可以看到,在第二种实验情况下,如果它将供应量调整为5,那么价格为5,它的利润便会提升为25。
实际上它犯了一个错误,自己损失了9个利润单位,在这个错误中,它的利润高于其他厂商是因为它对其他厂商的损害大于对自己的损害。
第二个问题是这种情况下应该如何做。
有人讲,每个厂商供应量应该为3,则三个厂商总的最大利润为99,每个厂商利润为33。
那么这是满意的解决方案吗?还不是,如果每个人供应量为3,而第一个厂商如果提供7个而不是3个单位,那么它就得到49的利润,其他人获得21的利润,这是一个很大的诱惑,供应量都为3的情况容易被否决,所以某个厂商如果获悉其他人的供应量为3,那么它就可以在3到7之间进行选择。
也就是每个人都提供三个产量在具有绑定的协议的情况下是可以实现的;但是绑定的协议在这种情况下是很难发生的,在厂商不知道彼此的信息、沟通存在困难的情况下,不会产生相应的结果。
再一个问题是,我们可以如何做。
第五种试验情况下,各个厂商的供应量为5,那么利润都是25,如果一个厂商增加或者减少供应量,它的利润都会减少,如第6或者第7列下所显示的结果。
这时如果任何厂商打破理论提供的选择方案的话,他们采取任何行为都不能改善自己的支付结果。
这种结果就是均衡的概念,均衡就是一种具有如下属性的、通用的理论推荐解,只要其他人按照推荐解行动,那么参与者的任何背离不会产生额外支付。
由此简单例子,我们可以得出一些有启示意义的结论,获得支付最多的参与者不代表他的策略是优秀的,而是他犯了严重的错误,在伤害自己的同时更多地伤害了其他参与者。
也就是一个企业在市场获得更多利润,不是因为它的运作更优秀,而恰恰是犯了错误,结果使得自己受到了损失,也使得其他人受到更多的损失。
理性状态下获得的互利合作(本例子中(3, 3, 3)方案)只有在均衡状况(本例子中(5, 5, 5)方案)下实现。
下面来看另一个例子。
价格双寡头市场的例子,供应商一和供应商二,可以围绕三种价格提供产品,如果两个供应商在相同的价格下供应产品,则平分总利润,如果价格不同,在这个双寡头垄断市场作用的例子中,有两个竞争者,他们可以选择高价格H、中价格M和低价格L,如果他们都选择H,那么总利润10会在他们之间平均分配,也就是每个人得到5。
如果他们都选择M,每个人得到3,如果他们都选择L,每个人得到1,然而,如果一个选择高价格,另一个选择低的价格,那么低价格者将得到全部利润,而高价格者利润为零。
这里有两个均衡,即(M,M)和(L,L)。
在一次性博弈中,(H, H)不是一个均衡,因为如果一个厂商选择H,另一个选择M,那么选择H的厂商什么也得不到,而选择M 的厂商将得到全部利润6,而不是原来的5。
(M,M)是一个均衡,因为如果都选择M,他们都可以得到3的利润,而如果选择L,只能得到2,少于3,如果选择H,将什么也得不到。
选择(L,L)也是一个均衡,都可以得到1的利润,如果他们选择更高的价格,M或者H,他们什么也得不到,因此在一次性博弈中,存在两个均衡,即(M,M)和(L,L)。
1950年,赫伯特·西蒙(Herbert A. Simon)在他的一篇高度数学化的论文中提出,如果博弈是重复进行的,那么情况会和仅仅进行一次性博弈的情况完全不同。
这个简单的例子说明为何如此,我们看一个二阶段的博弈,如表3,每个人都有两次选择,在第一次选择后,他们的选择将被公开,然后进行第二次选择,并且各自获得两个阶段的总支付。
二阶段博弈中存在一个与一次性博弈不同的均衡,在第一个阶段,两个人都选择H,那么他们都得到5的利润,在第二个阶段,如果他们都选择M,则可以得到3的利润,而如果他们进行了其他选择,也就是选择了L,则利润为1,可见,这种情况下,在第一次选择高价格的情况下,他没有背离(M,M)的动机,即背离均衡。
如果厂商在第一阶段就选择背离,那么可以得到6,而在第二阶段只能得到1的利润,总利润为7,比起均衡时的8的利润要少。
所以在这种重复博弈中,合作可以稳定重复博弈中前面阶段的选择,这个例子中即第一阶段的选择,而在多次重复博弈中,也存在类似的情况。
原因是一次性博弈中存在两个均衡,即这个例子中合作可以使得厂商选择(H,H)进行重复博弈,除去最后一个阶段的选择,直到最后阶段具有了结局效应(End Effect),可能选择(M,M)或者(L,L),所以非合作博弈如果在重复进行的情况下会产生合作行为。
这里我们也可以得出一个有意义的启示,即重复博弈和一次性博下面谈谈机制设计,这是一个具体应用的例子。
1994年,首次无线通信频率拍卖在美国进行,那之前的很多年,无线通信频率一直是由一个委员会进行分配的。
他们按照祖父原则(Grandfather Principle)进(下转第16页)有两大类:第一,对于高管来说很难自己发现的相关信息;有一些服务政府已经提供,如经济数据、总体的实际模型建构和未来预测,再如,很少有关于工人技能的信息。
高管意识到需要做很多事情,因为做决定需要用到大量的信息,他希望这些能够得到资助,如可以通过政府服务获取有用信息。
第二,咨询公司提供的外部建议。
但不能确定这个论点是否合乎逻辑。
有人可能也会问,咨询公司给出的建议是否总是很好,但其中很多看起来很好。
那么这意味着什么呢?并不是说政府应该资助咨询公司的工作,但原则上来说,可以通过重新规定高管薪酬的基础而不是直接以利润为基础。
应该利用津贴来获取外部建议,支付所有来源的信息。
这种做法应该得到鼓励,而高管更应该这样做。
可能有人还会想到其它方式来把此应用到提高薪酬福利上。
七、薪酬给多少?本文最后要谈一谈人们都感兴趣、但却迷惑的一些事情。
人们很难避免这样一种印象,即在很多国家,高管的薪酬过高(从持股人的角度来看太高了)。
尤其是在美国,高管的薪酬水平足可以引起很大争议,并没有充分的客观理由来解释这一现象,在英国也是一样。
可能持股人、董事们变得更加聪明,了解了应该做的事,认识到了他们哪些应该多支付。
但有一个原因是,高管过去的业绩可能会错误地预测未来业绩。
如果某人曾在一家公司成功地大幅度提高了公司利润,另一家公司很自然地想付给他高额薪酬以便雇佣他到自己的公司里来。
公司业绩的变化很大程度上也要依靠运气,这样就可以理解前面的现象了。
但另一个原因是,董事们在设定或协商薪酬时,可能没有正确的激励机制。
因此在很多国家,包括中国,都转向确保决定高管薪酬的董事会成员应该独立于高管层。
这也就是说,他们自己不应该是其它公司的高管,或者有其它一些能够引起高收入的来源。
人们怎样来保证董事们进行的关键而重大的决定是符合持股人总体利益的呢?这也是公司治理的一个热门问题。
很明显,在这个领域,政府能够起主要作用,我们将拭目以待。
本文根据莫里斯教授在2005年11月8日第三届公司治理国际研讨会上的主题发言翻译整理,由李建标、贾荣鹏译。
译成中文时,得到了莫里斯教授夫人(中文名字白霞)的指导,特别感谢行分配,使得哪些资源更多在委员会成员之间进行分配。
为了公平也引入了抽彩票的方式,每个人都有申请购买的权利,可是得到资源和机会的人往往会马上转手高价倒卖给那些无法得到频率的企业,很快赚了很多钱。
这时政府认为,为何不进行拍卖,自己拿到那些钱呢?可是拍卖程序的设计和组织就成了问题,如果将频率资源简单的一个一个拍卖,会有问题,因为人们会希望拿到一个一揽子的频率组合。
美国联邦通信委员会(FCC)第一项拍卖的是窄带无线个人通信服务频率,这是BP机用的频率,比如医生会用到BP机,以便病人可以找到他。
在曼哈顿、新泽西和纽约等地需要的频率资源组合是不同的。
如果进行单项拍卖,一个企业在获得一项拍卖后,不清楚是否能得到后面的标的,这样就缺乏效率。
于是实施了一种同时多轮拍卖,每个人都必须出价,标的由出价最高的获得。
每一个竞标者每一轮都可以对于他想要的标的频率进行出价,要经过多轮出价,最后每一频率由出价最高的竞标者获得,因此,你可以随时看到你关心的组合中每一个频率的价格以决定是否继续出价,每个竞标者也不能等待太长时间进行投标。
当时专家预计会得到5000万美元的拍卖额,而实际获得61700万美元,开始新竞买者很多,然后很快减少,并伴随竞价轮次的增加稳定下降,经过40多轮后趋于停止,竞价收入则不断上升,一直到61700万美元,拍卖进行了三个多小时。
为了说明在这种拍卖中如何做和如何组织,你需要博弈论的知识,但博弈论还不够,也需要实验研究,因为理论上人们总是有限理性的,人们在经济环境中的行为并不总是严格按照理论预测进行的,你还要通过实验研究观察人们在这种环境中是如何真正行为的,博弈分析是重要的、必要的,但不能提供人们想得到的所有答案。