对策论中的纳什均衡应用
相对于对策论中的其他模型方法,博弈论是一种独特的处于各学科之间的
研究人类决策行为的方法,或者是研究人们在互动情况下所采取的策略,在现
实生活的选择中,我们会经常运用使用博弈去选择策略,无论是自觉的还是无
意识的。
本文主要探讨博弈博弈论中的纳什均衡在对策论中的应用,即在不确
定条件下,人们所冒的风险很大,这种情况选择合适的战略就显得尤为关键和
重要。
1.博弈论中的纳什均衡
以博弈论中,以经济主体人的自利行为以及相应的市场反应作为研究的出
发点,无论是消费者还是生产者,也无论是竞争形势还是垄断形势,基本上是
经济主体人面对市场做出自己的最优决策。
但是我们知道,作为主体人作出决
策时,不但要面对市场,还要面对作为竞争对手的其他经济主体,因此主体人
作出决策的后果,则是主体人自己的决策及竞争对手决策的共同的结果,这就
是博弈,它有一个前提,即理性人的假定。
纳什均衡是一种不确定条件下的博弈,即非合作、不完全信息下的博弈,
又叫做非合作博弈均衡,是博弈论的一个重要术语,因约翰·纳什而得名。
它的定义可以这样理解:假设有n个局中人参与博弈,在给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于、也可能不依赖于
他人的战略),从而使自己利益最大化。
所有局中人策略构成一个策略组合。
纳什均衡指的是这样一种策略组合:这种策略组合由所有参与人最优策略组成,即在给定另人策略的情况下,没有人有足够理由打破这种均衡。
纳什均衡,从
实质上是说是一种非合作博弈状态。
2.纳什均衡及其在对策论中的应用
2.1囚徒困境及其应用
博弈论中一个很著名的例子——囚徒困境,就是一具典型的纳什均衡。
两个小偷在行窃现场附近被抓获并被警方隔离拷问。
每个小偷都必须选择是否坦
白和揭发对方。
如果两个小偷都不坦白,他们都将判刑1年,如果每个小偷都
坦白并揭发对方,他们都将判刑10年,但是,如果一个坦白并揭发对方,而另
一个不坦白,那么与警方合作的小偷将被释放而另一个将判刑20年。
他们的支付矩阵如下:
乙
坦白不坦白
不坦白
运用相对优势策略画线法,可以知道它有两个纳什均衡(10,10)和(1,1)。
但是基于理性的前提假设,两个小偷符合自己利益的选择是坦白即(10,10),而对双方都有利的策略都不坦白而均只判刑1年的状况即(1,1)不会出现。
这就出现了“囚徒困境”,从而造成了个人利益和整体利益的冲突。
囚徒困境是现实生活中许多现象的抽象概括,有着广泛而深刻的意义。
许
多人、乃至许多国家,都曾深陷囚徒困境而无法自拔。
企业之间激烈的价格竞
争就是典型的囚徒困境,任何一个企业都以对方为敌手,只关心自己的利益。
在价格博弈中,如果以对方为敌手,就如同上述两个小偷一样始终认为自己选
择坦白是最佳决策一样,这就促使双方都采取低价策略。
如可口可乐和百事可
乐公司之间的价格竞争、各大航空公司之间的价格战等。
下面我看一个例子:1994年,默多克公司将《纽约邮报》的价格从40美分提高到50美分时,其主要竞争对手《每日新闻》没有跟着提价。
在将《纽约邮报》的价格调回到40美分之生,默多克公司宣布有意向将邮报价格降到25美分,《每日新闻》仍没有做任何响应。
于是,默多克公司将邮报在Saten岛这个试验市场上的价格降到
了25美分,此时其竞争对手《每日新闻》终于明白了对方的策略,将价格提高到50美分,没过多少,默多克公司也将价格重新提高至50美分。
默多克公司
本着“你要了解对方,也让竞争对手了解你”的原则避免了价格战。
由此可知,囚徒困境引起的价格战是可以避免的,想要让公司的策略为竞争对所明了,就
应向竞争对手清楚地表明合作态度,并对背叛行为进行以牙还牙的报复,那么
公司最终将会赢得竞争,而双方都将通过合作而大有收获。
2.2智猪博弈及其在现实中的应用
博弈论中还有个关于子博弈精炼纳什均衡的著名的例子——智猪博弈。
笼子里面
有两只猪,一只比较大,一只比较小。
笼子很长,一头有一个按钮,另一头是饮料的
出口和食槽。
按一下按钮,将有相当于10份的猪食进槽,但是按按钮以后跑到食槽所需要付出的“劳动”加起来要消耗相当于2份的猪食。
问题是按钮和食槽分置于笼子
的两端,按按钮的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
如果大猪先到,大猪吃到9份,小猪只能吃到1份;如果同时到达,大猪吃到7份,
小猪吃到3份;如果小猪先到,小猪可以吃到4份,而大猪吃到6份。
其支付矩阵为:
小猪
按开关等待
大猪等待
对于小猪而言,如果大猪选择按开关,那么其最佳选择是等待,如果大猪
选择等待,其最全选择仍是等待。
这样,无论什么情况小猪都应该选择等待,
因此等待就成为小猪的优势策略。
这种均衡称为重复剔除的优势均衡。
智猪博
弈中可以用在现实生活中,有助于我们降低风险寻找解决途径。
如中小企业很
少花钱去开发新产品,在技术创新市场上,大企业是大猪,其投入大量资金进
行技术创新,开发新产品,而中小企业是小猪,不会进行大规模技术创新,而
是等待大企业的新产品形成新的市场后模仿大企业的产品进行生产和销售,也
就是所谓的小猪搭便车行为。
企业选择做小猪搭便车,可以省去前期研发投入、避免市场销售不理想等
风险。
在某种新产品刚上市,其性能和功用还不为人所熟识的情况下,如果进
行新产品生产的不仅仅是一家企业,还有其他生产能力和销售能力更强的企业,那么,小企业完全没有必要首先投入大量资金做产品宣传,以达到和其他企业
品牌竞争并取得优势的目的。
腾讯公司成立于1988年11月,是目前中国第一、世界第三的互联网公司。
多年来,腾讯公司依托即时通讯工具QQ,实现在线
交流、搜索、娱乐、游戏、购物、支付等几乎所有的互联网服务。
联众是中国
最早做游戏平台的公司,一度占有在线棋牌游戏市场85﹪以上的市场份额,在新浪、搜狐等门户网站亏损缠身的时候,联众是最早实现赢利的中国互联网企业,一时风光无限。
2003年8月,腾讯QQ游戏第一个公开测试版本正式发布上经后很快超越了联众。
在淘宝网推出“招财进宝”业务时,马化腾看到C2C市场的广阔前景,于是推出腾讯拍拍的电子商务业务。
2010年3月初上线的美团网是国内第一家团财网站,创立仅仅4个月,美团网已经能够盈亏平衡。
但令创办人王兴没有想到的是,2010年7月9日,腾讯QQ团购网上线。
腾讯公司的源于其后发惯例——在决定某项新业务何时推出的时候,考虑的是如何半企业自身的学习周期与该产业的生命周期进行协调,形成一个比较稳妥的扩张节奏,保证企业始终在当前业务与未来扩张之间建立一种平衡,是一种明智的小猪行为。
在风险中选择对策,在对策中寻找优势策略、纳什均衡就是我们在生活中经常遇到的,找准优势策略选择合适的博弈策略可以使我们少走弯路,减少不要的风险。
参考文献
[1]徐玖平,胡能知.运筹学——数据﹒模型﹒决策[M].北京:科学出版社,2004 .
[2]王则柯.新编博弈论评话[M].北京:中信出版社,2003.
[3]格兰.走出“囚徒困境” [J].通信企业管理,2003.
[4]阳飞扬.最神奇的博弈定律 [M].北京:新世界出版社,2011.。