经济生活中的博弈论应用摘要:博弈,这个原来只是在学术圈出现的名词,如今已经越来越多地走进了我们的生活。
博弈论是运筹学的一个重要分支,其中,非合作博弈(non- cooperative game)是现代博弈理论中的核心内容和重要基础,下面通过对经典案例囚徒困境和智猪博弈的分析,对纳什均衡相关定义的研究,得到了在经济决策中行为人如何决定最优决策的方法。
在此基础上,以纳什均衡作为理论支撑点,结合得益矩阵分析解决了经济生活中商家价格战的一些实际问题。
关键词:博弈论;均衡点;得益矩阵;纳什均衡目录一.引言 (3)二.博弈论与纳什均衡的主要内容 (3)2.1博弈论的主要思想 (3)2.2博弈论的分类 (4)2.3纳什均衡 (4)2.4 纳什均衡的分类 (4)三.案例分析 (5)3.1 囚徒困境(1950年,图克) (5)3.1.1案例分析 (5)3.1.2案例应用 (6)3.2 智猪博弈(1950年,约翰.纳什) (6)3.1.1 案例分析 (7)3.1.2 案例应用 (7)四.价格战博弈 (8)一.引言近代对于博弈论的研究,开始于策墨咯(Zermelo),波雷尔(Borel)以及冯·诺伊曼(V on·Neumann)。
1928年冯·诺伊曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺伊曼和摩根斯坦共同撰写了时代巨著《博弈论与经济行为》并将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学期的基础和理论体系。
1950-1951,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,以此为博弈论的一般化奠定了坚实的基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼等人的研究也对博弈论的发展起到了不小的推动作用。
二.博弈论与纳什均衡的主要内容2.1博弈论的主要思想书上是这样定义的:博弈是指一些个人或者组织面对一定的环境条件,在一定的规则下同时或者先后一次或者多次从各自允许选择的行为或策略中进行选择并加以实施,进而各自取得相应结果的结果。
现代科学将这种“对策论”、“对局理论”称之为博弈论,主要研究公式化了的激励结构间的相互作用。
从上述定义中可以看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。
1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体)。
2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。
3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。
4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识。
5、得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的事情。
6、均衡是所有参与人的最优策略或行动的组合;均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参与人最终的行动或效用集合。
2.2博弈论的分类博弈的分类方法是多种多样的。
根据参与人的多少,可将博弈分为二人博弈和多人博弈;根据参与人是否合作,可将博弈分为合作博弈和非合作博弈;根据博弈结果的不同,又可分为零和博弈、常和博弈与变和博弈。
较为常用的是合作博弈和非合作博弈。
合作博弈是以单个参与者的可能行动集合为基本元素,而非合作博弈是以参与人群的可能联合行动集合为基本元素。
也就是说,在合作博弈中,博弈中所有参与者都独立行动,不存在有约束力的合作、联合或联盟的关系,而在非合作博弈中,在一些参与者之间存在着有约束力的合作、联合或联盟的关系,并因为这种关系影响到博弈的结局。
合作博弈强调的是团体理性、效率、公正和公平;非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是低效率或无效率的。
20世纪50年代,合作博弈的研究达到鼎盛期,同时开始出现对非合作博弈的研究,此后,博弈论的研究主流逐步转向在非合作博弈领域。
有些人认为非合作博弈模型比合作博弈更“基本”,但有些人认为两者不相上下。
2.3纳什均衡纳什均衡又称为非合作博弈,是博弈论的一个重要术语,以约翰·纳什命名。
在一次博弈的过程中,一方无论另一方如何进行选择策略,都会自己选择某个确定的策略,则该策略被称为支配性策略,如果两个博弈的当事人的策略组合分别构成了支配性策略,则这个组合被定义为纳什均衡。
2.4 纳什均衡的分类非合作博弈(纳什均衡)的分类主要从两个角度进行区分。
一是参与者的行动顺序。
从这个角度博弈可以分为静态博弈和动态博弈。
静态博弈是指参与者同时选择行动或虽非同时但后行动者并不知前行动者采取了何种行动;动态博弈是指参与者的行动有先后顺序且后行动者能够观察到先行动者所选择的行动。
二是参与者掌握的信息水平。
从这个角度,博弈可以分为完全信息博弈和不完全信息博弈。
完全信息指的是每一个参与者对所有其他参与者的特征、战略空间及支付函数有准确的知识;否则就是不完全信息。
三.案例分析3.1 囚徒困境(1950年,图克)案例:A、B两人合伙作案,结果被警察抓了起来,分别被隔离审讯。
在不能互通信息的情形下———也就是不知道对方是坦白还是缄默的前提下,每个嫌疑犯都可以作出自己的选择:或者供出同伙,即与警察合作,从而背叛同伙;或者保持沉默,也就是与同伙合作,而不是与警察合作。
这样会出现以下几种情况:如果两人都不坦白,警察会因证据不足而将两人各判刑1年;如果一人招供而另外一人不招,坦白者作为证人将不会被起诉,另一人将会被重判10年;如果两人都招供,则会因罪名成立各判8年。
这两个嫌疑犯该怎么办呢?是选择合作还是互相背叛?3.1.1案例分析关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。
但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。
这两个人都会有这样一个盘算过程:假如A坦白,B抵赖,B得坐10年监狱,B坦白最多才8年;B要是抵赖,A就可以被释放,而B会坐10年牢。
综合以上几种情况考虑,不管A坦白与否,对B而言都是坦白了划算。
两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。
3.1.2案例应用“囚徒困境”在经济学上应用极为广泛,它能够很好地解释很多经济现象,具有非常重要的经济学意义。
从上述案例可以看出,“囚徒困境”模型是从个人理性的缺失,再导致集体理性的缺失,但是由于集体性质未定,即集体利益的缺失对整个社会影响也是有积极和消极之分的。
当集体利益与社会利益相矛盾时且有损社会整体利益的,此时应该设计制度形成囚徒困境,设法引导博弈的双方走进囚徒困境,防止他们的合作,在我们的生活中,很多行业间的价格与产量的竞争就属于这种情况,比如中石油与中石化,可口可乐与百事可乐,微软与苹果等等。
而他们之间的非合作关系会更加有利于整个社会福利的提高,通过其竞争,不光产品的价格会接近竞争价格,而且也会促进其改进产品质量,提高产品差异化,满足更多人的需求,即提高整个社会福利水平的提高,从而达到帕累托改善,这才是此刻囚徒困境应该发生的作用。
与此相反,当集体利益和社会利益相一致时,就应该设法摆脱囚徒困境,从而形成合作,促进整个社会效率的提高。
在一个集团范围内,集团收益是公共性的,即集团中每一个成员都能公平共同的使用和分享它,不管他是否为之付出了成本。
集团收益的这种性质使集团每个成员都想有坐享其成的私心,除非一个集团中人数很少,或者除非存在其他特殊的管理手段以使个人按照他们的共同利益有组织、理性地会采取行动,实现他们共同的或集团的利益。
3.2 智猪博弈(1950年,约翰·纳什)案例:在猪圈里有两头猪,一头大猪,一头小猪。
猪圈的一边有个踏板,每踩一下踏板需要消耗2个单位的食物能量,而踩下踏板,在远离踏板猪圈的另一边的投食口就会掉落10个单位的食物。
如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。
若是小猪踩动踏板,大猪会在小猪跑到投食口之前吃掉9个单位的食物,小猪只能分得1个单位;若是大猪踩动了踏板,则在大猪跑到投食口之前小猪能吃掉4个单位的食物,大猪能分得6个单位的食物;若是大猪、小猪同时踩动踏板,那么每只猪都需要消耗2个单位的食物;若大猪、小猪同时到达投食口的话,小猪和大猪能吃到的食物单位为3个和7个,那么,两只猪各会采取什么策略?3.1.1 案例分析这个案例中,小猪的选择基本只有一个,就是选择搭便车,在投食口等待食物,理由是在大猪选择行动的前提下,小猪选择等待的话,在大猪返回食槽之前,小猪可得到4个单位食物的纯收益,而大猪到达之后只能得到剩下的6个单位,实得4个单位的食物;而小猪和大猪同时行动的话,则它们同时到达投食口,分别得到1个单位和5个单位的纯收益;在大猪选择等待的前提下,小猪如果行动的话,小猪在返回到达食槽之前,大猪已吃了9个单位的食物,小猪只能吃到剩下的1个单位的食物,则小猪的收入将不抵成本,纯收益为-1单位;如果大猪、小猪也选择等待的话,那么大猪、小猪的收益为零,成本也为零,总之,小猪等待还是要优于行动。
3.1.2 案例应用在企业中,大企业就好比大猪,中小企业就好比是小猪。
踏板可以比作技术创新,能够给企业带来收益。
例如大企业财力雄厚,生产力、资源都超乎其他小企业,能够有更多的能力进行技术创新,推出新产品后既可以迅速占领市场,进而获得高额利润。
而小企业的最优选择就是等待,等大企业技术创新后,跟在大企业后,抢占市场份额,从这种创新中分得一杯羹,获得一部分的利益。
放小一点来说,员工和企业也是一个“智猪博弈”过程,员工就是大猪,员工有两种选择,奋发图强,努力工作或者应付了事,消磨时间。
如果员工努力工作那么企业和员工都受益,如果员工敷衍工作,拿多少工资干多少工活,那么最终会被企业辞退。
员工只有行动才会受益,不行动则不受益或者受损。
而企业可以选择物资奖励,也可以选择说教等待,物资奖励企业必先拿出部分资金作为奖励品,显然收益为负,而等待则不受损,即使辞退员工也可以有人填补空缺,让员工有危机感反而会促进员工的积极性。
所以聪明的员工会选择努力工作,引起领导关注而得到加薪。
当然也不要觉得做“小猪”没有发展。
“智猪博弈”本身就是给竞争中的弱者以等待为最佳策略的启发。
四.价格战博弈价格战博弈,现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。