当前位置:文档之家› 论社会中的非理性博弈行为

论社会中的非理性博弈行为

论社会中的非理性博弈行为
学号:141030017 姓名:陈俊
摘要:传统的囚徒困境理论告诉我们,在完全市场信息的条件及有限理性的限定下,通过重复博弈达到合作的局面基本无法实现。

特别是在现今政治、军事、文化冲突下,非利益目标的重要性往往超过了经济利益最大化目标。

由此决定了人们很可能采取一种非理性博弈行为。

因此,本文在认识“囚徒困境”的基础上,结合非理性因素对于现实博弈的影响,试图论证了在非理性博弈中亦能达到重复博弈期望达到的合作的可能性。

关键字:囚徒困境、非理性博弈、合作
一、囚徒困境及社会中的理性与有限理性行为
“囚徒困境”(Prisoners Dilemma)的具体内容如下:两个嫌疑犯作案后被警察逮捕,分别关在不同的屋子里审讯,警察告诉他们,如果两个人都坦白,那么每个人判刑8年;如果两个人都抵赖,每个人判刑1年(或许因为证据不足);如果其中一个人坦白,另一个人抵赖的话,坦白的人释放,抵赖的人判刑10年。

在这个博奕中,纳什均衡是(坦白,坦白),尽管从总体上看,(抵赖,抵赖)是对两个人都有益的结果,但由于不构成纳什均衡,所以不是该博奕的解。

给定B坦白的情况下,A的最优战略选择是坦白,AB最优战略的组合(纳什均衡)却不是总体最优的选择。

有没有可能其中一个人选择抵赖呢?按照人是理性的假设,没有人会积极地这么做,因为如果对方坦白的话,自己就可能被判刑10年,理性的人是不会冒这种风险的。

囚徒困境反映了一个深刻的哲学问题:个人理性和集体理性的矛盾。

在这个博奕中,两个博奕方对对方的可能得益完全知晓,并且各自独立作出策略选择。

每个博奕方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对自己得益的影响,因此他会根据对方两种可能的选择分别考虑自己的最佳策略。

通过运用有限次重复“囚徒困境”博奕的研究结果,我们知道:如果该博奕在后来的时期内不断重复,由于每个博奕方互相知晓对方可能的得益,他们明白即使在最后一轮博奕中,也可能会被对方出卖。

因此,在任何一次重复的博奕中都不存在合作的激励因素。

从头至尾他们都会出卖对方。

博奕双方在决策时
都以自己的最大利益为目标,结果是无法实现最大利益,甚至导致对各方都最不利的结局,这种情况在现实生活中具有相当的普遍性,在市场竞争、环境问题、公共资源开发利用中屡见不鲜。

囚徒困境在经济中最典型的例子就是“竞相杀价”,在某种产品市场容量一定的前提下,A、B企业本可以订立一个协议价格来维护共同的长期利润,
但A会为自己的近期利益儿采取“低价倾销”策略,B也会效仿降价,不遵守事先达成的价格协定,结果使市场过早枯竭,A、B都没有出路了。

但是,如果A
事先获知B的产量和价格这类竞争情报,就可以采取保护措施(如动用反倾销法案,甚至可以“威胁”用更低的价格“报复”),这就能避免“两败俱伤”,形成新的协定。

在“囚徒困境”中我们得到一个重要的结论:即使在纯粹的经济活动中, 由于人类决策的有限理性和追求目标的多元化, 出现偏离利益最大化目
标这种异常行为是完全可能的, 从而自觉和不自觉地产生了一种非理性行为。

二、社会中的非理性博弈行为
在经济学界, 理性博弈(Rationality game)被定义为博弈双方能够按照效
用最大化原则决策, 并能充分考虑已知的公共信息对未来做出无偏的预测。

非理性博弈(Irrationality game)则是偏离了经济利益最大化目标的一种行为决策
方式, 它包括两种情况:第一, 在博弈主体的目标函数中, 非经济目标的重要性超过了经济利益最大化目标;第二, 博弈主体并非主动放弃经济利益最大化目标, 但其决策和行为客观上损害了这一目标的实现, 使经济利益目标达不到现实条
件决定的最优水平[1]。

在双方激烈冲突场合, 特别是在研究政治、军事等一些特殊领域的目标时, 经济利益往往处于一种从属和次要的地位, 政治或军事利益将取代经济利益而
成为决策者的首选目标, 经济学关于“经济人”或“理性人”的假设在残酷的现实中显得苍白无力,因为人们并不追求纯粹的经济利益, 甚至与之背道而驰。

此时, 博弈双方往往表现出一种非理性的特征, 即人们不是追求最大化的经济利益, 而是尽量使对方损失更大, 以达到其目的。

对于冲突双方的这种非理性博弈, 可以从效用理论中得到佐证[2]。

关于非理性的论述, 科斯说过“没有完善的人” ,这可能指人的理性有限性, 也可能指人性恶的一面。

在一些场合, 人们选择长期看来是错误的决策, 不是因
为人们不知道这种决策的后果, 而是为眼前的生存和局部利益宁愿做出这样的选择。

沙哈夫(M .Schaffer)在《利润最大化者是最好的幸存者吗》一文中说, 当存在市场强力时, 就可能有“恶意”行为, 即一个企业可能会放弃对利润最大化的追求, 降低自己的利润甚至威胁到自身生存, 但只要其竞争对手的利润降得更低, 这个“恶意”的企业就有可能生存下来[3]。

换句话说, 竞争可以有这样的逻辑, 即不是努力改进自己, 而是努力损害别人, 只要使自己处于相对优势, 即使这样做会使自己的绝对福利降低。

弗里德曼理论中的“自然选择可以淘汰非利润最大化者的假说” , 只有在完全竞争的条件下才是正确的。

在现实生活中, 一些垄断性行业往往联合起来, 采取集体降价甚至负利润策略, 来阻止新进入者, 从而在将来获取更多的经济利益, 其实, 就是这种“恶意”行为的最好说明。

产生非理性博弈的根源在于人们互动的决定性因素:偏好、机会和感知[4]。

这也与历史学家和政治学家讨论冲突起因的经典结论相一致, 即冲突主要起源于仇恨或根深蒂固的好斗性(偏好), 或者是指望从较弱的牺牲者那里得到好处(机会), 或者由于对竞争对手的动机和能力的错误估计(感知) 。

对“恶意”的偏好, 实际上意味着一方为减少对手的收入将愿意付出一些代价;当社会出现不和谐现象时,非理性的可能性也会大大增加;对于乐观的感知, 即对冲突结果过分乐观的看法, 也将增加非理性发生的几率。

三、正确审视社会中的非理性博弈行为
哈耶克指出, 对经济理性的迷信可能导致经济制度的失败。

世上很多从常理看是非理性的行为,也许会对人类社会的知识做出贡献。

如很多破产企业为成功企业提供了必要的经验, 军备竞赛导致某些民用技术飞速发展。

杨小凯与黄有光已经证明,完全理性的行为在知识不足的情况下, 不一定能通过各种组织实验发现最有效的组织。

因此, 在知识不足的情况下, 某些非理性行为有可能有助于社会发现最有效的组织[5]。

社会对失败企业的经验应该非常重视, 并应给予适当的尊重, 不要简单地将经济理性与成功划上等号。

史密斯(Smith)、怀布尔(Weibull)、雷登博格(Fudenberg)、勒林(Lerine)等人还指出, 个人理性和社会理性是两个不同的概念, 所有个人的个人理性可能产生社会无理性的后果, 而缺乏个人理性的决策的交互作用之演化, 却有可能产生从全社会而言看似理性的后果。

在泽尔腾“颤抖的手”均衡(Trembling-hand perfect equilibrium)
概念中, 在允许所有参与人都可能犯错误时, 这个均衡仍将是每一个参与人的
最优战略组合, 该博弈模型预见了个人非理性策略有可能在均衡中占优[6]。

参考文献
[ 1] 腾威, 樊睿琳.证券市场投资者非理性行为界定[ J] .中国经济评论, 2003 ,(6).
[ 2] 盛洪.经济学精神[ M] .广州:广东经济出版社, 1999 .326.
[ 3] K·阿罗, 等.国防经济学手册[ M] .北京:经济科学出版社, 2001.
[ 4] 杨小凯.杨小凯谈经济[ M] .北京:中国社会科学出版社, 2004 .101 -117 .
[ 5] 梁洪学.“经济人”假定理论的演进与发展[ J] .江汉论坛, 2003,(7).。

相关主题