当前位置:文档之家› 博弈逻辑中理性人假设的困境与思考

博弈逻辑中理性人假设的困境与思考

2007年第9期(总第200期)学术论坛ACADE M I C F ORUMNO.9,2007(Cu mulatively NO.200)博弈逻辑中理性人假设的困境与思考张 峰 [摘 要]博弈逻辑是近年来兴起的一个逻辑学的新分支。

理性人假设,即所有的参与人都是理性的,是博弈逻辑的基本假定,然而理性人假设在现实中遇到了挑战。

文章对理性人假设面临的困境,包括完全理性假设的困境、个体理性与集体理性的冲突等问题进行分析和评价,从而夯实博弈逻辑的理论基础。

[关键词]博弈逻辑;理性人假设;完全理性;个体理性;集体理性[作者简介]张峰,北京理工大学人文学院教师,哲学博士,北京 100081[中图分类号]B819 [文献标识码]A [文章编号]1004-4434(2007)09-0007-04 博弈逻辑(Ga me Logic)是近年来兴起的一个逻辑学的新分支,是博弈论和逻辑学相交叉的研究领域,属于应用逻辑范畴。

博弈逻辑研究理性的主体互动行动中的推理过程,即研究博弈中的推理问题。

博弈逻辑拓展了逻辑学研究的深度和广度。

理性人假设,即所有的参与人都是理性的,是博弈逻辑的基本假定。

理性人的本质是现实人或社会人。

有学者认为理性人就是使自己的效用最大化的人。

还有不少学者认为,理性人是指有一个很好定义的偏好,在面临给定的约束条件下最大化自己的偏好,就是人们在行为时,不仅要优先考虑自己的需要,而且要兼顾他人的需要和其他给定的约束条件。

在博弈逻辑中理性人是指具有推理、决策能力并通过选择策略使自己的得益或支付(Pay2 off)最大的人。

但是,理性人假设受到了现实的挑战。

在理性人假设的前提下,不仅要求博弈方掌握完全的信息,而且对博弈方的理性提出很高的要求,包括知识水平、计算能力、理解能力、预测能力、相互信任和不会犯错误等各种方面的能力。

然而,要求普通的决策者都具有这样的知识水平和理性能力常常是不切合实际的。

现实中的决策者所面临的决策环境远比研究者讨论的、经过高度抽象简化的博弈环境要复杂得多。

在理论上,理性之间也往往存在冲突,如个体理性与集体理性的矛盾。

理性人假设存在着问题,博弈逻辑又是建立在此基础之上,那么是否博弈逻辑的理性基础隐藏着理论隐患,已经出现了“基础松动”的可能?博弈逻辑的理论大厦是否能够坚实、稳固?这是一个值得深思的问题。

一、完全理性假设的困境在博弈逻辑中,参与人在博弈中如何行动、选择自己的策略,都是经过一番推理后采取的,博弈推理必须要有前提条件。

为此,博弈逻辑给出了“理性人”的假设前提。

在博弈逻辑中,不仅假定了博弈参与人是理性的,而且假定了“所有参与人是理性人”是博弈参与人之间的公共知识,就行为人对现实世界的认识能力而言,这是一条非常严格的假设。

很显然,现实世界这种假设通常是得不到保证的,这正是博弈逻辑所遇到的一个困惑。

博弈逻辑研究的主要问题就是人们在互动行为中的推理问题,就是在人们的利益和行为有直接的相互影响和作用的情况下个体的理性选择与行为。

因此,它不仅要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。

因为,如果人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。

作[基金项目]本文是作者主持的国家社会科学基金青年项目(07CZX018)《博弈逻辑研究》的成果之一。

7为博弈逻辑的基础,交互理性是其基本的理性要求。

这样,在博弈逻辑中,“理性”就不再仅仅是一个个人主义的概念了。

当相关决策者之间的理性层次存在明显差异,或者决策者之间缺乏足够的了解或者相互信任的情况下,要求博弈参与者满足交互理性的要求显然是比较困难的。

在博弈逻辑的研究中,在理性基础方面采用的是一种“完全理性”的假设。

交互理性、理性的共同知识及其所要求的参与者的相互信任等因素是建立在所有博弈参与者都有“完全理性”或“充分理性”的基础之上的。

完全理性不仅要求行为主体始终以自身最大利益为目标,具有在确定和非确定性环境中追求自身利益最大化的判断和决策能力,还要求他们在存在交互作用的博弈环境中具有完美的判断和预测能力;不仅要求人们自身有完美的理性,还要求人们相互信任对方的理性,有理性的公共知识。

这种完全理性假设的现实性明显是有问题的,因为它不仅意味着博弈方绝对不会犯错误,决不会冲动和不理智,即使在复杂的多层次交互推理中也不会糊涂,不会相互对对方的理性、能力、信任和对信任的信任等有任何怀疑和动摇。

但是,在现实中,个人总是受有限理性的制约,如每个人的智能与知识、所掌握的信息都是有限的,很可能并不了解自身利益最大化的目标值究竟是多少,也很可能并不了解实现目标值的最佳策略是什么,在决策时还难免受各种因素影响。

现实中的博弈者往往是有限理性的,人们很少能够一贯地按完全理性原则行动;此外人们在生活中经常受信息不对称、风险偏好不同以及情感、心理、宗教、价值观、道德等因素的影响和制约,而不去追求“合理的”目标,或者目标合适时却无能力选择最佳的策略。

不仅个人的策略选择经常会犯错误,集体决策同样也经常会犯错误。

人类社会频繁发生各种战争冲突、企业选择领导人的盲目性和低效率等,都是人类集体选择决策理性不完全的证据。

因此在博弈分析中,人们理性方面的局限性事实上是无法回避的。

如果不承认这个事实,坚持只是在缺乏现实性基础的完全理性假设下进行博弈分析,不讨论人们的理性局限对博弈分析的影响,博弈逻辑的发展就会不可避免地遇到各种严重的矛盾和困难,就无法对各种社会关系和现象作出科学的分析解释和预测,就会造成理论分析与博弈现实的严重落差,这当然对博弈逻辑的发展是很不利的。

为使理论免受假设非现实性的“伤害”,必须“夯实”博弈逻辑的理性基础。

加强博弈逻辑的现实性基础的根本方法就是以有限理性的博弈方作为博弈分析的基础,引进学习和进化机制作为“补救措施”,研究博弈行为中的推理问题。

“有限理性”(Bounded Rati onality)假说最早由赫伯特・西蒙提出,他认为人的认识是“意欲合理,但只能有限地做到”,主要表达为一个剩余范畴———理性在不能无所不知的前提下将是有限的①。

西蒙认为有限理性可能是由于人类自身神经、生理、语言等方面的限制,信息的不完全性,或者是人类所处环境的复杂性和不确定性。

因此,有限理性条件下的人类行为特征是:(1)经常调整行为目标。

由于行为环境不确定、人们知识和理性能力的增进或价值观念的变化,人们行为的目标会随之改变。

(2)经常性调整实现目标的行为。

随着客观环境的变化与人们认知能力的提高,人们会加深对周围环境的认识,在此基础上,人们会调整实现目标的行为,以便更好地实现目标。

(3)在决策中采用“满意原则”或“次优原则”。

有理性局限的行为主体(博弈过程中的博弈方)称为“有限理性”的博弈方。

有限理性首先意味着博弈方往往不能或不会采用完全理性条件下的最优策略,意味着博弈方之间的策略均衡往往是学习调整的结果而不是一次性选择的结果,而且即使达到了均衡也可能再次偏离。

有限理性理论放宽了参与人理性能力的要求,比较符合实际情况。

这样,博弈逻辑就通过不断学习进步的行为主体的设定修正了完全理性人假设,强调非理性的行为主体是在不断学习过程中逐步达到理性的。

也就是说,在博弈逻辑的研究中,承认个体的非理性行为在现实中是客观存在的,并不否认理性人“偶尔”也会犯错误,理性人的理性选择之手也会“颤抖”。

当然,要求博弈参与者有根据对过去时间的观察和资料积累,进行准确的判断分析并准确地调整策略的能力,也并非人人都能具备。

有限理性有多种情况和层次。

有些博弈方理性程度较高,有些则非常低,有些学习速度很快,有些则很慢。

不同理性层次和学习速度的博弈方学习博弈和调整策略的方式和速度显然会有差异,“学习”和“进化”机制的引进使得博弈论对人的理性要求在一定程度上有所放松。

8①(美)赫伯特. A.西蒙著,杨砾、徐立译.现代决策理论的基石———有限理性说.北京经济学院出版社,1989年,第3-4页。

这样,从理性要求最高的,要求所有博弈参与者都具有通过内省和推理式的纳什均衡分析,一次性同时选择同一纳什均衡的策略,从而实现纳什均衡的“充分理性”;到理性要求相对较低,允许博弈参与者“犯错误”,可以多次选择和改正错误,但必须有“认识错误和改正错误”能力的、通过“学习”和“进化”逐步实现纳什均衡的“有限理性”;博弈逻辑的理性基础便通过理性人概念的弱化而得到了加固。

二、个体理性与集体理性的冲突在社会生活中,理性人追求个体利益最大化必然导致人们相互之间的矛盾与冲突,个体的理性行为往往会产生集体的不合理性行为,出现个体理性与集体理性的冲突。

以“囚徒困境”为例。

有甲、乙两个共同偷窃的小偷被警察抓起来了,为了防止他俩串供或结成攻守同盟,将其分别关押在不同的房间。

囚徒面临这样的“政策”:如果一方“坦白”,供出自己与对方以前所做违法之事,而对方“不坦白”,“坦白”方将无罪释放,对方会被判重刑8年;如果双方都坦白则各被判刑5年;而如果双方均“不坦白”,因警察找不到其他证明他们以前违法的证据,只能对他们的偷窃行为进行惩戒,各判刑1年。

在这个博弈中,每个小偷都有两种可选择的策略:坦白或不坦白。

显然,不管对方选择什么策略,每个小偷的最优策略都是“坦白”。

比如说,如果乙选择坦白,甲选择坦白时被判刑5年,选择不坦白时被判刑8年,因而坦白比抵赖好;如果乙选择不坦白,甲坦白时无罪释放,不坦白时的被判刑1年,因而坦白还是比不坦白好。

就是说,“坦白”是囚徒甲的最优策略。

类似地,“坦白”也是囚徒乙的最优策略。

双方均选择“坦白”的策略组合是纳什均衡①。

“囚徒困境”告诉我们,个体理性和集体理性之间存在矛盾。

两个囚徒决策时都以自己的最大利益为目标,结果是无法实现最大利益甚至较大利益,这是理性的囚徒难以摆脱的困境。

与此类似的是公共地悲剧(Tragedy of Com2 mons)。

1968年英国科学家哈丁(G.Hardin)在美国著名的《科学》杂志上发表了《公用地的悲剧》一文,此文描述了理性地追求最大化利益的个体行为是如何导致公共利益受损的恶果。

哈丁设想古老的英国村庄有一片牧民可以自由放牧的公共用地,每个牧民直接利益大小取决于其放牧的牲畜数量,一旦牧民的放牧数超过草地的承受能力,过度放牧就会导致草地逐渐耗尽,而牲畜因不能得到足够的食物就只能挤少量的奶,倘若更多的牲畜加入到拥挤的草地上,结果便是草地毁坏,牧民无法从放牧中得到更高收益,这时便发生了“公用地悲剧”。

这是一种集体行动的悲剧。

哈定说,人口问题,污染问题以及军备竞赛问题,均具有与此相同的结构。

相关主题