后悔理论:不确定条件下理性选择的替代理论格拉汉姆・鲁麦斯、罗伯特・萨戈登11、 卡尼曼和特沃斯基的证据 著 瓦奇 译注当前不确定性条件下选择的经济分析,主要建立在几个基本公理之上,冯・诺伊曼和摩根斯坦(1947年),萨维奇(1954)等对这些公理的表述都不尽相同。
这些公理被广泛认为代表不确定条件下理性行为的本质。
然而,众所周知,很多人的行为方式系统违反这些公理。
我们首先从卡尼曼和特沃斯基的论文《前景理论:风险条件下的决策分析》开始,这篇论文提供了这些行为的大量证据。
卡尼曼和特沃斯基提出了一种他们称为前景理论的理论来解释他们的观察。
我们在这里将提出一种比前景理论更简单的替代理论,并且我们相信它更具直觉吸引力。
本文使用下列符号。
第i 个前景记作X i 。
具有概率p 1,…,p n (p 1+…+p n =1)的财富x 1,…,x n 的增加和减少,可以记作(x 1,p 1;…;x n ,p n )。
空结果被剔除,因此前景(x ,p ;0,1-p )简记为(x ,p )。
复合前景,如以其他前景作为结果,可以表示为(X 1,p 1;…,X n ,p n )。
我们使用传统符号>、≥和∽代表严格偏好关系、弱偏好和无差别。
我们规定,对前景X i 和X k ,有X i ≥X k 或者X i ≤X k ;但是,我们通常不要求关系≥可传递。
卡尼曼和特沃斯基的实验将假设的一对前景之间的选择提供给大学的教师和学生群体。
表1列出了他们选择的结果,揭示了三种主要类型的对传统期望效用理论的违反:a)“确定性效应”或“公比效应”,例如,X 5<X 6和X 9>X 10的组合以及X 13<X 14和X 15>X 16的组合。
也有“反向公比效应”,例如,X 7>X 8和X 11<X 12的组合。
b) 原始的“阿莱悖论”或“公共结果效应”,例如,X 1<X 2和X 3>X 4的组合。
c) 两阶段博弈中的“隔离效应”,例如,X 9>X 10和X 17<X 18的组合。
1表1 表1也揭示了“反射效应”,结果符号的改变引起相应模式偏好和风险态度的逆转,例如,X5<X6和X7>X8。
问题14和14'是反射效应的一个实例,可以解释为,冒险保守兼具的一个例子:X19>X20表示愿意参加精算公平彩票提供一个小概率的大奖品;而X21<X22表示愿意采用精算公平保险防止一个小概率的大损失。
我们还注意到一个有趣的混合风险态度。
有时,风险规避与涉及财富增加的问题有关,例如X13<X14,有时与涉及财富减少的问题有关,例如X21<X22。
同样,风险偏好,有时与涉及财富增加的问题有关,例如X15>X16,有时与涉及财富减少的问题有关,例如X7>X8。
冒险保守兼具、反射效应以及混合风险态度,都可被吸收进入传统的期望效用理论,虽然只是在以一些相当武断的假设和令人相当不满意的意义为代价的前提下。
但是,不可能吸收以上所列的(a)、(b)和(c)效应——这里的观察只违反一个或多个传统公理。
然而,在下一节中,我们将概述替代理论的框架,不仅解释反射效应和冒险保守兼具,也预测(a)、(b)和(c)描述的行为。
还有,我们认为,除了是可预测的,这种行为也可以认为是理性的,因此,我们的模型为不确定性条件下的理性选择的另一种理论提供了基础。
2、后悔理论的框架我们假想一个处在如下环境中的个体:可选世界状态为有限的数量n,其中的任何一个都可能发生。
每个世界状态j 的发生概率为P j ,其中0<P j ≤1、P 1+...+P n =1。
这里的概率,或者解释为个人已知的客观概率;或者解释为缺少确定知识的条件下,代表个人对相应状态发生的信仰或信心程度的主观概率。
个体所要做的,是在多个行动之间进行选择。
每一个行动对应一个结果的n 元组,每个世界状态都对应一个结果。
我们把发生第j 个状态的事件中第i 个行动的结果记作x ij 。
结果不考虑财富变化的形式,虽然在应用后悔理论的过程中,我们将x ij 解释为财富的增加或减少——相对于一些任意基准衡量(不需要是个人的当前财富)。
注意,与前景理论不同,这里通过行动将结果与特定的世界状态联系起来。
因此,一些不同的行动可能对应相同的前景。
为了区分这种差异,我们使用符号A 表示行动,X 表示前景。
到目前为止,后悔理论与萨维奇的理论非常相似,除了我们像冯・诺依曼和摩根斯坦那样将概率作为给定。
一个选择问题,可以包含任意数量的有效行动,但我们首先分析,在一对行动中选择的问题。
卡尼曼和特沃斯基的所有证据都是关于在一对前景中选择的行动问题。
在三个或更多行动之间选择引起一些其他问题,我们将在第四节讨论。
我们首先假设,对于任何给定的个体,都有一个非选择效用函数C (.),递增线性变换唯一2函数M (.)为每对有序的非选择效用指数分配一个实数索引。
m k ij 和c ij 之间的差,可以解释为对应欣喜或后悔感觉的效用的增加或减少。
以这种方式规范后悔和欣喜,需要假定个体体验的这些感觉的程度,只依赖于,与“是什么”和“可能本该是什么”这两个结果的非选择效用,而和这些结果的任何其他特性无关。
基于这样的假设,很自然地进一步假设,如果c ij=c kj ,则有m k ij =c ij :如果实际发生的,与可能本该发生的同样快,为每一个可能的结果分配一个实数的效用指数。
“非选择”的意义是,C (x )是结果x 对个体的效用,如果个体没有选择而体验了它。
例如,他可能迫于自然力量得到x ,或者独裁政府将x 强加给他。
因此,——对比于冯・诺依曼-摩根斯坦的效用概念——我们的非选择效用概念独立于选择效用概念定义。
我们的做法在传统意义上是实用的。
我们理解的“非选择效用”本质上是伯努利和马歇尔理解的“效用”——快乐的心理体验关联欲望的满足。
我们相信,可以这样反思、定义效用,因此我们谈论在非选择情况下体验的效用,是有意义的。
现在,假定个体遇到的特定结果,是由于他的选择行动引起的。
假设他在不确定性的情况下在行动A 1和A 2之间选择。
他选择A 1,然后第j 个世界状态发生。
因此,他遇到结果x 1j 。
他现在知道,如果他选择A 2,他会遇到x 2j 。
我们的自我反省建议我们,与结果x 1j 相关的快乐心理体验,在这些情况下,不仅依赖于x 1j 的性质,也依赖于x 2j 的性质。
如果x 2j 是比x 1j 更理想的结果,个体可能后悔:他可能反思,他本来可能会更好,但他没有选择,反思会减少来自x 1j 的快乐。
相反,如果x 1j 是更可取的结果,他可能欣喜:事实证明自己已采取最好的决定,因此产生额外的快乐。
我们猜测很多读者知道这些体验。
例如,比较所得税增加失去£100的感觉,与赛马投注失去£100的感觉。
我们猜测,大多数人会发现后者的体验更痛苦,因为它会激发后悔。
相反,比较收入减税获得£100的体验,与赌注赢得£100的体验。
现在,我们应该猜测,大多数人会发现后者的体验更愉快。
这个后悔概念在某些方面类似于萨维奇(1951)的概念,但后悔理论与他的极小极大后悔准则有很大的不同。
我们通过使用修正效用函数把后悔和欣喜概念纳入后悔理论。
假设一个个体在与行动A k 的偏好对比中选择行动A i ,并发生第j 个世界状态。
实际结果是x ij ,而如果他选择了另一个行动A k ,应该发生x kj 。
我们将C (x ij )记作c ij ,个体的修正效用为m k ij ,则有:mm ii ii kk =MM (cc ii ii ,cc kkii ) (1)。
2乐,则既不后悔也不欣喜。
同样,假设δm k ij/δc kj≤0:可能本该发生的结果越快乐,则越后悔或不高兴。
(我们将个人完全没有遇到后悔或欣喜的可能性包含为限制)。
自然,我们也假设δm k ij/δc ij>0:即,同样,修正效用随着非选择效用增加。
后悔理论假定,个体为了最大化修正效用的数学期望选择可选行动。
我们以行动A k为参照,定义行动A i的期望修正效用E k i:EE ii kk=�pp ii nn ii=1mm ii ii kk(2)。
面对A i和A k之间的选择,个体偏好A i、A k或无差别,根据E k i大于、小于或等于E i k 而定。
可能有人会问,我们为什么假定,人们将最大化修正效用的数学期望?这主要是因为,这个简单假设符合实证证据的含义。
我们不认为,最大化期望修正效用的唯一目标是符合人是理性的结论。
但是,我们相信,这并不是非理性的行为,而且,考虑到我们方法实用主义的承诺,至少存在一个前提,即体验后悔和欣喜的人们,将寻求最大化期望修正效用(在第5部分详细说明)。
注意,在后悔理论中,完全没有感到后悔或快乐的人,将只是最大化期望非选择效用。
后悔理论的这种特别情况对应传统或伯努利式的期望效用理论,将效用解释为一种心理体验。
假定人们最大化期望修正效用就是以非常自然的方式一般化伯努利理论,因为没有遇到欣喜和后悔的个体,被预期,在不确定性条件下做出决定时,可以尝试期望这些感情并考虑他们。
我们现在证明,第一节中的所有实验证据与后悔理论是一致的。
通过采用后悔理论的受限制形式,并且通过实验证据显示,这个特别的限制形式符合函数M(.),我们可以做到这一点。
特别的限制包括关于函数M(.)的简化假设。
我们假定,一个人遇到的后悔或欣喜的程度,只依赖于“是什么”的非选择效用和“可以本该是什么”的非选择效用之间的差异。
这允许我们定义一个后悔-欣喜函数R(.),给非选择效用的每一个可能的递增或递减,分配一个实数索引,记作:mm ii ii kk=cc ii ii+RR(cc ii ii−cc kkii) (3)。
它符合我们对M(.)的假设:R(0)=0和R(.)非递增。
在限定对所有的ξ有R(ξ)=0的情况下,后悔理论将产生与期望效用理论同样的预测。
既然我们要强调两者之间的不同,那么我们将假设R(.)严格递增和三次可微。
现在假设,如同上面一样,个体在行动A i与A k之间选择。
个体将有弱偏好A i≥A k,当且仅当:�pp ii nn ii=1[cc ii ii−cc kkii+RR�cc ii ii−cc kkii�−RR�cc kkii−cc ii ii�]≥0 (4)。
对于所有的ξ,很容易这样定义函数Q(.):QQ(ξξ)=ξξ+RR(ξξ)−RR(−ξξ) (5)。
因此,A i≥A k,当且仅当:�pp ii nn ii=1[QQ�cc ii ii−cc kkii�]≥0 (6)。
Q(.)是符合对称性的增函数:对于所有的ξ,Q(ξ)=-Q(-ξ)。
因此,知道ξ>0时Q(ξ)的值,就知道了对于所有的ξ,Q(ξ)的值。
关于Q(.)的三个可选简化假设,分别为:假设1:Q(.)是线性的,或等价于:对于所有的ξ,R"(ξ)=R"(-ξ)。