第33章 评估结果的逆转

思考,快与慢  作者:丹尼尔·卡尼曼

假设,某人走进了附近的一家便利店,里面恰巧发生了抢劫案,他不幸中弹。你认定他是因中弹而导致右臂残疾。你的任务就是给这起抢劫案中的受害者设定赔偿金额。

此人住所附近有两家商店,其中一家是这个人常去的。请思考以下两种情况:

·抢劫案发生在此人常去的那家商店。

·此人常去的那家商店的店主要去参加一个葬礼,商店不营业,这个人就去了另一家商店,而就在那家商店里,他中弹了。

此人中弹的那家商店是否会对此人的赔偿有影响?

你会通过联合评估对此作出判断,即将两种情况同时考虑在内并进行对比。你可以有自己的一套原则。如果你认为第二种情况会得到更高的赔偿,你就会给这种情况分配更高的美元价值。

大家都会认同这个答案,即在这两种情况下,赔偿金应该相同。赔偿针对的应该是受害者受到的重创伤害,而抢劫案发生的地点对赔偿会有何影响呢?对这两种情况的联合评估会使你对赔偿过程中的相关情况产生同情。对于大多数情况来说,地点不是相关情况中的一个。在其他需要鲜明对比的情况中,思考较慢,且系统2也参与其中。

这两种情况最初是由心理学家戴尔·米勒(Dale Miller)和凯茜·麦克法兰(Cathy McFarland)设计的,他们将这两种情况展示给不同的人看,并请他们作出评估。在他们这一跨学科的实验中,每位受试者都只看到了一种情况,并用金钱来衡量这个人的受害程度。他们发现(你肯定也猜到了)如果受害者受伤的商店是他不常去的那家而不是他常去的那家,他得到的赔偿会更多。人们自然会想“要是他去的是常去的那家店就……”正是这种想法引起了心酸这种与事实相反的感觉。系统1的替代和强度匹配机制将用金钱来表达对某件事的情感反应强度,使得金钱价值有了很大的不同。

两项实验对比鲜明。几乎所有将两种情况放到一起来看(受试者包括在内)的人都同样认为悲痛不是合理的想法这一原则。不幸的是,只有在将两种情况放到一起看时,才能得出这个原则,而现实生活中,这两种情况不可能同时发生。我们通常用受试者组间模式体验生活,在这种模式中,可能会改变你的想法且有鲜明对比的方案并不存在,当然了眼见即为事实。因此,你的道德观不一定能支配你的情感反应,并且从内心角度看,在不同情况下大脑中生成的道德直觉都不是一致的。

抢劫案中单一评估和联合评估的不一致属于判断和抉择中的逆转。偏好逆转(preference reversals)是在19世纪70年代被首次提出来的,此后几年,其他方面的逆转也相继被提出来。

开启经济学与心理学的跨界交流

偏好逆转在心理学家和经济学家间的对话中有着重要的地位。引起注意的逆转是由萨拉。利希滕斯坦和保罗。斯洛维克提出的,他们都是心理学家,在密歇根大学做毕业设计时,他们和阿莫斯是同一届的。他们就赌注的偏好逆转做了项实验,关于此实验,我会做简要说明。

将有36个格的轮盘转两次,你可以在两个赌注中选择一个。

赌注A:11/36的概率赢得160美元,25/36的概率损失15美元。

赌注B:35/36的概率赢得40美元,1/36的概率损失10美元。

你可以在无风险和有风险的赌注间选择:一个几乎肯定会赢,但赢得不多;另一个是赢的概率小,但可以赢一大笔,还有很大可能会输钱。

现在请单独考虑每个赌注:如果你是该赌注的持有者,你最低会以多少钱卖掉它?记住,你不是在和别人讨价还价,你的任务是决定你真的愿意放弃这一赌注时,可以接受的最低价钱是多少。你来尝试一下。你可能会发现,在这项任务中,赢得的钱数尤为突出,你对赌注的评估被锚定在了其价值上。A赌注中支撑这一猜想的结论和卖价都要比B赌注的好。这就是偏好逆转,即人们会选择B而不是A。不过,如果他们只能在其中选一个的话,他们会认为A比B有更高的价值。就像是抢劫案中的那种情况,偏好逆转之所以会发生是因为联合评估将注意力集中到了情况的一个方面上,即A赌注没有B更稳妥,而这点在单一评估中则没那么突出。当选择联合评估时,致使单一评估中产生不同观点判断的特征就会受到克制或认为不相关,这种特征包括第一个例子中走错商店的受害者的悲痛和第二个例子中锚定奖品的心酸。系统1的情绪反应很可能会决定单一评估;而联合评估中出现的对比也常需要更仔细、更需要付出努力的评估,这其中需要系统2的参与。

偏好逆转可在受试者间(within-subject)的实验中得到证实。在这个实验中,受试者对很多商品作出两套定价并从中作出选择。受试者都没有意识到自己选择时的不一致性,而且在面对这种不一致性时,他们的反应很好笑。1968年,萨拉·利希滕斯坦曾采访该实验中的一名受试者,这次采访堪称业界经久不衰的经典。萨拉和这个困惑的受试者(该受试者后来又愿意花一笔钱放弃自己刚选择的赌注,选择自己刚放弃的赌注,而且他多次改变主意)进行了详细的交谈。

理性的经济人当然不易受偏好逆转的影响,因而偏好逆转现象被看成是对理性因素模式以及建立在理性因素模式之上的标准经济理论的一种挑战。这种挑战本可以被忽略,但却没有。就在偏好逆转现象被报道的前几年,有两位知名的经济学家戴维·格雷瑟(David Grether)和查尔斯·普莱特(Charles Plott)在《美国经济评论》上发表了一篇文章,其中就对利希滕斯坦和斯洛维克所描述的现象谈了自己的研究。这也许是实验心理学家第一次作出了引起经济学家关注的发现。对于学术论文来说,

格雷瑟和普莱特的文章简介部分写得有些夸张,他们的意图很明确:“经济学家应该对心理学感兴趣,而且正是在心理学领域中构建起了数据和理论体系。从表面价值的角度来看,数据与偏好理论并不一致,而且会就研究重点生成更多经济学上的含义启示……“该论文指出了心理学研究成果不适用于经济学领域而设计的一系列实验。

格雷瑟和普莱特列出了13种理论来解释最初的发现,并指出了精心设计的、可测试这些理论的实验。他们提出了很多假设,其中一种(当然心理学家会认为这种假设有些做作)是实验的结果本应该是心理学家得出来的!最后只有一种假设经受住了检验:即心理学家是正确的。格雷瑟和普莱特承认,从标准的偏好理论来看,这种假设是最不令人满意的,因为“如此一来,个人选择可依赖作出选择时的环境”,这显然与一致性学说相悖。

你可能会觉得这一惊人结果使得经济学家们的理论基础假设受到了质疑,会引起经济学家的自我反思。但在社会科学领域中,包括心理学和经济学,事情不应该是这样发展的。理论基础应该是强有力的,而且要质疑某一既定的理论,只有一项发现是不够的。事实上,格雷瑟和普莱特那篇直言不讳的文章对认定经济学家(也可能包括格雷瑟和普莱特)的疏忽有着直接的影响。不过,这篇文章却对经济学家们正视心理学的研究起到了促进作用,而且促进了两个学科间的跨界交流。

联合评估引发偏好逆转

“约翰高吗?”如果约翰高5英尺,你的回答就会取决于他的年龄。如果他6岁,他自然是很高;如果他16岁,这个身高就算矮的了。你的系统1会自动检索相关信息,同时,你对高的概念也会随之调整。你还会根据类别来匹配各项参数,比如回答:“在餐馆里吃饭,多少钱的一顿饭可以和约翰的身高相匹配?”你的回答会取决于约翰的年龄,即如果他16岁,这顿饭就比他6岁时更便宜。

但是,请看下面的说法:

约翰6岁,他身高5英尺。

吉姆16岁,他身高5.1英尺。

在单一评估中,由于每个人的参照标准不一样,大家都会觉得约翰很高,而吉姆不高。如果你需要对比,比如“约翰是和吉姆一样高吗”,你会回答不是。这个问题不会引起疑问,也没有模糊不清的地方。不过,在其他情况下,即事物和事件在它们各自的情境中进行比较时,会造成对重要事情的选择不一致。

你不应该形成单一评价和综合评价总是不一致的印象,也不应该认为判断完全是混乱的。我们生活的这个世界有多个范畴,因为我们有标准,例如,6岁的孩子或者桌子。判断和偏好在同一种类中是一致的,但当事物从属于不同的种类时,就是不一致的了。例如以下3个问题的答案:

你喜欢苹果还是桃?

你喜欢牛排还是炖菜?

你喜欢苹果还是牛排?

第一个问题和第二个问题中的事物属于同一个种类,你能立即回答出自己喜欢哪一个。此外,你可以从单一评估(“你有多喜欢苹果”和“你有多喜欢桃子”)中得到自己的喜好评价,因为苹果和桃子都是水果。由于不同的水果是通过相同的标准进行对比的,在单一评估和联合评估中,每种水果都可以直接进行对比,因而也就不存在偏好逆转了。与种类内的问题不同的是,苹果和牛排的对比没有固定的回答。

苹果和牛排与苹果和桃子不同,从本质上讲,它们是不可以相互替换的,它们也不能满足同样的需求。有时你会想吃牛排,有时又想吃苹果,但你很少会在想吃苹果时说吃牛排也一样,或者在想吃牛排时说吃苹果也一样。

假设你收到一封自己信赖的组织发来的电子邮件,要求你对某一事业作出贡献:

很多繁殖海豚的地方都受到了污染的威胁,这导致海豚的数量减少。一个由私人捐献的特殊基金会成立了,并给海豚提供无污染的繁殖区。

这个问题能引发什么样的联想呢?你是否意识到脑中闪现了相关事业的想法和记忆?你很可能会想起保护濒危动物的工程。你的系统1会自动评估其好坏,并对海豚在濒危动物中的排名生成一个大致的印象。海豚要比白釉、蜗牛或鲤鱼这样的动物更惹人喜爱—也就是说海豚比大脑自动进行对比的动物更受欢迎。

你必须要回答的问题不是你是否更喜欢鲤鱼,你需要对此进行美元价值评估。当然,你可以从以往的经验中知道你从没有对这种要求做出过回应。设想你就是对这种要求作出贡献的人。

和其他难题一样,对美元价值的评估可以用替代和强度匹配来解决。美元的问题是很难,但可以通过更简单的问题来回答。因为你喜欢海豚,你很可能会觉得拯救海豚是项善举。下一步(也正是自动进行的一步),你会将你对海豚的喜爱用贡献的大小来表达。你对以前对环境事业作出的贡献大小有意识,这份贡献与对政治或母校足球队的贡献有所不同。你知道对自己来说多大的贡献是份“巨大的贡献”,多大的贡献是“大贡献”或“一般贡献”,又或是“小贡献”。你对不同动物的态度也有所不同(从“非常喜欢”到“一点也不喜欢”)。因此你也能将自己的态度用美元价值来表达,自动从“非常大”到“较大”再到几美元。

在另一种情况下,你接手了另一种诉求:

雇农要在阳光下暴晒多个小时,他们患皮肤癌的概率要比一般人高很多。定期体检可以降低其风险。现要建立一个基金会支持面临患皮肤癌风险的雇农的体检项目。

这是个紧急的问题吗?你在评估紧急事件的时候,这件事属于哪种类别呢?如果你自主地将这件事归为公共卫生问题,你很可能会发现雇农患皮肤癌的风险在这些公共卫生问题中排名不是很靠前—它的排名相对于濒危动物中海豚的排名来说,肯定会靠后。若将皮肤癌问题的相关重要性用美元价值来表示的话,你对其作出的贡献就会比对濒危动物的贡献要小。在实验中,海豚在单一评估中吸引到的贡献量要比雇农吸引到的多。

其次,思考联合评估中的这两个例子。在这两种例子中,是海豚还是雇农应该得到更大的那笔捐款呢?联合评估中关注了单一评估中没有被注意到的一点特征,但其在被发现时,却被认为是有决定性的因素:雇农是人,海豚不是。你当然认识到了这一点,但这点在单一评估中判断时是不相关的。“海豚不是人”这一事实没有引起注意,是因为在脑中被激活的所有事情都具备这一特点。“雇农是人”这一事实没有在脑中浮现是因为所有的公共卫生问题涉及的都是人。单一评估的窄框架使得海豚有更高的强度得分,通过强度匹配,海豚会得到相应更多的捐款。联合评估改变了事情的表述:这一“人Vs.动物”的特点只有在将两者综合在一起看时才会凸显出来。在联合评估中,人们对雇农表现出偏好,并愿意捐献更多,比保护可爱的动物要捐得多。在打赌和抢劫案射杀人的例子中,单一评估和联合评估是不一致的。

芝加哥大学的奚恺元对下面这个同等类型中的偏好逆转例子作出了贡献。被评估的对象是二手音乐词典。

                  词典A     词典B

出版年份          1993      1993

词条数            10 000    20 000

情况              较新      封皮已毁,其他的地方很新

在单一评估时,词典A要更有价值,当然,偏向在联合评估中会改变。其结果正好表明了奚恺元的可评价性假设(evaluability hypothesis),即词条数在单一评估中没有价值,因为数量自身是没有价值的。而在联合评估中,这一点则显然使词典B更具吸引力,而且词条数比封皮状况更重要。

同类案件判罚的力度为何不一样?

我们有理由相信公正的管理在不同领域中受可预测的不一致性的影响。其中的证据部分可从实验中获得,比如对模拟陪审团的研究;部分可从对立法、管理和诉讼模式的观察研究中获得。

在一项实验中,从得克萨斯州的陪审团中挑出了模拟陪审员,并要求他们去评估几起民事案件的惩罚性赔偿。这些案件是两个为一组呈上来的,其中一个案件提出人身赔偿,另一个案件是经济损失。模拟陪审员首先评估了其中一个案件,然后给他们看了同组中的另一个案件,并要求他们进行对比。下面是关于一组案件的总结:

案例1:某个孩子在玩火柴时不小心点着了自己的睡衣,造成中度烧伤。生产这种睡衣的公司没有将这种睡衣制成耐燃的。

案例2:由于某家银行的不慎处理,另一家银行损失了1000万美元。

一半的受试者在将两个案例进行联合评估时,会先评判案例1(用单一评估)。其他的受试者在评估时,会将案件的顺序颠倒过来。在单一评估时,陪审员判给诈骗银行的惩罚性赔偿要比判给烧伤孩子的高,很可能是因为诈骗银行的案例中涉及的金额要大,是个高锚定。

然而综合来看案件时,对受害个体的同情心会比锚定效应占更大的影响比重,因而陪审员判给孩子的赔偿金要比判给诈骗银行的高。平均来看几组这样的案件,联合评估中人身伤害的受害者所得的赔偿是单一评估中得到的赔偿的2倍。只看到孩子烧伤案件的陪审员作出的决定和他们的感觉相匹配。他们不能预测到给那家金融机构的大笔赔偿金会使给孩子的赔偿金显得不够。在联合评估中,关于银行的惩罚性赔偿金仍然锚定在损失上,而给烧伤孩子的赔偿金却有所提升,这其中反映出了陪审员对因疏忽而导致孩子受伤的愤怒。

我们可以看到,理性通常会受到更广泛、更综合的框架的限制,而且联合评估显然比单一评估更广泛。当然,当能控制你所看到的人对你的选择有既定的兴趣时,你应该在联合评估时谨慎些。售货员很快就意识到改变购物环境能影响顾客的偏好。除了故意的改变外,你可以设想判断时用对比的方法(一定会包括系统2)会比单一评估更稳定,单一评估常会反映出系统1的情绪反应强度。我们希望任何想要得出周全判断的机构都能在评估单个案件时,为所作的判断提供更广泛的背景。我从卡斯。桑斯坦那儿了解到评估惩罚性赔偿的陪审员明显未能考虑到其他案例,这让我很惊讶。法律体系和心理学常识不同,法律判决更倾向于单一评估。

在法律体系另一项关于不一致性的研究中,桑斯坦对比了不同美国政府部门实施的行政处罚,包括职业安全与保健管理总署和环境保护局。他总结道:“在范畴内,惩罚似乎是理智的,至少更严重的伤害会受到更严厉的惩罚。对于违背职业安全与保健的行为,最重的惩罚是针对不断的违反行为,其次的惩罚是针对蓄意且严重的违反行为,最轻的惩罚是针对未能保持其良好记录的行为。”然而,如果不同部门惩罚的力度不一样,你也不会感到惊讶,因为不同部门的惩罚反映了其特有的政治和历史,而不是所有地方都关心的公正。工人“严重违反”安全原则最多罚款7 000美元;而违反野生鸟类保育行动可导致最高25 000美元的罚款。每个部门制定的罚款与该部门制定的其他罚款相比都是明智的,但将不同部门的罚款相对比就显得很奇怪了。就像此章中的其他例子那样,只有将两个案例放在一个大框架下时,你才能看出其中的奇怪之处。同种类间的行政处罚系统是具有一致性的,但与其他种类综合在一起来看,却是不一致的。


示例—逆转

“我对英国的热量单位没有什么概念,但在看到空调装置的改变后,我对此就有所了解了。联合评估非常重要。”

“你认为这个演讲非常成功,这是因为你将这个演讲和她的其他演讲作了对比。要是和其他人对比的话,她仍然不怎么样。”

“当你将框架放大时,你就会做出更明智的决策,事实往往如此。”

“当你单独看某件事时,你很容易受系统1的情感反应的支配。”

上一章:第32章 下一章:第34章
网站所有作品均由网友搜集共同更新,仅供读者预览,如果喜欢请购买正版图书!如有侵犯版权,请来信告知,本站立即予以处理。
邮箱:yuedusg@foxmail.com
Copyright@2016-2026 文学吧