心理学的三大测验技术问卷测验、投射测验及情境测验是心理学中齐名的三大测验技术。
问卷技术虽然被普遍使用,但在西方早就遭到批评:“系统歪曲假设”的观点认为它得到的结果是行为的语义相关,并非真实行为本身;“好恶度倾向”观点认为在问卷测验中被试往往不是按主试的要求和真实情况回答。
问卷测验无法解决“装好”、“装病”倾向、随机作答等问题,它普遍适合于西方文化,是否普遍适合于中国文化是个问题。
投射技术因对心理诊断相对不重视而衰退。
情境测验所设计的特定情境只能……在心理学中,问卷测验技术对我们来说最为常见,因为从人格测验到临床心理测验,大都采用问卷技术。
投射测验技术虽然在国外曾经盛极一时,但在国内却仍属鲜见。
情境测验技术是继问卷测验、投射测验之后,伴随着评价中心技术而兴盛起来的新技术,国内现在亦有引进与探索。
如此三大技术,孰优孰劣?尤其值得关注的是,三大技术在中国的应用,是何种现状与局面?本文试作一番评论与探讨。
一、引进西方心理测验的困惑在大陆、香港和台湾,主要的着名的心理测验量表几乎都是从西方引进、修订的。
这种情形在大陆尤甚。
我们的人格评定、智力测验、心理卫生评估等方面的量表几乎全是国外引进修订的。
“量表热”从20世纪80年代直到今日,并未“冷却”多少;研究者修订国外量表的热情高涨;培训班曾经遍及全国;像《韦氏智力测验》这样一些需要保密的重要测验工具甚至出现了盗版。
杨中芳等人曾对社会心理学方面使用量表的情况做过一些调查,发现大陆几家心理学杂志的编辑部都曾提及、呈交的社会心理学论文中,几乎全都是使用问卷调查法来收集资料,其中大多数是使用西方引进的量表;并对台湾出版的《中华心理学刊》1976-1986年间发表的30篇社会心理学的实证研究报告作过统计,发现其中29篇使用问卷测验作为工具。
平均每个研究使用了个量表;所使用的量表中,25%未经任何修订直接翻译于西方量表;42%经过修订;4%是根据西方理论编制的量表;三者共计71%。
()这种大量地引进、修订国外量表,过分地依赖于国外量表的现象,已经引起了批评与反省。
概括有关研究,以下几点是值得深思的:1.西方心理测验的文化背景难以完全适合于中国人:其量表的编制,是对西方人的心理研究的结果。
也就是说,当西方人编制量表时,对变量的选择、解释,是基于西方人的特点。
而中国人与西方人在人格等心理特质上有很大不同,所以,西方的心理测验很难完全适合于中国人。
譬如人格测验,如果完全是基于对中国人的研究,可以断定,所选择的人格变量肯定不会是卡特尔的16种因素(16PF),也不会是高夫的23种因素(CPI)。
2.中国人不适合于做西方人编制的心理测验:杨国枢提出由于中西方文化的不同,中国人在做心理测验时,有着不可忽视的与西方人不同的反应心向或方式。
其一,社会赞许心向;不是按照自己的真实情况,而是按照社会的期望作答;其二,默认心向:不是按照自己的真实情况作答,答“是”或“赞成”的倾向比答“否”或“不赞成”的倾向要强;其三,“中庸”心向:中国人受“中庸之道”的影响,往往倾向于选择折衷的、中间的答案;其四,避免反应:能不回答则尽量不回答。
所以,西方的量表用于中国人时,肯定存在不少问题。
中国被试在做测验时,所面临的是一种矛盾困境。
此外,中国人习惯于向亲朋好友倾诉衷肠,而不习惯于对陌生人、外界、公众披露、评价自己;不真实回答的倾向较大。
中国人有较强的“社会取向”,从众性很强,在问卷中倾向于选择多数人可能回答的答案而不是真正自己的答案。
所有这些,无疑会严重影响到测验结果,难以真正解释中国人的心理和行为。
3.中国被试在接受心理测验时的“外国线索”效应。
杨国枢和彭迈克发现,香港中英文双语训练的学生,在做英文问卷时,比做中文问卷更能与中国文化认同。
他们称此为“民族自我肯定心向”。
但在后来的研究中,又发现中国被试有时显示“民族自我肯定心向”,有时又出现相反的“民族自我妥协心向”,即指在用英文回答问卷时,有时也有向西方价值观靠拢的现象。
在另一个研究中,Bond发现被试在做同一份问卷时,会视题目所牵涉两个文化价值体系的不同而采用不同的标准回答。
表明被试对原量表所属国家的文化愈了解,回答时造成的偏差愈大。
也就是说,中国被试对量表的“外国线索”颇为敏感,并会因此而改变其反应。
所以,一味照搬外国量表,其弊病很多。
4.中国被试接受外国量表的测验,其结果不乏莫名其妙之“谜”。
例如,不少研究业已发现,中国人在测谎题上的得分特别高,有时比西方样本高一倍之多。
难道说中国人要比西方人更会说谎?两大着名人格测验MMPI和EPQ用于中国人样本,都出现这种奇怪结果。
路君约使用MMPI测量台湾样本,发现中国人的测谎分比西方人高很多;而MMPI全国协作组在大陆的测验结果也出现相同现象。
()陈永昌使用EPQ问卷测验香港成人样本,发现测谎分数很高。
龚耀先在全国取样的结果也出现同样情况。
一开始研究者认为,或许中国人社会赞许倾向高,有可能为了获得社会赞许而说谎。
但后来的研究发现,测谎题与其它人格及临床指标的相关也非常高,所以研究者认为,很可能对中国人来说测谎题并不能测到真正的测谎程度,而是另一项人格的或临床的指标。
有意思的是,林邦杰以及林一真与杜淑芬在对台湾的小学生测验时,竟然发现测谎题得分愈高者,自我概念愈好,焦虑程度愈低,老师的评价愈高。
在对自我概念的跨文化研究中,也曾出现同样的现象。
Bond的研究就发现,中国人自我概念得分总是比西方人要低。
White & Chan也发现:中国人自我概念的总分低于美国人,即使在中国人文化价值上较受重视的一些特点上,仍然还是没有西方人高。
[11]难道中国人的自我真的如此低吗?这只能说用西方人编制出的自我量表难以测出真正的中国人的自我,因为中国人的自我本身就与西方人迥异。
以上从四个方面对移植外国量表进行了反省并提出批评。
既然外国的量表是为其本国人所编制,其变量是研究其本国人的结果,而中国人与西方人有着很大的不同,所以量表从内容上说是不能适合于中国人的;我们对这些量表仅作一些语言形式上的修订,用以评估中国人,所得到的结果充其量不过是与西方人作了一个比较而已,很难说可以透彻地解释中国人的心理与行为。
既然外国的量表从回答的形式上来说也不适合于中国人,使用它所得到的结果,必然大有问题,且有诸多奇怪而难以解释的现象出现。
引进外国的量表会有如此多的麻烦与困扰,不能不令我们深思。
二、系统歪曲假设诸说:对问卷测验的批评不独移植西方量表在中国遭到非议,就连问卷测验技术本身,在西方也遭到批评。
美国心理学家凯利曾经有个着名的假设:“人是科学家”。
因此他说:你要想知道人的心理吗?你可以直接去问他。
凯利的论断道出了西方普遍流行的问卷测验的主要思路。
无疑,问卷测验在欧美是心理评估的主要技术手段。
问卷测验技术具有多种优势:(1)可以不受局限地用以评估人的各方面的心理现象与特质;(2)节约时间、人力、经费,可以在集中的时间内获取较多人的资料;(3)可以通过建立常模来进行比较,获取客观化、标准化的推论;等等。
但是,问卷技术仍有不少局限与缺点。
对问卷技术比较尖锐的批评。
他们提出“系统歪曲假设”,认为在人格自陈问卷测验中,对人的行为的评价是基于记忆的,所得到的结果往往是各种行为类别的语义的相关,并非真实行为本身。
也就是说,所测到是一种观念而不是一种真实行为,认为人格问卷测到的特质只能作为人与人相互知觉评判的标准,而知觉评判的准确性是值得怀疑的,很可能这种知觉评判只是一个观念的东西,不是实际的东西。
他们研究了人格问卷评价、观念联想评价与现场实际观察结果三者之间的一致性,发现人格问卷评价与观念联想评价之间普遍有.的高相关,二者与现场实际观察数据间的一致性均低。
结果证实了他们的假设。
[12]此说得到不少人的支持,自然也引起异议。
我们虽然不认为所有的人格问卷测到的全是一种基于记忆的语义,而不是真实的行为本身;但是还是觉得Shweder的批评不无道理:基于记忆的语义评价毕竟不是真实行为本身。
很可能有时或有的人格问卷基于记忆的语义评价与真实行为本身是一致的,而有时或有的人格问卷基于记忆的语义评价与真实行为本身是不一致的。
这至少提醒我们在使用问卷技术时必须小心谨慎。
另一种批评是“好恶度倾向”说。
在关于人物感知的研究中,Lamiell等发现被试在评定人是否具有某些形容词所含的性格特性时,往往就形容词所含的特性的“社会赞许”程度来评定,而不是按主试的要求,就所评价的人本身是否具有这些特性来评定。
[13]显然,这是又一种令人头痛的现象。
杨中芳(1996)认为,这是一种被试最不需要花心思费功夫,即可及时反应出来的回答准则;是被试常用的可以取代伤脑筋的“照实回答”的“挡箭牌”。
值得注意的是,在其它关于人格问卷的因素分析的研究中,亦发现同样的倾向,往往因素分析抽出的第一个因素,就是“好恶度”的人格维度。
在人格评估中,被试使用这样一种策略,即以一种最不需要花心思费功夫,即可及时反应出来的回答来搪塞,而并不是按主试的要求、按真实情况回答,如此“好恶度倾向”多么伤脑筋?我们在实际应用中,也的确发现问卷技术还有其它不少局限。
例如,笔者在80年代开展心理咨询时曾碰到这样一个例子:心理咨询中心第一天第一个来咨询的一位工人,在看到我们给他做的人格问卷时,大为惊讶道:“你这样问我就叫个性测验?这不等于是我告诉了你吗?”甩手而去。
此事令我反省了多年。
的确,问卷技术所获得的心理资料,完全是建构在被试“告诉”的基础上。
如果被试不愿、不能、不好、不便、不好意思“告诉”,那可怎么办?可见:1.问卷测验前提条件是被试能够真实地回答。
在以下情境中它束手无策:无法真实、客观地回答问题的非“科学家”的病人,如精神病人等等;不想真实客观地回答问题的人:如“装好”倾向、“装病”倾向、随机作答等等。
在一些着名的问卷测验中,如EPQ,其L量表无法区分说谎与老于世故;而CPI辨别作伪的变量有时居然将真实回答者也错判,形成“冤案”;笔者曾比较正常场合与应聘场合中使用人格问卷的情况,发现前者废卷率约6%,后者则高达13%左右。
2.普遍适合于西方文化,是否普遍适合于中国文化,这是个问题。
如前所述,中国人倾向于选择折衷的、中间的、不明确的答案:中国人不习惯于对陌生人、对公众、对外界随便坦露自己的心理。
又有,中国人受易经的影响极深,全息、整体、神机妙算的观念根深蒂固。
在中医中,舌头、脉搏的变化能探测到全身的变化。
中国人往往不太相信问卷直接发问得出的结果。
中国人崇尚洞察秋毫、断于未萌之中、决于不言之时、甚至是神秘主义的神机妙算。
所以算命、八卦预测等等,颇有市场。
3.无法评估敏感性的、被试不愿回答的问题。
等等。
直接从国外引进或移植测验量表遭到种种批评。
而问卷技术在中国文化中所遇到的问题,也是不能不深思的。