测试胜任能力而非“智力”翻译人:池锦瑾人力1002班如果一个人会运用美国传统的评价标准——大小、影响力、盈利能力来判断成功,那么这项测试运动在美国就取得了成功。
智力和能力测试被应用于包括学校、学院和雇主在内的任何领域。
在学校不用考试分数来记录学生是一项落后的标志。
教育考试服务社独自雇佣了大约2000人,每年给在学院中有上进心的人进行学习能力测验,支出了一大笔钱去支持一项大型的基础研究操作。
这个测验对于年轻人的生活具有巨大的影响力,它可以判定他们中的一些人在学习上是合格的,另外一部分是不合格的。
这个测试成为了一个非常有效的方法用于筛选黑人、西班牙语裔和其他少数申请大学的人,直到出台了最新的“免责条款”(在一些人的反对之下)。
在发放录取通知时除了测试成绩,还要将学生的其他素质考虑在内,招生人员反对这样做。
但是Wing和Wallach等(1971)严谨的研究已经发现只通过测试成绩决定是否录取的方法只在一个非常有限的程度上是正确的。
为什么智力和能力测试拥有如此之大的权力?用什么来证明使用这种测试方法来挑选大学申请者或应聘者是正当的呢?这项运动的成功是基于何种假设?在我们继续盲目的推广使用这项测试,作为掌握许多美国人生存权力的工具之前,这项测试应当受到仔细的检验。
很明显,关键点在于智力测试是否具有有效性。
除非它是正确有效的,否则它的应用是不正当的。
而且我坚信不可能有压倒性的证据证明它的有效性,虽然大多数人不假思索的认为它是有效的。
事实上,对于测试者给出的测试结果,我们选择直接相信它,而没有屈服于强烈的怀疑感,比如,最新的尝试显示ESP的存在。
我的目标是怀疑地检查用于证明智力和能力测试正确性的主要证据,而且从检查回顾中得出一些推论,作为新的条目将来运用到测试中。
让我们一开始就要同意脑部受损和智力迟钝的人在智力测试上没有其他人做的好。
Wechsler(1958)最早用这项标准来验证他的工具,虽然这个有一项非常明显的缺点:脑补受损的人几乎在任何测试中都做不好,所以这很难证明就是“缺乏智力”才导致较低的测试分数。
这里并没有运用多重方法、多重品质标准。
测试预测学校的成绩人们在能力测试中做的游戏类似于老师在课堂上要求做的。
事实上,许多Binet最初的测试都是从法国学校老师的练习中借鉴过来的。
所以能力测试的分数与学校成绩高度相关一点也不令人吃惊。
整个学习能力测验运动极大程度上依靠这个不可否认的事实。
智力测试的支持者,比如McNemar(1964),经常暗示这是唯一的一种必要有效性。
McNemar 评论道“心理公司的差别能力测验手册包含一个令人吃惊的总数为4096的效度系数,是的,我统计过他们。
”女士们和先生们,你们还想问什么?直到我亲自看了那本手册(McNemar当然没有启发我)我才证实了我的怀疑,就是几乎每个效度系数都涉及预测课程成绩——换句话说,在相似类型测试中的表现。
那么成绩呢?作为预测因子他们的有效性是多少呢?事实上研究者在证明学校成绩与其它行为重要性之间关联性遇到了困难,除了在能力测试中表现良好。
但是普通大众,包括许多心理学家和大学官员,只是一直无法相信或接受这个事实。
在课堂上表现良好的人,在生活中依然做的很好,这对于教育工作者似乎是不证自明的。
虽然反对这项观点的证据在一段时间内不断地积累,但他们完全的无视了。
在20世纪50年代早期,一个由我担任主席的社会科学研究委员会研究了这个问题,并且得出结论:虽然达到成绩水平看起来与人生成功的未来措施有关,但是成绩上的表现与此(未来成功)关联性很小。
换言之,高中毕业或大学毕业给了人们去寻找更高水平工作的凭证,但是在高中成绩差的学生和顶尖的学生在生活中做的一样好。
作为一名大学老师,我发现这很难接受,直到我做了一个简单的检验。
20世纪40年代后期,在我所任教的Wesleyan大学,我从一个班级中挑选了前8名顶尖学生(成绩都是A),和8名几乎都达不到平均水平的差生(只得到C等级或更低),然后对比他们在20世纪60年代早期从事的工作。
令我吃惊的是,15到18年之后,我根本不能区分这两组人。
在这两组中都有律师、医生、科学研究者和高中大学老师。
我观察到的唯一区别就是成绩好的同学进入了好的法律或医学院校,学习成绩差的同学一开始就进入二流的法律和医学院校就很满意了。
但是即使拥有如此的优势,成绩好的人与成绩差的相比依然没有更显著的成功。
毫无疑问,在今天C等的学生在严格的招生测试标准之下甚至不可能进入二流的法律医学院校,这对于社会有利吗?这个结果已经被英国(Hudson,1960)和美国的许多研究者(cf.Hoyt,1965)仔细地记录下来了。
Berg(1970),在一本名为《教育和就业重大的训练掠夺》的书中总结研究发现,不管是工厂工人还是银行行员或者空中交通指挥员在职业上是否成功与受教育程度和学校成绩均无关。
Taylor、Smith和Ghiselin(1963)指出,甚至那些像科学研究者一样的高智力工作,优秀的在职表现也与突出的大学成绩无关。
在研究成功中,排名前三的大学平均成绩是2.73(大约是B-),而最后三名是2.69(也是B-)。
这项事实已经知道很长一段时间了。
非常明显,测试运动使得保持一个神话般的精英管理社会面临着严重的危险。
精英管理社会就是关于小圈子之外的任何措施,没有任何有价值的措施具有显著的可论证的正确性。
心理学家经常开玩笑说智力就是智力测试衡量出来的东西。
如此接近全部事实或者只有真相看起来很不舒服,但是当公众比我们自己更加认真,并且用这项测试去筛选获得教育和高地位工作机会的人们,这岂不是很有趣?这些智力测试游戏为什么被称之为卓越?更进一步的说,为什么对于已经在这些游戏中做的很好的人还要保持良好的教育呢?这实际上就是大学正在做的,当他们从申请者当中挑选出有高SAT分数的人。
这是不是就像我们去教那些本来打网球就很棒的人?有人认为教育的目的恰恰是提高那些原来表现的不够好的人的能力。
所以当心理学家依据SAT来判断谁最有可能在大学期间表现优秀,他们就是在含蓄地建议这些人就是录取的“最佳结果”。
但是从另一方面说,如果大学致力于证明他们能更好的培育人才,那高分的学生就是最差的结果,因为他们的提高空间很小。
可以肯定的是,老师喜欢课程成绩优秀的学生,但是社会允许老师去决定谁值得接受教育吗,尤其是当老师感兴趣的表现与其它任何类型生活表现具有非常小的关系时?智力测试开发能力可以保证工作的成功吗?大多数心理学家认为可以;当然普通大众也如此认为(Cronbach,1970,p.300),但是比起有人认为它应该能证明这样的信心,证据更加令人不满意。
例如Thorndike和Hagen(1959)调查了超过10000个调查对象,获取了12000个能力测试分数和许多种后来职业成功方法之间的相互关系,得出了一个结论,即显著的相互关系的数量并不会超过偶然的预期。
换言之,这些测试是无效的。
但是心理学家继续使用它们,相信低效度一定是受到了职业不接受低分的人这一定程度上的限制。
但是即使在这里,在这个领域中,进入所需的特征对于成功实际上是否重要依然不清晰。
有人可能认为手指灵巧度是成为牙医的关键,而且要进入这一领域的话还需要一个最低的测试分数。
但是Thorndike 和Hagen(1969)发现这些与牙医的收入负相关。
Holland和Richard(1965)以及Elton和Shevel(1969)揭示了学生在大学学习能力倾向的分数与他们在社会领导力、艺术、科学、音乐、写作、演讲和戏剧上的实际成就之间不存在一贯的关系。
我们从Ghiselli’s(1966,p.121)的结论中了解到什么呢?他的结论是基于一项研究50年的综述,即在所有类型的工作中,一般智力测试与可训练性的相关系数是0.42,与能力的相关系数是0.23,这些相关系数是根据超过10000个案例得出的。
心理学家相信智力测试是有效的预测工作成功的预测因子,这不足为奇。
不幸的是,评价Ghisellli’s的结论是不可能的,因为他没有引用来源,也没有陈述清楚他的每个相互性的能力是如何测量的。
我们可以从他的结果中得出一些结论,而且我们可以做出一个很好地预测,即工作能力是通过主管的评级或者通过例如主管对于营业额、晋升、工资增长等意见的间接指标来测量。
通过观察非常有趣的是,在更高地位的工作中智力测试和能力之间的相关性高于在较低地位的工作中(Ghiselli,1966,pp.34,78)。
考虑到这样一个事实:作为推销商品的推销员和律师,智力测试的分数与能力之间的相关系数是-0.08,而作为股票债券推销员相关系数是0.45。
这应该成为一个理解智力测试的有力线索,但是很多观察者忽略了它或者简单的认为成为股票债券推销员比游说者需要更多的通用能力。
但是这两种工作在社会地位、语言、腔调、服饰、礼仪以及教育和家庭这些工作成功所必需的因素之间的联系也有所不同。
验证能力测试的许多工作能力措施基本问题是它们很大程度上要依赖人们带给这份工作的证书——习惯、价值观、口音、利益等等——这意味着他对于管理人员和客户是可接受的。
就我们所知,社会阶级背景也有助于在能力测试中取得高分(Nuttall&Fozard,1970)以及获得成功所需的个人证书,智力测试的分数和工作成功之间的联系经常是人为造成的,他们之间的联系与阶级成分有关。
雇主有权利去选择上了合适学校的债券推销员,因为他们做的更好,但是心理学家没有权利去争论这是因为他们的智力让他们在工作中更有能力。
我们知道相关性不等于因果关系,但是我们可以忽略它。
太多的心理学家仍然为高声誉或低声誉的工作报告平均能力测试分数,错误的推断出从事高水平的工作比低水平的工作更需要这种类型的大脑。
例如,Jensen(1972)最近写到:IQ可以告诉我们任何事情的现实意义吗?它和我们通常所认为的心智能力常识性的概念有关联吗,因为我们认为它和教育与职业表现有关?是的,的确是,毫无疑问……9或10岁之后的IQ还预测最终成人职业地位,这与预测学术表现具有一样高的程度……一项职业中人们的平均IQ与职业的平均收入水平、普通公众给予的声望有非常近的联系[p.9] 当然,他留下了这样一个印象:导致平均IQ分数和工作威望存在联系的就是我们通常所认为的心智能力。
但是这项联系可以合理的理解为,为了获得从事高地位职业所要求词汇和其他习惯需要更多的拉力和机会。
试图将导致工作成功中证书的因素和能力的因素区分开的研究非常少。
Ghiselli(1966)直接没有考虑工作能力的标准对验证测试意味着什么。
比如,他研究发现警察和侦探智力测试分数与能力之间的相关系数是0.27(p.83),至于警察的表现是如何衡量的这一关键问题并没有加以关注。