韦克斯勒智力量表美国心理学家韦克斯勒在多年的临床实践中发现,将斯坦福-比内智力量表用于评估成人的智力有不少缺陷。首先,斯坦福-比内智力量表的题目是专门为儿童设计的,对成人来说过于简单,不能引起成人的兴趣;其次,用比率智商表示成人的智力不够准确。另外,常模资料来自学校儿童,参照这样的常模来评估成人的智力也不太合适。于是,他从1934年开始致力于成人智力测验的研制工作,1939年他发表了韦克斯勒-贝尔韦量表I型(Wechsler-Bellevue Scale FormI,W-BI),这是世界上第一个成人智力量表。几年后,他又编制了该量表的一个复本,称为W-BII。随后,他将这两个量表修订成适合于更小和更大年龄的受测者。几十年来,他陆续发表了一系列韦克斯勒智力量表,如今这些量表已成为世界上应用范围最广的智力量表。(一)韦克斯勒智力量表系列版本概述韦克斯勒智力量表包括成人量表、儿童量表、学龄前和学龄初期儿童量表以及一系列修订本。1.韦克斯勒成人智力量表 1955年,韦克斯勒将W-BI修订为韦克斯勒成人智力量表(Wechsler AdultIntelligence Scale,WAIS),适用于16-75岁以上的成人。1981年,韦克斯勒发表了WAIS的修订本(WAIS-R),适用于16-74岁的成人。后来,在WAIS-R的基础上对成人智力量表再次做了修订,于1997年出版了韦克斯勒成人智力量表第三版(WAIS-III),适用于16-89岁的成人。我国湖南医学院的龚耀先教授也对WAIS-R进行了修订,于1982年发表了韦氏成人智力量表中国修订本(WAIS-RC)。从W-BⅠ到WAIS-Ⅲ,这四套量表的组成结构非常相似,都由言语量表和操作量表两部分组成,其中言语量表包括常识、理解、算术、类同、数字广度、词汇等几个分测验,操作量表包括填图、图片排列、拼图、积木、译码等分测验(表8-3)。WAIS-III中的分测验数目略有增加,言语量表增加了一个字母-数字顺序分测验,操作量表增加了符号搜索和矩阵推理两个分测验。2.韦克斯勒儿童智力量表 1949年,韦克斯勒发表了一套儿童智力量表,称为韦克斯勒儿童智力量表(Wechsler Intelligence Scale for Children,WISC)。这套量表是在W-BII的基础上编制而成的,适用于5-15岁11个月的儿童。1974年,发表了儿童智力量表的修订版(WISC-R),适用于6-16岁11个月的儿童。1991年,发表了韦克斯勒儿童智力量表的第三版(WISC-III),也是适用于6-16岁11个月的儿童。我国的林传鼎和张厚粲教授对WISC-R进行了修订,于1986年发表了韦氏儿童智力量表中国修订本(WISC-CR)。有关这几套量表的内容及修订情况将在稍后详述。3.学龄前和学龄初期儿童智力量表 1967年,韦克斯勒发表了学龄前和学龄初期儿童智力量表(Wechsler Preschool and Primary Scaleof Intelligence,WPPSI),该量表适用于4-6岁半的幼儿。1989年,韦克斯勒对WPPSI 做了一次修订,将适用年龄范围扩大到3-7岁3个月,这个修订本简称WPPSI-R。我国湖南医学院的龚耀先教授对WPPSI进行了修订,1986年将修订本以中国修订韦氏幼儿智力量表(C-WYC SI)的名称对外发表。WPPSI、WPPSI-R的结构与韦克斯勒成人智力量表十分相似,也由言语量表和操作量表两部分组成。在言语量表中,同样有常识、理解、算术、类同、词汇这五个分测验,不过,都用语句分测验取代了数字广度分测验。在操作量表中,WPPSI也有填图、积木这两个分测验,不过,另外三个分测验是迷津、动物房子和几何图形;WPPSI-R也有填图、积木这两个分测验,另外四个分测验是拼图、矩阵推理、几何图形和动物木钉。(二)韦克斯勒儿童智力量表修订版1.WISC-R 和韦克斯勒的其他智力量表一样,WISC-R也由言语量表和操作量表两部分组成。言语量表包括常识、理解、算术、类同、词汇、数字广度6个分测验,其中数字广度是备用的分测验;操作量表包括填图、图片排列、拼图、积木、译码、迷津6个分测验,迷津也是备用的分测验。这两个备用分测验一般只在同一量表的某个分测验失效时才替代使用。下面是一些有关WISC-R的测量性能的数据:(1)常模团体的抽样 WISC-R的常模团体是用分层随机抽样方法确定的。分层变量包括地域、居住地(城市或农村)、户主职业、种族等。各部分的人数比率基本符合1970年美国人口普查的资料。从6岁半到16岁半共分成11组,每一组抽取男女儿童各100名,总共有2200名受测者。(2)信度在WISC-R的手册中报告了分测验、言语量表、操作量表和全量表的分半信度系数和再测信度系数。对11个年龄组分别计算言语量表、操作量表和全量表的分半信度系数,所得的均值为0.94,0.90和0.96;以一个月为间隔,用三个年龄组(6.5-7.5岁、10.5-11.5岁、14.5-15.5岁)的数据计算言语量表、操作量表和全量表的再测信度系数,所得的均值为0.93,0.90和0.95。分测验的分半信度系数的均值分布在0.70-0.86之间,再测信度系数的均值在0.65-0.88之间。(3)效度将分测验分数、言语IQ、操作IQ和全量表IQ分别与斯坦福-比内智力量表IQ计算相关,在不同的年龄组中用全量表IQ获得的平均相关为0.73,用言语IQ和操作IQ获得的平均相关为0.71和0.60,各分测验的平均相关分布在0.26-0.69之间,其中词汇分测验最高,译码分测验最低。另外,一些研究者对WISC-R做了因素分析,结果表明,在不同年龄水平的受测者群体中都能识别出三个因素,即言语理解(verbalcomprehension)、知觉组织(perceptualorganization)和抗分心能力(freedomfromdistractibility)。评价:与早先的版本相比,WISC-R无论在常模团体的抽样上,还是在信度和效度上都有了较大的改进。不过,有些分测验的稳定性偏低,该量表对智力极高者和极低者的打分有趋中倾向。2.WISC-CR 1979年,林传鼎、张厚粲等人将韦克斯勒儿童智力量表翻译成中文,并组织全国22家协作单位对该量表的部分题目内容、图像、指导语及施测方法等进行修订,最后,根据由全国11个省市的2237名受测者组成的代表性样本的测试数据制定了常模。WISC-CR的适用年龄范围是6-16岁。各分测验的题目构成及所测量的主要方面如下:(1)常识由30道简答题组成。例如,第5题是“一星期有几天?”题目所涉及的范围极广,包括历史、地理、物理、化学等。不过,大多数为儿童在日常学习和生活中经常遇到的问题。每答对一题给1分,答错记0分,最高分为30分。这个分测验主要测量常识性知识的广度,分数高低反映了个人的言语理解、长时记忆、课外阅读、兴趣、在校学习情况,以及家庭文化背景等。(2)填图由26张图片组成,要求受测者在规定的时间内指出图片中缺失的某个重要部分。例如第2题,要求受测者指出图片中的狐狸缺少了什么(图8-6)。每答对一题给1分,最高分为26分。该分测验主要测量视觉再认和辨别能力、知觉组织、区分基本要素与非基本要素的能力,以及在有时间压力的情况下完成任务的能力。(3)类同由17对名词组成,例如,第1题是“蜡烛-电灯”,要求受测者回答二者有什么相象的地方。前4题,每答对一题给1分,后13题,根据受测者的抽象概括水平给0、1或2分,最高分数为30分。这个分测验主要测量抽象思维能力、概念形成、言语理解和表达、区分基本要素与非基本要素的能力等。此外,分数高低还与个人兴趣、课外阅读等情况有关。(4)图片排列由13套图片组成,其中有一套图片用于练习。每套包含3-5张图片,均有一定的情节,以打乱的顺序呈现给受测者,要求受测者在规定的时间内重新排列顺序,以组成一个合乎常理的故事。前4题以0、1或2记分,后8题以0、2、3、4或5记分,最高分数为48分。这个分测验主要测量理解常规的能力、时间概念、知觉组织、推理和判断能力、大脑整合机能等。该分测验分数的高低还与个体接触连环画的数量有关。(5)算术由19道算术题组成。前4题,主试要出示一张画有一排数的图片。第1-15题,主试口述题目,例如,口述第6题:“小红有5根小辫绳,她丢掉了1根,还剩下几根?”第16-19题,则呈现题卡由受测者朗读作答。受测者必须心算,并在规定的时间内口头回答。每答对一题给1分,最高分为19分。这个分测验主要测量数概念、运算技巧、推理、抗分心能力、长时记忆等。该分测验分数的高低还与在校学习的情况、在有时间压力的情况下完成任务的能力等有关。(6)积木共有11张印有由红白两色几何图形组合成图案的卡片,每次呈现一张,要求受测者在规定的时间内用4或9块积木(长、宽、高都为1英寸,两面为红色,两面为白色,还有两面按对角线分成红白各半的立方体)拼摆出卡片中的图案。前3题以0、1或2记分,第4-11题以0、4、5、6或7记分,最高分为62分。积木分测验主要测量知觉组织、分析与综合能力、空间想象力、视觉-运动协调能力等。(7)词汇共有32个词汇,印在一张大卡片上,主试每次按顺序呈现一个词汇,同时念出这个词,要求受测者解释它的词义。例如,向受测者呈现“勇敢”一词,并提问:“什么是勇敢?”对受测者的回答以0、1或2记分,最高分为64分。这个分测验主要测量言语理解和表达、抽象概括能力、概念形成、长时记忆力等。该分测验分数的高低与个人的课外阅读量、兴趣爱好、在校学习情况、生活经验等有关。(8)拼图由5套常见物体(如苹果、马、汽车等)的图形拼板组成,其中有一套用于练习。每次主试按预先设计的摆放方式呈现一套零散的拼板,要求受测者在规定的时间内拼成一个完整的画面。每套拼图的时限为2分钟、2分半和3分钟不等,记分方法也各有不同。整个分测验的最高分为33分。这个分测验主要测量知觉组织、大脑的整体加工能力、视觉-运动协调能力、灵活性等。此外,该分测验的得分还与认知方式、拼板的经验、在有时间压力的情况下完成任务的能力等有关。(9)理解由17道简答题组成。例如,第3题是“当你割破了手指的时候你应该怎么办?”受测者必须说出解决问题的办法或说明日常生活中人们采取某些做法的原因。结果以0、1或2记分,最高分为34分。这个分测验主要测量理解日常生活中各种行为规范的能力、推理和判断能力、解决实际问题的能力、言语理解和表达等。(10)译码有两套表,第一套用于8岁以下儿童,第二套用于8岁或更大的儿童。首先向儿童呈现一些图形或数字与符号相对应的样例(如在第一套表中圆形与等号相对应,在第二套表中3与加号相对应),然后要求受测者根据样例在规定的时间内将一系列图形或数字转换成相应的符号。第一套表的每一正确译码记1分,最高分为50分。第二套表的每一正确译码也记1分,最高分为93分。这个分测验主要测量抗分心能力、短时记忆力、视觉-运动协调能力、抄写速度与精确性、学习能力等。(11)背数由顺背和倒背两部分组成。顺背时从随机排列的3位数字开始,最多是10位数字,主试以每秒一个数字的速度念出数字,要求受测者按顺序复述。倒背从2位数字开始,最多是9位数字,在主试念完一串数字后,要求受测者以相反的顺序说出这些数字。每种位数都有二试,二试皆通过记2分,只有一试通过记1分,二试皆未通过记0分并停测。整个分测验最高分为30分。背数分测验主要测量抗分心能力和短时记忆力。(12)迷津共有10个迷津,其中有一个是用于练习的。受测者必须从位于中心的人像开始,在规定的时间内用铅笔画出走出迷津的路线来。每个迷津的时限和记分方法不完全相同。该分测验的最高分为30分。这个分测验主要测量知觉组织、大脑整合机能、计划能力、视觉-运动协调能力等。上述12个分测验中常识、类同、算术、词汇、理解和背数(备用)属于言语量表,填图、图片排列、积木、拼图、译码和迷津(备用)属于操作量表。施测时,首先按指导语对受测者逐条进行测试,然后把各分测验的原始分数转化成平均数为10,标准差为3的标准分数,再分别把前5个言语分测验和前5个操作分测验的标准分数相加求得言语量表分数和操作量表分数,及二者相加求得的全量表分数,最后,通过查测验手册中的常模表,便得到言语IQ、操作IQ和总IQ。整套测验全部做完大约需要1到1个半小时。评价:WISC-CR是目前国内使用频率最高的儿童智力量表。它因其便于测量各种智力因素及比较优良的性能,一直受到广大心理、教育及临床工作者的欢迎。不过,这套量表中的有些内容如今已经过时了,需要重新修订。3.韦克斯勒儿童智力量表分数的解释最初编制和实施韦克斯勒儿童智力量表的目的是为了准确地评估儿童的一般智力水平。然而,随着教育事业的发展和研究的不断深入,人们已不满足于只了解儿童的智商,而希望通过对量表中各个分测验分数以及各种组合模式的分析和解释,从不同的侧面或层面来评估儿童的智力,为教育教学提供更多有用的信息。目前,对韦克斯勒儿童智力量表分数的解释主要从以下几方面来进行:(1)分析总IQ,判断受测者的智力处于哪一级水平。(2)将言语智商(VIQ)与操作智商(PIQ)作比较,看二者的关系属于VIQ=PIQ、VIQ>PIQ,还是VIQ<PIQ。VIQ=PIQ是指VIQ与PIQ的差异无统计学意义,VIQ>PIQ或VIQ<PIQ是指二者的差异有统计学意义。研究表明,在WISC-R中VIQ与PIQ的差异大于12分时达到0.05的显著性水平,大于15分时达到0.01的显著性水平。通过VIQ与PIQ的比较,可以了解受测者的言语智商是强于、等于还是弱于非言语智商。(3)计算言语理解、知觉组织和抗分心能力三个因素的量表分并比较高低。言语理解的量表分即常识、类同、词汇和理解4个分测验量表分的总和,知觉组织的量表分即填图、图片排列、积木、拼图和迷津5个分测验量表分的总和,抗分心能力的量表分即算术、背数和译码3个分测验量表分的总和。因素量表分之间的差异大于3分时有统计学意义。通过对因素量表分的比较,可以了解受测者的哪方面能力比较强,哪方面能力比较差。(4)比较各言语分测验量表分与言语量表的平均量表分的差异。若某个分测验的量表分高于言语量表的平均量表分3分以上,就表明相对于其他言语分测验,受测者在这个分测验所测的能力方面比较强;若低于平均量表分3分以上,就表明受测者在这个分测验所测的能力方面比较弱。(5)比较各操作分测验量表分与操作量表的平均量表分的差异。方法同上。(6)比较各分测验量表分与所有分测验的平均量表分的差异。若某个分测验的量表分高于所有量表的平均量表分3分以上,就表明总体而言,受测者在这个分测验所测的能力方面比较强;若低于平均量表分3分以上,就表明受测者在这个分测验所测的能力方面比较弱。(7)比较各分测验量表分之间的差异。差异大于4分时有统计学意义。通过两两比较,也能了解受测者能力结构中的强项和弱项。此外,还可以从与平均量表分有同一差异方向的几个分测验所共同测量的能力或因素中发现受测者的优势和弱点。(三)韦克斯勒儿童智力量表第三版美国心理公司在WISC-R的基础上,对韦克斯勒儿童智力量表再次做了修订,于1991年发表了WISC-Ⅲ。新的量表保持了WISC-R的基本结构,仍由言语量表和操作量表两部分组成。不过,该量表在以下几方面作了较大的改动:①操作量表中增加了一个符号搜索分测验(备用);②通过补充一些较容易和较难的题目,扩大了测验的难度跨度;③将填图、图片排列和拼图等分测验的材料全部改成彩色的;④重新制定了常模,以提高常模团体的代表性。通过这次修订,韦克斯勒儿童智力量表的标准化程度得到进一步提高。以下是本次修订的一些测量性能指标:1.常模团体的抽样 WISC-Ⅲ采用分层随机抽样的方法抽取常模团体。分层变量包括年龄、性别、种族、地域、户主职业及居住地(城市或农村)等。从6岁到16岁分成11个年龄组,每组有儿童200名,常模团体总共有儿童2200名。各层的人数比例基本符合1990年美国人口普查的统计数据。本次抽样做法更细致,范围更广。在WISC-R中种族只分白人和非白人两种,而在WISC-III中分为白人、黑人、西班牙人和其他人四种。此外,在常模团体中还包括了一些特殊儿童如学习障碍儿童、天才儿童等。2.信度 WISC-Ⅲ的内部一致性系数是非常高的。修订后,总IQ、言语IQ和操作IQ的内部一致性系数的均值为0.96、0.95和0.91;分测验的均值分布在0.69(拼图)至0.87(词汇、积木)之间。再测信度系数的均值与内部一致性系数十分接近,不过,有些分测验的再测信度系数比较低,如图片排列、拼图和迷津的均值只有0.64、0.66和0.57。3.效度测验手册中报告了WISC-Ⅲ的协同效度。该量表总IQ与WISC-R、WAIS-R和WPPSI-R总IQ的相关系数分别为0.89、0.86和0.85。在量表的修订过程中修订者检验了这套量表对学业成就的预测效度。将若干学业成就测验的受测者组合成一个由358人组成的新样本,计算学业成就测验分数与WISC-Ⅲ分数的相关,结果是,总IQ、言语IQ和操作IQ与学业成就测验分数的相关系数分别为0.74、0.74和0.57。此外,修订者还对WISC-Ⅲ进行了因素分析,共抽取出四个因素—言语理解、知觉组织、抗分心能力和加工速度,其中词汇、常识、类同和理解4个分测验在言语理解因素上负荷量最高,依次为0.79、0.72、0.72和0.65;积木、图片排列、填图、拼图和迷津5个分测验在知觉组织因素上负荷量最高,依次为0.70、0.69、0.53、0.37和0.36;算术、背数两个分测验在抗分心/工作记忆因素上负荷量最高,依次为0.3和0.34;译码、符号搜索在加工速度因素上负荷量最高,依次为0.79和0.56。另外,13个分测验在g因素上的负荷量为从0.30-0.80不等,迷津分测验最低,词汇分测验最高。评价:WISC-Ⅲ的优点是十分突出的。首先,整套量表分为言语量表和操作量表两部分,有利于将其中的一部分题目用于评估视觉障碍、听觉障碍、肢体残疾、言语障碍、情绪障碍和学习障碍儿童的智力,因而可以扩大量表的适用范围。其次,大量的研究数据已经表明,这套量表有很高的信度和效度,因此,它的测量结果是比较可靠的。再有,大多数分测验在g因素上有很高的负荷量,这表明它能够用来测量一般智力水平。不过,这套量表的某些分测验信度还不够高,不能单独使用。另外,由因素分析抽取出的四个因素究竟是什么,它们是否反映了智力结构中的最重要的成分还有待于研究证明。。