心理测量学复习(二级)浙江大学医学院医学心理学教研室祝一虹博士,副教授第一节、概述一、测量三元素按一定的法则用数字对事物加以确定二、测量的要素单位:有确定的意义,有相同价值;参照点:相对零点,绝对零点三、量表类型(Stevens )(1)命名量表代表(学号)和归类(男、女)(2)顺序量表具有等级性和次序性。
个子从高到矮(3)等距量表除能表明量的相对大小外,还具有相等的单位。
排队,每5cm 一个人;温度(4)等比量表除了具有量的大小、相等单位外,还有绝对零点。
尺,长度、体重心理测验通常是顺序量表(少数等距量表)单元5 心理测验的应用门诊中用的较多的是:一、智力测验二、人格测验三、心理评定量表第二节、常模分数与常模(一)常模分数⏹施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数⏹导出分数有参照点、有单位、有意义,与原始分数等值,可比较(二)常模常模分数构成的分布,叫常模(二)百分位常模1.百分等级(常模样本中低于某分数的人数百分比,如85,表示有85%的人分数比某分数低):越低,个体所处位置越低2.百分点(又称百分位数PP ): 是指处于某比例的人对应的测验分数。
如果要挑20%的人进大学,那么计算80%对应的分数。
3.四分位数和十分位数四分位数:25%,50%,75%十分位数:1%-10%第一段,91%-100第十段(三)标准分常模将个体的原始分与平均数的距离以标准差为单位表示出来,可以通过线性和非线性转换得到,常见的有:z 分数,Z分数,T分数,标准9分数,离差智商(IQ)(1)z分数:z =(X-M)/SD (线性)(2)Z=A+Bz (线性)(3)T分数T= 50 +10 z' (平均数为50,标准差为10)(4)标准九分:9级分数量表(平均数为5,标准差为2)(5)标准十分(5,1.5)和二十分(10,3)(四)智商及其意义⏹比率智商⏹离差智商优点:建立在统计学基础之上个体智力在该年龄组中的位置是智力的理想指标单元3 常模分数的表示方法一、常模的构成要素:原始分数、导出分数、对常模团体的具体描述如:年龄量表的基本要素包括:一组能区分年龄的题目、常模表、一个常模团体二、常模分数的表示方法:1.转换表2.剖面图第三节测验的信度单元1 信度的概念一、信度的定义多次测量的一致性受随机误差的影响,不受系统误差的影响单元2 信度评估的方法一、重测信度(Test-Retest Reliability)⏹又称为稳定性系数,间隔时间越长,稳定性系数越低⏹年幼儿童,间隔要小;年长群体,间隔可大。
智力测验的间隔不能太短,成就测验的间隔不能太长。
二、复本信度⏹又称等值性系数(复本A—最短时间—复本B)重测复本信度⏹稳定性与等值性系数:一定时间间隔后施测,内容变异+重测信度误差形式:复本A—适当时间—复本B重测复本信度,稳定及等值系数三、内部一致性信度(Internal consistency reliability)三、内部一致性信度(一)分半信度⏹计算分半信度先要对测验分半。
不同的分半法可能会得到不同的信度值。
⏹由于分半信度实际上只是半个测验的信度,测验越长、项目越多,两半分数的相关就越高。
因此,对长度不同的测验,要用斯皮尔曼-布朗校正公式。
2r hhr xx=1+r hh(二)同质性信度⏹同质性指测验的所有题目测量的是同一种心理特质,表现为各个题目得分之间有较高的相关,相关越高则同质性越强。
⏹公式克伦巴赫a系数(多重记分)库德-理查逊公式(单一记分)四、评分者信度评分者信度是指不同评分者(两个或以上)之间在测验结果计分上的一致性。
单元3 信度与测验分数的解释1. 解释真实分数与实得分数的差异:信度变异范围0.00~1.002.确定信度可接受的水平1)能力测验和成就测验:0.90以上2)人格、兴趣、态度:0.80~0.853)<0.7 一般不可用, 0.7=<r<0.85可用于团体比较,r>=0.85预测或鉴别个人成绩4)新编的>旧的单元4 影响信度的因素一、样本特征异质性越高(白痴和天才),信度被高估平均能力低,猜测的成分多,信度低二、测验长度越长,测题取样或内容取样越有代表性越长,被试猜测因素影响小太长,反而一起疲劳和反感长度选择应遵循报酬递减率原则K 值的计算:r kk (1-r xx )K =r xx (1-r kk )三、测验难度太难或太易都会降低信度,最好是50%四、时间间隔包含40题的测验,信度从0.8 提高到0.9 ,至少需要增加多少题目?K=2.25,增加50题第四节测验的效度单元1 效度的概念最重要的必备条件效度受信度制约单元2 效度评估的方法1974年《教育与心理测量之标准》,三大类:⏹内容效度⏹构想效度⏹校标效度一、内容效度(Content Validity)(一)定义题目对有关内容或行为取样的适用性,代表性取样,内容比例合适,不一定同质(二)评估方法1. 专家判断2. 统计分析(两个评分者一致性,复本相关,再测法)3. 经验推测(三)内容效度的特性(不是普遍适用:)时间(过去的不一定适用于当前),测验分析者和测验使用者定义的内容范围需相同(四)内容效度更客观的方法*:1. 定义好测验内容的总体范围2. 编制双向细目表3. 制定评定量表来测量测验的整个效度二、构想效度(Construct Validity)(一)定义构想效度是指测验对于被称作构想的某一理论概念或特质测量的程度,又称构思效度,结构效度。
(二)估计方法1.对测验本身的分析2. 测验间的相互比较3.效标效度的研究证明4.实验和观察法证实三、效标效度(实证效度)(一)定义一个测验对处于特定情景中的个体的行为进行估计的有效性。
分为:同时效度,预测效度(二)好效标必须具备的条件1.能最有效反应测验目标2.具有较高的信度3.可以客观地测量4.测量方法简单,省时省力,经济实用(三)评估方法1.相关法2.区分法3.命中率法第五节项目分析单元1 项目的难度一、定义项目难度指项目的难易程度P =(R/N)100%二、难度的计算(一)二分法(0,1)记分项目的难度(P代表难度)1. 通过率P=R/N×100%2. 极端分组法(上下27%)P=(PH+PL)/2校正公式:Cp=(KP-1)/(K-1)(用于备选答案树木不同时的难度比较)(二)非二分法记分项目的难度P=X / Xmax×100%X为所有被试在该项目上的平均得分,Xmax为该项目的满分。
单元2 项目的区分度一、区分度的定义区分度(discrimination)是指测验项目对被试心理品质水平差异的区分能力或鉴别能力。
项目的区分度是测验是否有效的“指示器”。
二、区分度的计算(一)项目鉴别指数法1.鉴别指数(index of discrimination,D)的计算D=PH -PL取值范围:-1~+1心理测量技能复习心理测验分类:⏹智力测验:•韦氏成人智力(WAIS-RC),•联合型瑞文测验(CRT),•中国比内测验⏹人格测验:•MMPI•16PF•EPQ⏹心理与行为问题评估:•SCL90•SDS•SAS⏹应激及相关问题评估:•LES•社会支持评定量表•应对方式问卷主要量表及运用(一)心理与行为问题评估1.能使用汉密尔顿抑郁量表(HAMD)2.能使用汉密尔顿焦虑量表(HAMA)3.能使用简明精神病评定量表(BPRS)4.能使用倍克—范拉森躁狂量表(BRMS)(二)特殊心理评估的实施1.能使用韦氏儿童智力量表(C-WISC)2.能使用儿童行为问题评估问卷(CBCL)3.能使用明尼苏达多项人格量表-2(MMPI-2)一、智力测验-智力结构理论卡特尔:流体智力(先天),晶体智力(后天)年龄增长?个体差异流体更大智力测验-WAIS-RC(韦氏成人)⏹测验材料:–编制:韦克斯勒1955年编制,1981年、1997年两次修订–修订:龚耀先1981年修订⏹适用:16岁以上,分城市(县属城镇)和农村⏹施测步骤:•填一般信息•先言语,后操作,特殊情况可改变•言语量表:知识、领悟、算术、相似性、数字广度、词汇•操作量表:数字符号、图画填充、木块图、图片排列、图形拼凑(有图画的)智力测验-WAIS-RC(韦氏成人)⏹记分•原始分:缺一个分测验,计算加权分⏹有时间限制的项目,以反应的速度和正确性作为评分的依据。
⏹不限时间的项目,则按反应的质量给予不同的分数。
⏹有些回答没有列在指导手册提供的“标准答案举例”之内,这就要求主试根据评分原则作出主观判断。
•量表分:-原始分按手册上相应用表可转化成平均数10分,标准差3分(标准20)的量表分,-分别将言语测验和操作测验的量表分相加,便可得到言语量表分(VIQ ,6)和操作量表分(PIQ ,5)。
-再将二者相加,便可得到全量表分。
•智商(查表):言语智商,操作智商,总智商(FIQ)(年龄,农村或城市)智力测验-WAIS-RC (韦氏成人)结果解释•等级分布:90-109为正常,10分一等级,130,70•缺陷: 弱智在总人群占到2.2%.其中50-69,占弱智的85%分等IQ 的范围人群中的理论分布比例(%)极超常≥130 2.2超常120-129 6.7高于平常110-11916.1平常90-10950低于平常80-8916.1边界70-796.7智力缺损≤69 2.2智力缺陷等级智商占智力缺陷的百分率(%)轻度50-6985中度35-4910重度20-343WAIS-RC的解释⏹学习目标⏹了解FIQ的波动范围及可信区间。
⏹掌握言语和操作智商差异的意义。
⏹掌握各分测验差异的意义及分析的基本方法。
⏹工作程序⏹总智商(FIQ)的分析分量表的平衡性分析比较各分测验的差异⏹相关知识⏹注意事项工作程序⏹总智商(FIQ)的分析⏹通常可用测得的IQ值加减5(85%~90%的可信限水平)的方法判断IQ值的波动范围。
⏹分量表的平衡性⏹如优势半球有损害,则VIQ明显低于PIQ;非优势半球有损害,则PIQ明显低于VIQ;若是弥漫性损害,其表现与非优势侧损害时相似。
⏹比较各分测验的差异⏹可根据考夫曼介绍的加减3分的简易方法,只要分测验高于平均分3分以上,即可认为该测验是强点;而低于平均分3分以下时可以认为该测验是弱点。
相关知识V-P差异没有实际意义的若干情况⏹智商不与因素分数相应⏹算术和数字广度其实不属于言语因素,而数字符号也不应归入知觉组织。
⏹言语能力对操作能力缺陷的补偿⏹图画填充和图片排列是两个常常受言语能力影响的操作测验。
⏹轮廓中得分的分散⏹每当言语或操作量表内部的分测验分数非常分散的时候,V-P差异就毫无意义。
⏹再测效应⏹对各年龄水平的求助者来说,一个月之内的第二次测验,言语智商的增加量通常为3.5,而操作量表的增加量通常为9.5。