心理测量学要点总结【基本概念】1)测量:依据一定法则用数字对事物加以确定。
测量三元素:事物(测量对象属性特征) 数字(某一属性的量,特征:区分性+序列性或等级性+等距性+可加性) 法则。
2)测量要素:a)参照点:计算的起点—相对零点。
b)单位:测量的基本要求,条件:有确定意义+有相同价值。
3)测量量表:斯蒂文斯按量表精确程度从低到高分成4水平。
顺序量表指明类别,类别大小或某种属性程度无相等单位,无绝对零点,仅表示等级不表示属性真正量,绝对值等距量表不但有大小关系,还有相等单位,数值可作加减运算,但无绝对零点,不能作乘除运算等比量表有相等单位,有绝对零点,可作加减乘除运算心理测量一般在顺序量表上进行4)心理测量:依据心理学理论,使用一定操作程序,观察少数人有代表性的行为,对贯穿人全部行为活动中的心理特点作出推论和量化分析的一种手段。
特点:a)间接性:无法直接测量,测量外显行推论心理特质(描述一组内部相关,联系行为时使用的术语,对刺激作反应的一种内在倾向) b)相对性:对人行为比较时,没有绝对标准c)客观性:标准化(项目,计分原则和手续,分数转换和解释)材料性质 1.文字测验 2.操作测验测量方法问卷法(MMPI 16PF EPQ)+投射法(罗夏测验,主题统觉TAT)材料严谨程度 1.客观测验(直接理解,无须猜测遐想)2.投射测验(问题模糊,须用想象力,投射被试者思想情感,经验)测验形式 1.个别测验 2.团体测验1.最高作为测验(作出最好回答,有正确答案)2.典型行为测验(按习惯方式反应,无正确答案)【三类心理测验】1.智力测验:吴天敏-中国比内量表龚耀先-韦氏成人智力量表(WAIS-RC)韦氏儿童(C-WISC),韦氏幼儿(C-WYC-SI)林传鼎-韦氏儿童(WISC-CR)张厚粲-瑞文标准型测验(SPM)李丹-联合型瑞文测验(CRT)2.人格测验:艾森克人格问卷(EPQ)卡特尔16人格因素问卷(16PF)明尼苏达多项人格调查表(MMPI)3.心理评定量表:精神病评定量表,躁狂状态评定量表,抑郁状态评定量表,焦虑状态评定量表,恐怖状态评定量表。
【心理测验发展】高尔顿——奠定统计学基础,提出气质特点和智能的遗传性,设计测量遗传差异的方法。
卡特尔——心理测验第一次出现在心理学文献中。
比内——世界第一次正式心理测验。
【测验常模】1.常模团体:具有共同特征的人组成群体,或该群体的一个样本.条件:1)群体构成明确界定。
2)所测群体的代表性样本。
3)标准化样组是一定时空产物(随时间,空间变更而失去意义)。
4)样本大小适当(经济实用,减少误差≥30或100,全国性2000-3000)。
取样:目标人群中选择有代表性样本。
抽样方法:1)简单随机抽样2)系统抽样(整体无序,无等级结构) 3)分组抽样4)分层抽样(先按某变量分类,再随机抽取)。
常模分数:施测样本被试后,将被试者的原始分数按规则转换出来的导出分数(有参照点和单位,与原始分数等值比较)。
常模:常模分数构成的分布心理测验分数的基础:一般常模+特殊常模(非典型团体建立)。
2.发展常模(年龄量表):1)发展顺序量表(最直观),多大的儿童具备什么能力和行为表示其发育正常。
葛塞尔发展程序表:按月份显示儿童运动水平,适应性,语言,社会性。
16W——头平衡, 28W——手握,40W——坐立爬,52W——行走。
皮亚杰:守恒理论,5Y——质量守恒, 6Y——重量守恒,7Y——容量守恒。
2)智力年龄比内-西蒙量表最早使用智力年龄概念——儿童在量表上得分,代表他的智力水平的年龄——智龄3.)年龄当量(年级量表) 教育成就测验中最常用3.百分位常模1)百分等级(PR) 应用最广指在常模中低于这个分数的人数百分比PR=100-(100*R-50)/N R-排名N-总人数2)百分点(百分位数PP)(100-PR)/(S-PP)=(PR-1)/(PP-s) S-最高分PR-要取的百分等级s-最低分3)四分位数4)十分位数4.标准分常模将原始分数与平均数的距离以标准差为单位表示出来z分数 Z分数 T分数标准九分数离差智商1)线性转换的标准分数 z分数 z=(X-X)/SD, SD-样本标准差X-原始分数X-样本平均数Z分数 Z=A+Bz 2)非线性转换的标准分数原始分数不常态分布时,将其常态化-将原始分数转换为百分等级T=50+10z’麦柯尔最早用标准九分平均数-5标准差-2标准十分平均数-5 标准差-1.5标准二十分平均数-10 标准差-35.智商及意义最早的比内-西蒙智力测验无智商概念,只用”心理年龄”(MA)表示智商高低现在比率智商,离差智商1)比率智商(IQ):IQ= MA(心理年龄)/CA(十足年龄)*1002)高差智商(离差智商):以年龄组为样本计算而得的标准分数. 韦克斯勒平均数-100,标准差-15 IQ=100+15z’=100+15(X-X)/SD不同离差智商只有在标准差接近或相同时才可以比常模分数表示法1)转换表法:最简单最基本—常模表2)剖面图法—直观看出各部分测验表现的相对位置【信度与效度】1.信度:同一被试者在不同时间内用同一测验(或相同测验)重复测量,所得的结果的一致程度只受随机误差影响,误差越大,信度越低实得分数(X)=真实分数(T)+误差(E) S X2=S T2+S E2信度;一组测量分数的真分数方差与总方差的比率 r xx= S T2/ S X2=1- S E2/ S X2信度指标:信度系数+信度指数信度系数:r xx= S T2/ S X2=r xt2 信度指数:r xt=S T/S X测量标准误 SE= S X (1- r xt)1/2信度越高,标准误越小.a)重测信度稳定性系数采用重测法前后实施两次测验,求两次得分的关系系数时间间隔 2-4W,不超过6M缺点:易受记忆和练习影响相隔时间太长,则易受身心发展和学习经验积累的影响b)复本信度等值性系数两个等值但题目不同的测验(复本)来测量同一群体,求得分间相关系数(不掺时间影响)重测复本信度/稳定与等值系数两复本施测相隔一段时间优点:能避免重测信度的问题缺点:1.只能减少练习影响 2.掌握解题原则c)内部一致性信度:反映题目间的关系,表示测验能测量相同内容或特质的程度半分信度:用半分法估计所得的信度系数. 按奇偶将测题分成等值两半,求两半分数的关系系数—两半测验一致程度斯皮尔蛮—布朗公式r xx= 2r hh / (1+r hh) r hh为一半分数的关系系数 r xx为测验在原长度时的信度估计值同质性信度同质性:代表测验内部所有题目一致性. 各测题得分较高正相关,不论题目内容形式,测验为同质.库德-查理逊公式常用K-R20. 在各测量难度相同或近似的情况下,用K-R21只适用答对一题记一分,答错无分克伦巴赫α系数:适用多重记分:多选人格量表态度量表等d)评分者信度:成对受过训练的评分者间平均一致性达0.9以上,才认为评分客观多个评分对象,以等级法记分时,采用肯德尔和谐系数(W)作为评分者信度估计信度与测验分数的解释r xx=0.9 测验有90%变异是真分数造成,10%来自误差.信度可接受水平一般原则:r xx<0.70,测验不能用于对个人和团体的评价和预测0.70≤r xx<0.85时,可作团体比较;r xx≥0.85 才可鉴别或预测个人成绩或作为解释个人分数的意义:测量标准误的应用作用:1.估计真实分数范围 2.了解实得分数再测可能出现的变化情形标准误:SE= S X (1- r xx)1/2 95%或然水平置信区间:X-1.96SE<X T≤X+1.96SE约95%可能性真分数在±1.96SE范围内比较不同测验中分数的差异:差异标准误: SEd= S X (1- r xx - r yy)1/2 1.96*SE>一个标准差(SD),才表明有显著差异影响信度的因素:1)样本特征:样本团体异质性影响(异质性高-高估测验信度)+样本团体平均能力水平(难度影响信度)2)测验长度:测验越长-结果越可靠,猜测因素影响越小斯皮尔曼-布朗公式导出:长度倍数:K= r kk(1- r xx)/ r xx (1- r kk) 3)测验难度:难度太大或太小,则分数范围缩小,信度降低洛德选择题平均难度 5/1-0.7, 4/1-0.74, 3/1-0.77, 2/1-0.85 4)时间间隔:重测信度和不同测量时的复本信度影响间隔短,信度系数大; 时间间隔久,变因介入可能性大,信度低2.效度:所测量的与所要测量的心理特点之间符合程度—心理测验的准确性信度是效度的必要条件真实方差=有关方差+无关方差—S T2=S V2+S I2 S X2= S V2+S I2+S E2 效度系数=真实方差/总方差r xy2= S V2/ S X2效度的性质:1)相对性:对一定的目标 2)连续性:效度用相关系数表示,只有程度上不同效度评估:内容效度构想效度较标效度1)内容效度(逻辑效度):测验题目对相关内容或行为取样的适应性,从而确定测验是否所欲测量行为领域的代表性取样评估法:a)专家判断法:定义测验内容总体范围—编制双向细目表(确定内容和技能所占比例)—制定评定量表。
b)统计分析法 c)经验推测法特性:内容范围,时间特性表面效度:外行对测验表面检查确定. 最高行为测验—表面效度,典型行为测验—低表面效度2)构想效度(结构效度):测量结果能否证实或解释某理论的假设,术语,构想, 解释的程度如何评估法:a)对测验本身分析研究测验内部结构来界定理论构想b)效标效度的研究证明:(对照组)c)测验间比较:相容效度(同类相关性)+区分效度(不同类测验相异性)+因素分析法d)试验法和观察法证实3)效标效度(证实效度):测验预测个体在某情景下行为表现的有效性程度. 被预测的行为是检验效度的标准—效标同时效度(诊断现状)预测效度(预测将来结果的测验)效标条件 a)有效反映测验目的 b)较高信度,稳定可靠,不随时间变化 c)可客观观察,用数据或等级表示 d)简单,经济评估法:a相关法(求测验分数与效标资料间关系)b区分法(测验分数能否有效区分效标定义的团体.重叠量大,分数差异小,效度差) c命中率法效度的功能:a预测误差 b预测效标分数c预测效率指数影响效度因素:a)测验本身因素:材料代表性测验长度试题类型难度区分度编排方式(先易后难)b)测验实施中干扰因素:主试影响因素(实施标准与否,引导语,时限,评分,测验情境,材料准备,其他干扰因素)被试影响因素(兴趣,动机,情绪,态度,身心状况,是否合作)样本团体性质(样本异质性,异质性高,效度高(1.测验团体经选拔,2.选拔标准太难,都会造成同质)干涉变量:团体特征(年龄,性别,职业,智力,教育水平,动机,兴趣等)使测验对不同团体预测能力不同)c)效标的性质:效标与测验分数之间是否线性相关(重要因素).皮尔逊积差相关系数的前提—假设两变量线性相关1.项目难度难易程度用通过率表示P=R/N*100% P越大,通过率越大,难度越低 (在非能力测验中—“通俗性”)计算方法:1.二分法记分项目(选择题,对1分,错0分) 27%高分组,27%低分组,46%中间组P=(PH+PL)/2平衡机遇对难度影响大吉尔福特校正公式:CP=(KP-1)/(K-1) K-备选答案数P-通过率CP-校正后通过率2.非二分记分法:不能用二分法计算时: P=X/XMax*100%难度水平确定:a)项目难度P接近0或1,无法区分差异;P接近0.5,区别力最好. 最佳平均难度0.5±0.2之间b)测验难度:可从测验分数分布直接检验一般呈常态分布过难或过易:偏态分布(正偏态+负偏态)2.项目区分度(鉴别力):测验项目对被试的心理特征区分能力评价项目质量和筛选项目重要指标,影响测验效度因素计算方法:1.鉴别指数:按总分排列—确定高分低分组(分别总数27%)—高低分组通过率—计算鉴别指数D=PH-PL伊贝尔鉴别指数性能标准D:≥0.4—很好;0.3-0.39—良好;0.2-0.29—尚可,需修改;≤0.19—差2.相关法:点二列相关(二分名变量+连续变量) 二列相关(两连续变量) Ф相关法(两二分名变量)区分度与难度关系:高难度对高水平者区分度高,中难度对中水平者区分度高.难度以常态分布为好【测验编制程序】1.测验目标分析:1)明确测验对象2)测验用途:显示性测验(样本测验-样本取自明确总体+标记测验-取自开放总体) 预测性测验(预测没被测量的行为)。