当前位置:文档之家› 第四章测量的信度与效度

第四章测量的信度与效度

致程度,其大小等于同一组被试在两个复本测验 上所得分数的积差相关系ቤተ መጻሕፍቲ ባይዱ。计算公式同重测信 度。
➢ 两个复本测验实施的时间不同,复本信度所表达 的含义略有不同。
➢ (1)等值性系数 ➢ 如果两个复本测验是同时连续测试的,则称这种
复本信度为等值性系数。等值性系数的大小主要 反映着两个复本测验的题目差别带来的变异情况。
心理特质方面没有其他的学习和练习
➢ 3.计算重测信度应注意的问题 ➢ (1)两次测验时间间隔要适当 ➢ (2)应提高被试的积极性 ➢ (3)适宜于人格测验与速度测验,不适合于智
力等难度测验
➢ (二)复本信度(Alternate-form reliability) ➢ 1.含义与计算 ➢ 是指两个平行测验测量同一批被试所得结果的一
➢ 实际上α系数是所有可能分半信度的平均值, 但它是测验信度的一个下界值,即α系数值大, 测量信度必然高,但α系数值小,却不能判断 测量信度不高。
➢ 例题:某态度量表共7道题目,100个被试在各 题上得分的方差分别是0.81, 0.82, 0.80, 0.86, 0.88, 0.79, 0.89,测验总分的方差是26.00,计算该测量的 信度。
➢ (三)分半信度(Split-half reliability) ➢ 1.含义与计算 ➢ 是指将一个测验分成对等的两半后,所有被试在这两半上
得分的一致性。 ➢ 分半信度信度与等值性系数的解释一样,即可以把对等的
两半测验看成是最短时距内施测的两个平行测验。分半信 度描述的是两半题目间的一致性,所以也叫内部一致性系 数。
➢ 三、信度的作用 ➢ (一)评价测验 ➢ 信度是测量过程中所存在的随机误差大小的反映。信度低,
测量随机误差大,测量结果就会与真分数发生较大偏离。 ➢ 信度是衡量一个测验好坏的重要指标之一,测验的信度达
到多少才可以接受呢?一般来讲,能力与成就测验的信度 应该在0.90以上,人格测量信度系数应该在0.80 以上。 ➢ 测量中的系统误差与信度无关。
第四章 测量的信度与效度
➢ 本章提要: ➢ 信度的概念与估计方法 ➢ 提高信度的方法 ➢ 效度及其与信度的关系 ➢ 效度的种类与估计方法 ➢ 提高效度的方法
第一节 测量信度
➢ 一、什么是信度 ➢ 1. 信度的描述定义 ➢ 信度(reliability)是指测量结果的稳定性和
可靠性程度。
2. 信度的测量学定义(操作性定义)
➢ (二)解释分数
➢ 1. 解释个人测验分数的意义 ➢ 从理论上讲,一个人的真分数本来是用同一测验对他反复
施测所得的平均值,其误差则是这些实测值的标准差。但 实际上,这是做不到的。实际的做法是用一个团体(人数 足够多)两次施测得结果来代替对同一个人的反复施测, 以估计测量误差的变异数。
➢ 此时每个人两次测量的分数之差构成一个新的分 布,这个分布的标准差就是测量的标准误,它是 此次测量中误差大小的客观指标,有了这一指标, 就可以对团体中任何一个人的测验成绩做出恰当 的解释。
注意水平、作答态度等会影响测量信度。
➢ 就团体而言,团体的异质程度与分数的分布密切 相关,一个团体越是异质,其分数分布范围越大, 计算出来的信度系数值越高,这样会高估真正的 信度值。当团体内部水平相差不大(同质)时, 其得分分布必然会狭窄,以相关为基础计算出来 的信度值必然小,可能会低估真正的信度值。此 外若团体的平均数太高或太低,同样使测验的总 分分布变窄,低估测验的真正信度。
➢ (五)评分者信度(Scorer reliability) ➢ 1.含义与计算 ➢ 评分者信度指的是多个评分者给同一批人的答
卷进行评分的一致性程度。对于主观试题,不 同的评分者给出的分数是不等的,这样会造成 误差,如何降低评分者信度是心理测量的重要 任务之一。
➢ 当评分者人数为2时,评分者信度等于两个评 分者给同一批被试答卷所给分数的相关系数。 如果是多个评分者,评分者信度采用肯德尔和 谐系数进行估计。
➢ 注意题目分半的方法:按题号奇偶性分半、按 题目难度分半、按题目内容分半等。
➢ 计算方法与复本信度类似,但被试在两半测验 上得分的相关系数只是半个测验的信度,所以 必须用斯皮尔曼—布朗公式加以校正:
➢ 2.使用的前提条件和范围 ➢ 分半信度通常是在只能施测一次或没有复本的情
况下使用。其中使用斯皮尔曼—布朗公式时要求 全体被试在两半测验分数的变异数相等。当测验 无法分成对等的两半时,无法使用。
3. 误差方差与信度的关系
➢ 二、信度的估计方法 ➢ (一)重测信度(test-retest reliability) ➢ 1.含义与计算 ➢ 重测信度是指用同一量表对同一组被试测试两次
所得结果的一致程度,其大小等于同一组被试在 两次测验上所得分数的积差相关系数。即:
➢ 2.重测信度使用的条件 ➢ (1)所测量的心理特质必须是稳定的 ➢ (2)遗忘和练习的效果基本上相互抵消 ➢ (3)在两次测试时间间隔内,被试在所要测查的
➢ (2)稳定性与等值性系数 ➢ 如果两个复本测验是相距一段时间分两次测试,
则称这种复本信度为稳定性与等值性系数。此 时两个题目间的差别、两次施测情境、被试特 质水平等方面的差别都会成为测验结果不一致 的原因。
➢ 2. 复本信度使用的条件 ➢ (1)两个测验必须在项目的内容、形式、数量、难易、
时限、指导语等方面相同或相似。 ➢ (2)两次测验的时间间隔要适当。 ➢ 局限: ➢ (1)复本法只能减少而不能排除练习和记忆效应。 ➢ (2)对于许多测验来说要建立复本是非常困难的。
2.不同测验分数的比较
➢ 四、影响测量信度的主要因素 ➢ 测量信度是测量过程中随机误差大小的反映,随
机误差大,信度就低,随机误差小,信度就高。 因此,在测量过程中凡是能引起测量随机误差的 因素都会影响测量信度。影响信度的几种主要因 素为:
➢ (一)被试方面 ➢ 就单个被试而言,其身心健康状况、应试动机、
➢ (四)同质性信度(Homogeneity reliability) ➢ 1.含义 ➢ 同质性信度也叫内部一致性系数,它是测验内部所有题
目间的一致性程度。这里的一致性有两种含义:一是所 有题目都测的是同一种心理特质,二是所有题目得分之 间都具有较高的正相关。同质性信度就是一个测验所测 内容或特质的相同程度。
相关主题