当前位置:文档之家› 第四章 测量信度

第四章 测量信度


三、描述信度的指标
1.经典测量理论的信度系数 信度系数是表示测量结果的稳定性程 度的指标。记为: rXX
信度系数的值域:[0,1]
没有百分之百可靠的测量,因此,
rXX=1只是理论上的值,实际当中是不
会存在的。
三、描述信度的指标
1.经典测量理论的信度系数
(1)重测信度(test-retest coefficients),是 指用同一个量表对同一组被试施测两次所得结 果的一致性程度,其大小等于同一组被试在两 次测验上所得分数的相关系数。P53 (2)复本信度(alternative--form coefficients),是指两个平行的测验测量同一 批被试所得结果的一致性程度,其大小等于同 一批被试在两个复本测验上所得分数的相关系 数。P54
第二节 信度的估计方法P48
一、重测信度
1.含义
同一个测量工具在两个不同时间对 同一组被试施测所得结果的一致性 程度.
重测信度主要考察了一个测量工具是
否能够保证在不同时间测量结果的一
致性,他反映了测量工具的结果受到
时间间隔因素影响的大小。
一般来说,重测的时间间隔越短,那
么各种施测情境的变化就越小,重测
测量标准误差(standard error of measurement)是测量误差的假设分布的标准 差。用下列公式能够容易地计算测量标准误差:
SEM SDt 1 rXX
式中,SDt表示测验分数的标准差,rXX表示信 度系数。
四、信度的标准与作用P51
1.信度是评价测验质量的重要指标之一。
X V I E
式中,X为观察分数,T为一般真分数, E为随机误差分数,V为目标真分数,I为 非目标真分数(系统误差)。
2.信度的定义
X V I E
T
测量追求的初步目标:T占X的比例越大越好。 测量追求的终极目标:V占X的比例越大越好。
当T占X的比例很大时,那么测值就会是稳定的。 一般来说,稳定的测值是可靠的、可信的,因此,信 度可被认为是测量结果的稳定性程度。
1)要构造出两份或两份以上真正平行的测验;
2)计算复本信度需要对同一批被试测试两份平
行测验,这就需要掌握一个合理的时间安排。
3)应该尽量在测试结果报告中,详尽地说明两
次测试的时间间隔、测试顺序安排、测试过 程中被试的有关测验经历等。
4 消除施测顺序的影响
为排除施测顺序的影响,求复本信度之前,
第四章 测量信度
本章提要
测量信度的概念及作用
信度的估计方法 影响信度的主要因素 提高信度的常用方法
第一节 信度概述
信度:测验结果一致性的判断 (一个测验可靠性和稳定性的指标) 一个好的测验在多次测量同一个人的 时候结果应该是基本一致的.
一、信度与测量误差
1.经典测量理论的假设
X T E T V I
门的训练和培训,以保证重测信度反
映的是随机因素的影响效应。
4.使用重测信度时需要注意的问题
两次施测时间间隔的长短会影响重测信度
系数估计值的大小,因此,在报告重测信
度系数时应该报告间隔的时间长度。
应该根据已有的相关研究结论考虑所测心
理特质本身的稳定性程度,以确定前后两
次施测时间的间隔究竟应该多长比较合适
X1
X2
可计算出以下统计值
X X
1 2 1
158 2600
1 2
X X
2 2 2
151 2409
X X
rtt
2494
运用公式(1)即可求出复本信度
2494 158151/ 10 2600 158 / 10 2409 151 / 10
2 2
.94
3.应用条件
信度系数就会越大。
重测信度系数较大时,说明该测量工
具前、后两次的测量结果比较一致。
结果具有较好的跨时间上的稳定性
2.评估方法
重测信度的大小可以通过计算测
量工具的重测系数(test-retest
coefficient)或叫稳定性系数
(coefficient of stability)来标志。
具体来说,就是求取同一组被试 在两个不同时间施测同一个测量 工具所得结果分数的相关系数。
三、内部一致性信度(同质性信度)P56
1.含义
内部一致性信度主要评价了测验各随
机组成部分之间是否测量了相同的心 理特质,因此,它反映的是题目内容 的抽样一致性程度。
具体估计方法主要包括分半信度评估
测验类型 学业成就测验

0.66
信度系数 中 0.92

0.98
学术能力测验
特殊能力倾向测验
0.56
0.26
0.90
0.88
0.97
0.96
人格测验
兴趣测验
0.46
0.42
0.85
0.84
0.97
0.93
态度测验
0.47
0.79
0.98
2.信度是测量过程中所存在的随机误差 大小的反映。 3.信度可以用来解释个人测验分数的意 义——测量标准误。P51-52
时,不应该随便选择间隔时间的长短。
二、复本信度P54
1.含义
两个平行的测验(复本测验)测量同
一批被试所得结果的一致性程度。
复本信度反映了由于题目的不同以及
时间间隔所导致的测量误差。
平行测验或复本测验指的是两个在题
目内容、数量、形式、难度、区分度、
指导语、时限以及所用的例题、公式
和测验等其他方面都相同或相似的测
SEM SDt 1 rXX 53.42 1 0.965 9.99
例如,我们已知高考文科试卷的总信度rXX =0.965,文科 考生总分的标准差为53.42,那么,文科考试成绩的标准误为:
如果某生的考试成绩为495分,在置信度为0.95时,其真 分数的置信区间为:
[495 1.96 9.99, 495 1.96 9.99] [475,515]
rxxdiff
1 2
(rxx ryy ) rxy 1 rxy
式中,rXXdiff是差异分数的信度系数;rXX和rYY
是两个测验各自的信度系数; rXY是两测验间的 相关系数。
4.信度可以帮助进行不同测验分数的比较。
差异分数的测量标准误可用如下公式求出:
SEdiff SD 2 rxx ryy
验。也就是用不同的题目测量同样的
内容而且其测验结果的平均值和标准
差都相同的两个测验。
2.评估方法
复本信度的估计过程就是计算同一批被试
在两个平行的复本测验上所得分数的相关 系数,也叫作等价系数(coefficient of equivalence)。
测试设计:同时测试和延时测试。
同时测试是在同一个时间段内进行测试,而延
测验 1 2 3 13 14 4 13 12 被 5 11 11 16 15 16 16 试 6 10 9
7 10 11 9
8 8
9
10 7 7
X1
X
2
8
6
求解过程
先计算出公式所需的各统计量
X
1
112
X2Βιβλιοθήκη 1102 X 2 1324
X1 X 2 1324
X
2
1
1334
把上述数值代入公式
rtt
1324 112110/ 10 1334 1122 / 10 1324 1102 / 10
.97
3.应用条件
1)测量工具所测量的个体心理特质在
时间上应该是相对稳定的。
2)测量工具所测量的个体心理特质应
该不存在明显的练习效应和遗忘效应。
3)在两次施测间隔期间不应该进行专
二、信度的统计定义
1.经典测量理论假设的推论
X T E
T V I

2 X 2 T 2 E
X V I E


2 T 2 V 2 I
2 T
2 I 2 E

2 X 2 V
二、信度的统计定义P46
2.信度的统计定义
定义1:信度是被试团体真分数方差与实得 分数方差之比【变异数】 2 2 2 E T T rXX 2 2 2 X
SEdiff SD 2 rxx ryy 15 2 0.97 0.93 4.74
因为4.74×1.96=9.29,因此,言语和操作智商相差
10分时,在0.05水平上,我们说存在显著差异。若
要在0.01水平上作出差异显著的结论,就要相差13 分 (4.74×2.58 )。
考察两个分数的差异是否可靠,是否真有差异的问
4.信度可以帮助进行不同测验分数的比 较。P47
题。比如,某人的物理成绩是否真的优于化学?某 人的数学技能本学期是否真有进步?某人在韦氏智 力量表上操作智商与言语智商的差异是否真有显著 意义等。
当两测验的方差相等时,差异分数的信度系数可用
如下公式求出:
时测试则是在两个时间段进行测试,同时测试 可能会存在作答疲劳的效应,而延时测试则可 能会存在学习或培训效应。
复本信度
1 定义
2 计算方法
测验复份A
计算公式
最短时距
测验复份B
r r
tt
X 1X 2

2 1
X X X X / n
1 2 1 2
(1)
X ( X ) / n X ( X ) / n
2 X
T
E
2 X
定义2:信度是被试团体真分数与实得分数 2 rXX TX 相关系数的平方 定义3:信度是一个测验X(A卷)与它的任意 一个平行测验(B卷)的相关系数 rXX XX
相关主题