当前位置:文档之家› 第二章 信度

第二章 信度

被 试 1 2
18
3
23
4
21
5
17
6
18
7
20
8
17
9
16
10
13
11
14
12
13
13
12
14
8
15
8
奇数 20 题 (X)
偶数 20 题 (Y)
22
19
22
18
15
14
17
15
16
14
12
10
7
8
(2)库得-理查逊(Kuder&Richardson)系数(采 用0,1记分时 )
KR20
n ( n-1
第二讲 信度
内容: 1.信度的含义 2.信度的计算方法 3.影响测验信度的因素 4.提高测验信度的方法
(一)什么是信度 信度是指测量结果的稳定性或可靠性程度。 一个好的测量必须具有较高的信度,其结果就不应 随工具的使用者或使用时间等方面的变化而发生较 大的变化。 信度可以理解为:信度指实测值(观察分数)和真 值(真分数)相差的程度;信度指两次重复测量或 等值测量之间的关联程度。
3.内部一致性系数 (1)分半信度 在测验无复本且只能施测一次的情况下,通 常用分半法估计信度,即将测题分成对等的两 半,根据各人在这两半测验的分数,用皮尔逊 积差相关公式计算其相关系数,作为信度指标。 分半信度考察的是两半题目之间的一致性, 故这种信度系数也称内部一致性系数。计算分 半信度仍然可用积差相关方法。
也可用下列公式:其中X、Y为同一 被试的两个分数,Sx、Sy为两组分 数的标准差。X、Y为两组分数的平均 数,N为被试人数。
∑ XY/N-XY rxy = SxSy
例一
• 用一个算术四则的速度测验10个小学生,得分记 为X,为了考察测量结果的可靠性,于1个月后 再测一次,得分记为Y,问测验结果是否可靠? • 序号 1 2 3 4 5 6 7 8 9 10 • X 74 71 80 85 76 77 77 68 74 74 • Y 82 75 81 89 82 89 88 84 80 87 解:有题中数据可求得:∑ X=756 ,∑ Y=837, ∑ XY= 63369 ,∑X2 = 57352 ,∑Y2 =70245 代入公:
在使用重测法计算稳定性系数时,应 注意以下问题:
• 1、信度的取值范围为[0,1],当信度值 较大时,说明前后两次测量结果比较一 致; • 2、两次测验之间的时间间隔要适宜。应 由测验的性质、测题类型、测题数量和 被试特点所决定; • 3、重测法适用于速度测验而不适用于难 度测验; • 4、应注意提高被试者的积极性。
式中X1 、X2为每一被试奇数题得分和偶数 题得分,N为被试人数。
为什么要对分半信度进行校正?
• 将一个测验分成两个假定相等而独立的部分 来求其两组分数的相关系数,要用斯皮尔曼 —布朗公式予以校正。 • 因为测验的长度(题目数)对信度的高低有 一定的影响,测验越长,信度越高。用分半 法求信度系数,实际上相当于把整个测验长 度减小一半,求得的相关仅是半个测验分数 相关,求出的信度必然低于整个测验的信度。 因此,要用斯皮尔曼-布朗公式予以校正,藉 以估计整个测验的信度。
该定义有两点需要注意:
第一、信度指的是一组测验分数或一 列测量的特性,而不是个人分数的特性; 第二 、真分数的变异数是不能直接 测量的,因此信度是一个理论上构想的概 念,只能根据一组实得分数做出估计。 信度涉及的主要问题是对测验分数意 义的概化能力,即从一次测量来推论总体 能达到何种正确程度。
实得分数、真分数和测量误差之间有如下关 系: X=T+E T真分数、X观察分数、E 误差分数 SX 2 =S T2+SE2 SX 2 表示观察分数的方差;S T2 表示真分数 的方差;SE2表示误差分数的方差
施测
时间间隔
再施测
相关系数
重测信度图式
计算使用皮尔逊积差相关系数公式:其中X、 Y为同一被试的两个分数,N为被试人数。
N XY X Y
r
xy
2
ቤተ መጻሕፍቲ ባይዱ
[ N X ( X ) 2] [ N Y ( Y ) 2]
2
计算出相关系数后,需要进行检验。其 中自由度df=N—2,根据积差相关系数界 值表,将求得值与临界值进行比较。
信度系数要达到多高才可以接受呢?
一般能力与学绩测验的信度系数在0.90 以上; 人格测验的信度系数通常在0.80 以上。 当rxx < 0.70时,不能用测验对个人作评价,也不能在团体 间作比较;当 rxx ≥0.70时,可用于团体间比较; 当rxx ≥ 0.85 时,可用于鉴别个人。
信度的数学定义:一组测验分数中真分数 方差与实测分数方差的比率。信度一般在0 和1之间取值,rxx越接近 1,信度越高。
校正公式: (a)斯皮尔曼—布朗公式 rtt=2rX1X2/(1+ rx1X2) 其中,rX1X2为分半相关系数, rtt为校正 信度系数。 此法假设:两半测验分数的变异性相等, 即平均数、标准差、难度、区分度、分布形态 以及内容都相同,但实际资料未必符合此假设。 当两半不等值时,即上述假设不满足时, 可采用下面两公式之一:
重测信度的误差来源 1. 测验本身:测验所测的特性本身就不 稳定,例如情绪。 2. 被试方面:成熟、知识的发展并非人 人都等量增长,且练习因素、记忆效果也存在 个体差异。 3. 施测情境:偶发因素的干扰,如计时 错误,情绪波动,健康状况,动机变化等。 重测信度高,说明分数受被试状况和测 验情境变化影响小。这里题目取样并不影响重 测信度。
(b)弗朗那根公式: rxx=2[1-(Sa2+Sb2)/Sx2] 其中Sa2和Sb2分别表示两半测验分数的方 差,Sx2表示测验总分的方差。 (c)卢伦公式: rxx=1- (Sd2/Sx2) 其中Sd2表示两半测验分数之差的方差, Sx2表示整个测验分数的方差。
一个测验向 15 名被试试测,被试在奇偶分半测验上 的得分如下表所示,计算测验的分半信度系数。
计算重测信度的几个假设: 1.所测量的特性必须是稳定的; 2.遗忘与练习的效果相同; 3.两次施测期间被试的学习效果没 有差别。
使用重测信度的优缺点:
1.(优点)能提供有关测验结果 是否随时间而变异的资料,可作为预测 受测者将来行为的依据。 2.(缺点)容易受练习和记忆的 影响,前后两次施测间隔的长短必须适 度; 第一次尝试所发现的错误也可能导致 第二次反应的变化而增加误差变异。
真分数:所谓真分数就是一个测量工具在测 量没有误差时,所得到的纯正值。其操作定 义是:经过无数次测量所得到的平均值。 真分数的定义表明,一个人在一个测验上所 得的分数,即是它的真分数的函数,也是测 量误差的函数,用公式表示如下: X=T+E 这里 X为实得分数或观测分数,T是假设 的真分数,E是测量误差。
等值测验应符合的条件 等值测验可避免重测法的缺点,但所使用 的必须是真正的复本。复本应符合以下条件: 1. 各份测验测量的是同一种心理特性; 2. 各份测验具有相同的内容和形式; 3. 各份测验的题目不应有重复的地方; 4. 各份测验题目数量相等,并且有大体相等 的难度、区分度; 5. 分数分布(平均数和差异度)大致相等。
St 2 piqi
St
2
)
N是测试题数,Pi是第i题答对率,qi是第i题答错率, St2为样本考生总分的方差
KR21
n ( 1 n-1
X(

n
X)
nSt2
)
10名被试在一个测验上的得分如下表(答对得1分, 答错得0分),试估计被试反应的一致性程度。
题目 被试 得分
• 原始分数计算公式:
r
xy
N XY X Y [ N X 2 ( X ) 2] [ N Y 2 ( Y ) 2]
• 将计算结果与相关系数检验表比较
假设对10名学生用两个等值的A1与B1测验施测,测 验实得分数分别为X和Y表示,测验结果如下表,求 该测验的信度。
(二)信度的计算 1、重测信度(再测信度)-稳定性系数 指的是同一个量表对同一组被试施测两次所得 结果的一致性程度。 即测验A1时距(几分-几年)再测验A2 此种信度能表示两次测验结果有无变动,反映 测验分数的稳定程度,故又称稳定性系数。 其大小等于同一组被试在两次测验上所得分数 的相关系数,一般采用皮尔逊积差相关的公式 来计算。
2.复本信度-等值性系数 根据一组被试在两个平行(等值)测验上的 得分计算相关系数。 最短时距 即 测验复份A 测验复份B
因为它反映的是两个测验之间的等值程度, 故又称等值系数。
施测A型
最短时距 相关系数
施测B型
复本信度图式
计算方法 ∑ XAXB/N-XAXB rxx = SASB 式中XA 、XB为同一被试在两个测验复份A、 B上的分数,XA 、XB为A、B两型测验的平 均分数,SA 、SB为A、B两型测验的标准差, N为被试人数。
注意事项: 1. 两个测验必须在项目的内容、形式、 数量、难易、时限、指导语等方面相同或相似; 2. 两次测验的时间间隔要适当,若太短, 由于测验太相似被试可能厌倦,若太长可能又 会因新的学习而产生干扰。
使用复本信度的局限
1. 只能减少但不能完全消除练习和记忆 的影响;
2. 由于第二个测验只改变了题目的具体 内容,已经掌握的解题原则,可以很容易地迁 移到同类问题。 3. 对许多测验来说,建立复本是十分困 难的。
r xy
[N
N X 2 (
XY

X [N
Y Y 2 ( Y ) 2]
X ) 2]
10*63369

756*837
[10*57352 ( 756 ) 2] [10*70245 ( 837 ) 2] 0.48
相关主题