当前位置:文档之家› 5心理测量 第五章 经典测验理论——信度

5心理测量 第五章 经典测验理论——信度

Spearman-Brown公式要求:两半测验的 方差齐性。(方差F检验,方差齐性检验)
二、估算信度系数的方法
在数据达不到这一要求时(方差不齐性) 卢仑/卢龙Rulon公式:
rXX =1-Sd2/ Sx2
弗朗那根Flanagan公式:
rXX =2[1-(Sa2+ Sb2) ] / Sx2
如果该测验的标准差是15,信度系数是 0.84,那么他智商的真实得分范围是多少?
四、信度系数的作用
3、比较不同测验分数的差异 测量标准误和测验信度在评价两个测验
分数是否有明显差异时也非常重要。 通过差别分数的标准误,可以比较两个
人不同分数的差别和一个被试在两个同 类测验上的差别
四、信度系数的作用
多个测验分数加总的合并分数
分数合成后,信度倾向于提高
测验间的相关越高,合成信度越高
rss
1
k
k (krii ) (k 2 k )rij
rii 平均测验信度 rij 平均测验相关
k 测验数目
三、特殊的信度问题
4、分量表的信度 有些量表是测量单一心理特质、心理内
容的,可计算全量表的信度系数 有些量表由多种分量表构成,应计算各
典型信度系数 0.95 0.90 0.85
0.80
0.75 0.70 0.65 0.60 0.55 0.50
信度系数的意义
测验类型
解释
测量误差几响乎没有影
能力、智力、成就
高到中等的信度
人格测验和态度、兴 趣等一些等级量表
课堂测验
中到低的信度
投射测验
低信度 真分数和误差对测验
四、信度系数的作用
2、解释个人分数 信度系数可以更加精确的解释个人分数,根据
四、估算信度系数的方法
Kuder-Richardson库德-理查森公式,适合 0、1计分
K-R20 当题目难度接近时,每个项目的通过率应基 本相等,我们就不用逐个题目计算通过率
K-R21 难度:某题目上,答对人数和总人数的百分比
被试 01 02 03 04 05 06 07 08 09 10
100
100
100
03
9
10
81
100
92
04
6
6
36
36
36
05
10
10
100
100
100
06
7
8
49
64
56
07
5
4
25
16
20
08
7
8
49
64
56
09
9
9
81
81
81
10
4
4
16
16
16
∑X=75
∑Y=78
∑X2=601 ∑Y2=658 ∑XY=627
二、估算信度系数的方法
估计重测信度时,应注意以下几点: 重测时间间隔 重测信度测量的心理特性必须是稳定的 两次实测的间隔期,被试所测得的心理特
C10*20=92378
信度估计 0.64 0.68 0.82 0.79 0.88 0.81 0.82 0.72 0.71 0.74
二、估算信度系数的方法
b、同质性信度 (homogeneity reliability)
同质性信度主要反映测验能够测量相同 内容或特质的程度,或者说所有测验题 目得分之间的一致性。
α系数来表示,使用范围广泛
被试 题目1 题目2 题目3 题目4 题目5 题目6 总分Xt Xt2
01
3
4
3
2
1
4
17
289
02
6
3
4
5
4
6
28
784
03
1
3
1
2
4
5
16
256
04
6
2
2
1
5
3
19
361
05
5
3
1
2
4
2
17
289
∑X
21
15
11
12
18
20
97 1979
∑X2
107
47
31
38
74
90
分量表的α系数 如果抽取其中部分分量表的题目组成新
的测验,必须重新计算信度
四、信度系数的作用
1、评价测验 rXX=1.00,理想化的 智力、能力倾向、成就,0.90以上; 人格、兴趣、态度,应0.80-0.85。 当rXX<0.70,不能用,或扔,或重编 当rXX≥0.70,可用于团体间的比较; 当rXX≥0.85时,可用于鉴别个人。
一、什么是信度?
信度(Reliability)是指测量结果的一致性或 稳定性。信度的大小用信度系数来表示
定义1:一被测团体的真分数变异数(方差) 与观察分数的变异数之比。
定义2:一被测团体的真分数与观察分数的 相关系数的平方。
定义3:一个测验X与其平行测验X’的相关 系数。
二、估算信度系数的方法
5
-3
9
3
3
4
3
0
0
4
4.5
7
6.5
-2
4
4
4.5
3
2
2.5
6.25
5
6
7
6.5
-0.5
0.25
6
7
9
9
-2
4
7
8
5
4
4
16
8
9
10
10
-1
1
9
10
8
8
2
4
∑D2=44.5
被试 评分者1 评分者2 评分者3 评分者4 等级和R R2
01
1
2
1
2
6
36
02
3
1
2
1
7
49
03
5
3
3
4
15
225
04
4
5
例子:某被试在韦克斯勒智力测验中言语智 商为102,操作智商110,这两个分数都是 100为平均数,15为标准差的标准分数( IQ=100+15Z)。言语测验和操作测验的 分半信度分别为0.87和0.88,那么他的操作 智商是否显著高于言语智商?
五、影响信度的因素
一、测量过程 1、主试:不按规定施测、给予协助、制造紧
Spearman-Brown公式的通用形式是这 样的:
rXX=nrhh / {1+(n-1)rhh } 其中n为测验题目增加或缩减的倍数, rhh是计算相关得到的测验的信度, rXX是校正后测验的信度。
五、影响信度的因素
1225
1296Βιβλιοθήκη 1260∑X=382∑Y=374 ∑X2=14624 ∑Y2=14014 ∑XY=14311
二、估算信度系数的方法
分半之后,每半测验的题目只相当于原测验 的1/2,也就是说,样本数少了一半,信度 偏小,需要修正
斯皮尔曼-布朗( Spearman-Brown)公
r r 式:rXX=2 hh /(1+ hh )
三、特殊的信度问题
把整个时限分成四等分,测验完 成后,把被试在第一、第四两个 时段的分数相加,第二第三时间 段的分数相加作为两半得分,计 算相关系数,并用斯皮尔曼—布 朗公式校正。
三、特殊的信度问题
2、差异分数Different scores
受测者在两个测验的分数的差值(D) D=X-Y( D=后侧-前测) 通常用于反应进步幅度
质方面没有获得过学习和训练 注意提高被试的积极性
二、估算信度系数的方法
2、复本信度 平行测验信度 parallel form reliability 对一组被试用两个复本测验(平行测
验)施测,计算积差相关系数,就是复 本信度。
被试 测验A(X) 测验B(Y)
X2
Y2
XY
01
8
9
64
81
72
张气氛等 2、施测情景:噪音、通风、光线、测验工具 二、被试 1、单个被试:生理心理因素 2、被试团体:异质团体
五、影响信度的因素
三、测验工具 1、测验项目的代表性 2、测验项目的同质性程度 3、测验的难度 4、测验的长度 四、心理特质的特点 五、不同的信度估计方法
五、影响信度的因素
二、估算信度系数的方法
4、评分者信度 主观题时要考虑评分者信度。 如果是两个评分者,计算等级相关
系数。 如果是多个评分者,需计算
Kendal肯德尔和谐系数
被试 01 02 03 04 05 06 07 08 09 10
甲评分者 转换等级 乙评分者 转换等级 等级差D
D2
1
1
2
1
0
0
2
2
6
5 0.5 0.5 0.25
题目5 0 0 1 0 1 0 0 0 1 1
4 0.4 0.6 0.24
题目6 0 0 1 0 1 0 0 0 1 1
4 0.4 0.6 0.24
四、估算信度系数的方法
克伦巴赫( Cronbach)α系数 非0、1计分,如人格测验、态度测验 0、1计分的测验同样可以采用 大多测验采用克伦巴赫( Cronbach)
四、估算信度系数的方法
b. 间隔一段时期进行第二次施测: 其相关系数既反映测验形式上的变 化,也反映时间上的变化,这种相 关系数称为稳定性与等值性系数。
从数值上,稳定性与等值性系数应 既小于稳定性系数,又小于等值性 系数。
相关主题