当前位置:文档之家› 教育测量学02段教材

教育测量学02段教材


Rxx
1
S
2 E
SE = Sx√1-rSxX2x
(五)测量的标准误
Rxx1S来自2 ES2 X
测量标准误可以通过一次测验结果及信度估计得到, 公式如下:
SE = Sx√1-rxx
式中,SE为测量标准误,Sx 为所得分数的标准差,rxx 为测验的信度。
第二节、信度系数的计算
一、稳定性系数(重测信度)跨时间的一致性)
用同一种测验在不同时间对同一组受测者前后施测 两次,再计算两次测验分数之间的相关系数,即得到 重测信度。所得信度系数称为稳定性系数。
测验A1 适当时距 测验A2
公式:

被试
验 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
x1 16 15 13 13 13 11 10 10 10 9 9 8 8 7 6 x2 16 15 16 14 12 11 13 12 10 11 11 9 10 8 7
以真分数理论(True Score Theory)•为核心理论假设 的测量理论及其方法体系,统称为经典测验理论 (Classical Test Theory,CTT),•也称真分数理论。
真分数的操作定义是:经过无数次测量所得的平 均值。
测量分数、真分数和误差分数的分布假设
学生
A B C D E F G H I J 总数 平均数 方差 标准差
四、论文式测验的信度系数(克伦巴赫α系数)
适用于非0,1记分的一种内在一致性系数。其公式 如下:
α=[K/(K-1)][1-(∑Si2/ Sx2)]
其中Si2为每一项目分数的变异数,其他字母意义与K-R20 相同。
上面这些公式均不适用于速度测验,因为只有每个人都 做完全部题目时,题目的变异数才是准确的。
1、测量分数=真分数+误差分数
X T E
2、测量分数的方差等于真分数的方差与误差方差之和
S
2 X
ST2
S
2 E
S
2 X
S
2 E
ST2
(四)测量误差的含义及种类
测量误差:
与测量目的无关的因素造成的测验结果的不一致或不准确 绝对误差: E X T 相对误差: E *100%
T
最大相对误差: E *100% X
第二章 测验的信度
内容提要
第一节、信度的意义
一、信度及其统计学原理 二、信度对于教育测量的意义
第二节、信度系数的计算
一、稳定性系数 二、等值(稳定性)性系数 三、内部一致性系数 四、论文测验的信度系数 五、阅卷者评分的信度系数 六、目标参照测验的信度系数 七、速度测验的信度系数
题目内部的一致性主要受两方面变异的影 响:
1.内容的一致性;
2.所研究的行为的同质性。
同质性信度的计算
1.库德—理查逊公式:
(1)K-R20公式: rkk=[K/(K-1)][(Sx2-∑piqi )/ Sx2)]
式中K表示整个测验的题数,pi为项目通过率,qi为项 目未通过率,Sx2表示测验总分的变异数(方差)。
两个版本连续施测称为等值性系数
测验A1 最短时距 测验B1 如果两个版本间隔一段时间施测称为稳定性等值系数.
测验A2 适当时距 测验B1
适合于学绩测验,人格测验(没有平行测验)的复本 难以编制。
三、内部一致性信度
内部一致性信度是指测验内部的同质性程度。 1、分半信度 2、同质性信度
适合于既无复本可用,又不能重测,只测了一次的 情况。
(2)K-R21公式,适用于各题难度相近的情况:
rkk=[K/(K-1)][( Sx2-K piqi)/ Sx2]
pi为题目的平均通过率,qi为1-pi 。 K-R21公式计算较为简单,但求得的信度系数有低估的倾
向,当题目难度相差大时偏差更大。公式K-R20和K-R21只适用 于0,1记分的测验。
1. 被试在这期间自身发生了变化 2. 第一次测验的经验对第二次测验产生影响 (如第一次测验产生了焦虑就会影响第二次测验) 3. 记忆的作用 4. 耗时耗精力,被试不好找 5. 适用于人格测验、社会态度调查等,不适合学绩测 验
二、等值性系数(复本信度)
用一种测验有A、B两个等值版本施测于同一组受测 者,再计算两个复本得分之间的相关系数
测量分数 = 真分数 + 误差分数
3
5
-2
17
15
+2
16
20
-4
23
25
-2
27
25
+2
25
25
0
35
25
+10
26
30
-4
33
35
-2
45
45
0
250
250
0
25.0 120.2 10.9
25.0 105.0 10.2
0 X T E
15.2 S
2 X
ST2
S
2 E
3.9
(三)实得分数、真分数和测量误差的关系
测验 ∑x
x1
158
x2
199
统计值
∑x 2
S
1784 10.53 2.83
2147 11.67 2.65
∑x1x2 1946
采用重测信度需注意之处
两次测验的时间应该是合理的,即既不能太长又 不能太短。
相隔太长的时间被试在所测量的特征上可能会发 生变化,相隔太短有记忆的效应。
重测信度的使用局限性
第三节、提高测验信度的方法
一、影响测验信度的因素 二、提高测验信度的方法
第一节 信度的意义
一、信度及其统计学原理
(一)信度:
指测验的一致性(可靠性)或可靠的程度;
信度是一被试团体的真分数方差与实得分数方差之比(操作定义)

rXX
)ST也2 即
S
2 X
(
) rxx
1
S
2 E
S
2 X
(二)真分数的含义
五、评分者信度
考察评分者信度的方法是:随机抽取相当份 数的试卷,由两位或多位评分者按记分规则分 别给分,然后根据每份试卷的分数计算其相关 系数,即得评分者信度。
一般要求在成对的受过训练的评分者之间平 均一致性达到0.90以上,才认为评分是客观的。
1.评分者为两个人时
若是连续变量的评分,且分布是正态则计算皮尔逊 积差相关系数(可用计算机直接计算),若是等级 评定或虽是等距或等比的数据但分布非正态,则计 算斯皮尔曼等级相关。
1、分半信度
(1)斯皮尔曼—布朗公式
rxx=2rhh/(1+ rhh)
其中,rhh为两半分数的相关系数, rxx为测验 在原长度时的信度估计。
此法假设:两半测验分数的变异性相等,但实际资料未 必符合此假设。
当两半不等值时,即上述假设不满足时,可采用下 面两公式之一:
2、同质性信度
所谓同质性指的是测验内部题目的一致性。 即测验里各题得分为正相关(测验里各题得分 相关为零叫异质)。
相关主题