当前位置：文档之家› 教育测量学02段教材

教育测量学02段教材

Rxx
1
S
2 E
SE = Sx√1－rSxX2x
（五）测量的标准误
Rxx1S来自2 ES2 X
测量标准误可以通过一次测验结果及信度估计得到，公式如下：
SE = Sx√1－rxx
式中，SE为测量标准误，Sx 为所得分数的标准差，rxx 为测验的信度。
第二节、信度系数的计算
一、稳定性系数（重测信度）跨时间的一致性）
用同一种测验在不同时间对同一组受测者前后施测两次，再计算两次测验分数之间的相关系数，即得到重测信度。所得信度系数称为稳定性系数。
测验A1 适当时距测验A2
公式：
测
被试
验 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
x1 16 15 13 13 13 11 10 10 10 9 9 8 8 7 6 x2 16 15 16 14 12 11 13 12 10 11 11 9 10 8 7
以真分数理论(True Score Theory)•为核心理论假设的测量理论及其方法体系，统称为经典测验理论 (Classical Test Theory，CTT)，•也称真分数理论。
真分数的操作定义是：经过无数次测量所得的平均值。
测量分数、真分数和误差分数的分布假设
学生
A B C D E F G H I J 总数平均数方差标准差
四、论文式测验的信度系数（克伦巴赫α系数）
适用于非0，1记分的一种内在一致性系数。其公式如下：
α=[K/(K-1)][1-（∑Si2/ Sx2）]
其中Si2为每一项目分数的变异数，其他字母意义与K-R20 相同。
上面这些公式均不适用于速度测验，因为只有每个人都做完全部题目时，题目的变异数才是准确的。
1、测量分数=真分数+误差分数
X T E
2、测量分数的方差等于真分数的方差与误差方差之和
S
2 X
ST2
S
2 E
S
2 X
S
2 E
ST2
（四）测量误差的含义及种类
测量误差：
与测量目的无关的因素造成的测验结果的不一致或不准确绝对误差： E X T 相对误差： E *100%
T
最大相对误差： E *100% X
第二章测验的信度
内容提要
第一节、信度的意义
一、信度及其统计学原理二、信度对于教育测量的意义
第二节、信度系数的计算
一、稳定性系数二、等值（稳定性）性系数三、内部一致性系数四、论文测验的信度系数五、阅卷者评分的信度系数六、目标参照测验的信度系数七、速度测验的信度系数
题目内部的一致性主要受两方面变异的影响：
1．内容的一致性；
2．所研究的行为的同质性。
同质性信度的计算
1．库德—理查逊公式：
（1）K-R20公式： rkk=[K/(K-1)][（Sx2-∑piqi )/ Sx2)]
式中K表示整个测验的题数，pi为项目通过率，qi为项目未通过率，Sx2表示测验总分的变异数（方差）。
两个版本连续施测称为等值性系数
测验A1 最短时距测验B1 如果两个版本间隔一段时间施测称为稳定性等值系数.
测验A2 适当时距测验B1
适合于学绩测验，人格测验（没有平行测验）的复本难以编制。
三、内部一致性信度
内部一致性信度是指测验内部的同质性程度。 1、分半信度 2、同质性信度
适合于既无复本可用，又不能重测，只测了一次的情况。
（2）K-R21公式，适用于各题难度相近的情况：
rkk=[K/(K-1)][( Sx2-K piqi)/ Sx2]
pi为题目的平均通过率，qi为1-pi 。 K-R21公式计算较为简单，但求得的信度系数有低估的倾
向，当题目难度相差大时偏差更大。公式K-R20和K-R21只适用于0，1记分的测验。
1. 被试在这期间自身发生了变化 2. 第一次测验的经验对第二次测验产生影响 (如第一次测验产生了焦虑就会影响第二次测验) 3. 记忆的作用 4. 耗时耗精力,被试不好找 5. 适用于人格测验、社会态度调查等，不适合学绩测验
二、等值性系数（复本信度）
用一种测验有A、B两个等值版本施测于同一组受测者，再计算两个复本得分之间的相关系数
测量分数 = 真分数 + 误差分数
3
5
-2
17
15
+2
16
20
-4
23
25
-2
27
25
+2
25
25
0
35
25
+10
26
30
-4
33
35
-2
45
45
0
250
250
0
25.0 120.2 10.9
25.0 105.0 10.2
0 X T E
15.2 S
2 X
ST2
S
2 E
3.9
（三）实得分数、真分数和测量误差的关系
测验 ∑x
x1
158
x2
199
统计值
∑x 2
S
1784 10.53 2.83
2147 11.67 2.65
∑x1x2 1946
采用重测信度需注意之处
两次测验的时间应该是合理的,即既不能太长又不能太短。
相隔太长的时间被试在所测量的特征上可能会发生变化，相隔太短有记忆的效应。
重测信度的使用局限性
第三节、提高测验信度的方法
一、影响测验信度的因素二、提高测验信度的方法
第一节信度的意义
一、信度及其统计学原理
（一）信度：
指测验的一致性（可靠性）或可靠的程度；
信度是一被试团体的真分数方差与实得分数方差之比（操作定义）
（
rXX
）ST也2 即
S
2 X
(
) rxx
1
S
2 E
S
2 X
（二）真分数的含义
五、评分者信度
考察评分者信度的方法是：随机抽取相当份数的试卷，由两位或多位评分者按记分规则分别给分，然后根据每份试卷的分数计算其相关系数，即得评分者信度。
一般要求在成对的受过训练的评分者之间平均一致性达到0.90以上，才认为评分是客观的。
1.评分者为两个人时
若是连续变量的评分，且分布是正态则计算皮尔逊积差相关系数（可用计算机直接计算），若是等级评定或虽是等距或等比的数据但分布非正态，则计算斯皮尔曼等级相关。
1、分半信度
（1）斯皮尔曼—布朗公式
rxx=2rhh/（1+ rhh）
其中，rhh为两半分数的相关系数， rxx为测验在原长度时的信度估计。
此法假设：两半测验分数的变异性相等，但实际资料未必符合此假设。
当两半不等值时，即上述假设不满足时，可采用下面两公式之一：
2、同质性信度
所谓同质性指的是测验内部题目的一致性。即测验里各题得分为正相关（测验里各题得分相关为零叫异质）。

e商务文档

教育测量学02段教材

相关文档推荐：