当前位置:文档之家› 戴海崎《心理与教育测量》笔记和课后习题详解(测量信度)

戴海崎《心理与教育测量》笔记和课后习题详解(测量信度)

第4章测量信度
4.1 复习笔记
一、信度概述
(一)信度的概念
(1)概念
信度是指测量结果的稳定性程度。

若能用同一测量工具反复测量某人的同一种心理特质,则其多次测量的结果间的一致性程度就称信度,有时也称测量的可靠性。

(2)信度的操作定义
①定义1:信度乃是一个被测团体的真分数的变异数与实得分数的变异数之比。

即:
,式中代表测量的信度,代表真分数变异,代表总变异数,即实得分数的变异。

②定义2:信度乃是一个被试团体的真分数与实得分数的相关系数的平方。

即:。

③定义3:信度乃是一个测验X(A卷)与它的任意一个“平行测验”X′(B卷)的相关系数。

即:。

此外,描述测量一致性程度的指标还可以用信度指数(),它实际上是信度系数的平方根。

(二)信度的作用
信度是衡量一个量表质量高低的重要指标之一,信度的作用表现在以下三个方面:
(1)信度是测量过程中所存在的随机误差大小的反映。

(2)信度可以用来解释个人测验分数的意义。

每个人两次测量的分数之差可以构成一个新的分布,这个分布的标准差就是测量的标准误,它是此次测量中误差大小的客观指标。

可以通过标准误对团体中任何一个人的测验成绩做出恰当的解释。

一个测量的标准误可用下式计算:
(式中SE为测量的标准误,为实得分标准差,是测量的信度。


(3)信度可以帮助进行不同测验分数的比较。

来自不同测验的原始分数是不能直接进行比较的,必须转化成标准分数再进行比较。

具体办法是采用“差异的标准误”来进行差异的显著性检验,其公式为:
(式中,S为相同尺度(如T分数的S=10)的标准分数的标准差,和分别是两个测验的信度系数。


二、信度的估计方法
(一)重测信度
1.含义和计算
重测信度是指用同一个量表对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。

(式中x及是第一次测量的实得分及实得分的平均值,y及y是第二次测量的实得分及实得分的平均值,是重测信度)
当信度值较大时,说明前、后两次测量的结果比较一致,测量工具比较稳定,被试的心理特质受被试状态和环境变化的影响较小。

2.使用的前提条件
(1)所测量的心理特性必须是稳定的。

(2)遗忘和练习的效果基本上相互抵消。

(3)在两次施测的间隔时期内,被试在所要测查的心理特质方面没有获得更多的学习和训练。

在报告重测信度时,应说明两次施测的间隔,以及在此期间内被试的有关经历。

(二)复本信度
1.含义与计算
(1)复本信度是指两个平行的测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的皮尔逊积差相关系数。

(2)两个复本测验实施的时间不同,复本信度所表达的含义略有不同:
①如果两个复本测验是同时连续施测的,则称这种复本信度为等值性系数。

等值性系数的大小主要反映着两个复本测验的题目差别所带来的变异情况。

②如果两个复本测验是相距一段时间分两次施测的,则称这种复本信度为稳定性与等值性系数。

稳定性与等值性系数是对信度的最严格的检验,与其他信度系数相比,此种复本信度最小。

2.使用前提条件
(1)要构造出两份或两份以上真正平行的测验。

(平行测验就是用不同的题目测量同样的内容而且其测验结果的平均值和标准差都相同的两个测验。


(2)被试要有条件接受两个测验。

3.使用的注意事项
(1)被试在做第二测验时仍会受到练习和记忆等因素的影响,一些解题的策略等技能技巧也会产生迁移效应。

(2)对于稳定性与等值性系数,在报告结果时,也应报告两次施测的间隔,以及在此间隔内被试的有关经历。

(三)分半信度
1.含义及计算
(1)分半信度是指将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。

(2)分半信度可以和等值性系数一样解释,即可以把对等的两半测验看成是在最短时距内施测的两个平行测验。

此外,由于分半信度描述的是两半题目间的一致性,所以它有时也被称作内部一致性系数。

(3)分半信度的计算方法和等值复本信度的计算方法类似,只不过被试在两半测验上得分的相关系数只是半个测验的信度,还必须用斯皮尔曼—布朗公式加以校正:
式中为两半分数间的相关系数,为整个测验的信度值。

不过,斯—布公式只有在两半测验分数的变异数(和)相等时才能使用。

否则,就应选择下述两个等价的公式之一:
①弗朗那根公式:
式中和分别表示所有被试在两半测验上得分的变异数,表示全体被试在整个测验上的总得分的变异数。

②卢仑公式:
式中表示同一组被试在两半测验上得分之差的变异数,其他符号的含义与式(4.1)中含义相同。

2.使用的前提条件及范围
(1)分半信度通常是在只能施测一次或没有复本的情况下使用。

而且,在使用斯皮尔曼—布朗公式时要求个体被试在两半测验上得分的变异数要相等。

当一个测验无法分成对等的两半时,分半信度不宜使用。

(2)由于将一个测验分成两半的方法很多,所以,同一个测验通常会有多个分半信度值。

(四)同质性信度
1.含义
(1)定义
同质性信度也称内部一致性系数,它是指测验内部所有题目之间的一致性程度。

一句话,同质性信度就是一个测验所测内容或特质的相同程度。

(2)对同质性信度的说明
①当一个测验具有较高的同质性信度时,说明测验主要测的是某一单个心理特质,实测结果就是该特质水平的反映。

②如果一个测验同质性信度不高,则说明测验结果可能是几种心理特质的综合反映,这时,测验结果不好解释。

一种好的办法是把一个异质的测验分解成多个具有同质性的分测验,再根据被试在分测验上的得分分别作出解释。

2.计算及适用范围
(1)公式
其中,K是题目数,为答对第i题的人数的比例,为答错第i题的人数的比例,为测验总分的变异。

此公式是由库德和理查德逊提出的,仅适用于(0、1)记分的测验。

(2)公式
其中,各指标含义与相同,只是p与q分别表示题目的平均通过率和失败率。

此公式只有当所有题目的难度接近时才适用。

(3)克龙巴赫α系数
其中,表示所有被试在第i题上的分数变异,其余指标的含义与相同。

此公式是由克龙巴赫提出的,它不要求测验题目仅是(0、1)记分,可以处理任何测验的内部一致性系数的计算问题。

α值还是所有可能的分半信度的平均值,它只是测量信度的下界的一个估计值。

即,α值大,必有测量信度高;但α值小时,却不能断定测量信度不高。

(4)荷伊特信度
荷伊特提出用方差分量比描写测验内部一致性的方法:设有n名被试参加一有K个项目的测试,测验分数的总变异可分解为被试间变异,项目间变异和人与试题交互作用三部分。

荷伊特认为可用作为被试方差估计值,用作为误差方差估计值,并可用下式作为测验信度的估计值:。

(五)评分者信度
1.含义。

相关主题