什么是信度?简单地说信度就是指测量数据和结论的可靠性程度,也就是说测量工具能否稳定地测量到它要测量的事项的程度。
我们可以举例说明信度的问题:如果想知道某人的体重,我们可以叫两个人来估计,一个人的估计为150镑,另一个人的估计为300镑,那么我们就可以认为,叫别人来估计体重是非常不可信的方法。
如果用磅秤,连续测量两次的结果都是相同的,因而我们可以说,在测量体重方面,用磅秤的方法要比叫人来估计更可信。
我们可以用信度系数来表示信度的大小如何计算信度我们知道在进行测量时,误差是难免的,这就使得真实值和测量值之间是不可能完全一致。
我们可以这样来表示真实值和测量值之间的关系。
X=T+B+E T表示真实值,B表示偏差即系统误差,E表示测量误差即随机误差。
由于系统误差很难分解,因而有些书中的分解式将系统误差包括在真实值之中,因而X可以简单地概括为X=T+E对于测量误差E,一般假定他的期望值是0,却与真实值相独立,在此假定下,可以证明: E(x)=E(T)实得分数和真分数的总体均值相等。
σ2x=σ2T+σ2E实得分的方差等于真分数的方差与误差方差之和。
信度一般规定是真分数的方差在总体方差中所占的比例,即:信度系数Rxx=σ2T/σ2X=1-(σ2E/σ2X)信度系数越大,表明测量的可信程度越大。
信度类型(一) 重测信度这种方法通常是重复同样的测量来检验信度信度系数可以用相关系数来表示。
假如我们第一次测量时的观测值是X,第二次的观测值是Y,那么重测信度就等于X与Y的相关系数。
但重复测量时,我们要注意两次测量的时间间隔要恰当。
如果时间间隔太久,可能会发生一些变故,影响到被调查者的态度,那么前后的测量就会有很大的差异。
(二)复本信度复本是针对原本而言的,它是原本的复制品。
对一项调查的问题,让被调查者接受问卷测量,并同时接受调查问卷的副本的调查,然后根据结果计算原本和复本的相关系数,就得到复本信度。
(三)折半信度通常是在无副本且不准备重测的情况下,我们就用折半信度来计算信度系数。
举例来说,如果有一份问卷,其中有十个问题涉及到女性歧视现象。
利用折半信度时,可将是个问题随机分成两组,每组有五个问题,然后根据每组的测量结果来计算两组的相关系数,就是折半信度,Rhh。
但整个问卷的信度需要用校正公式来得到:Rxx=2Rhh/(1+Rhh) (变异性相等)Rxx=2(1-(Sa2+Sb2)) (两部分的变异性不等)。
(四)评分者信度这种方法在测量工具的标准化程度较低的情况下进行的。
不同评分者的判分标准也会影响测量的信度,要检验评分者信度,可计算一个评分者的一组评分以另一个评分者的一组评分的相关系数。
效度什么是效度?效度就是正确性程度,即测量工具在多大程度上反映了我们想要测量的概念的真实含义,效度越高,即表示测量结果越能显示出所要测量的对象的真正特征。
类似于信度系数的公式,效度系数一般规定为与测量的目的相关的分数的方差在总方差中所占的比例,即效度= σ2Tx/σ2x=1-(σ2T0+σ2E)/ σ2x,Tx是通过分解真分数得到的。
我们将T分成两部分,一部分是我们想要测量的特质Tx,另一部分是与测量目的不相关的T0, T=Tx+T0 。
效度类型效度是一个多层面的概念,它是相对于特定的研究目的和研究侧面来言的。
因而,检验效度必须针对其特定的目的功能及适用范围,从不同的角度收集各方面的资料分别进行。
检验效度的方法大体有三种。
(一)内容效度考察内容效度旨在系统地检查测量内容的适当性,并根据我们对所研究的概念的了解去鉴别测量内容是否反映了这一概念的基本内容。
检验内容效度就是检验由概念到指标的经验推演是否符合逻辑,是否有效。
内容效度实质上是一个判断问题。
K.D贝利在《社会研究方法》中指出,内容效度必须考虑两个主要问题:(1)测量工具所测量的是否正是调查人员所想要测量的那种行为(2)测量工具是否提供了有关的那种行为的适当样品(二)准则效度准则效度是指被假设或定义为有效的测量标准,符合这种标准的测量工具是可以作为测量某一特定现象或概念的效标。
当我们对同一现象的或概念进行测量时,我们可以使用多种的测量工具,每种测量方式与效标的一致性就成为准则效度。
(三)建构效度考察建构效度就是要了解测量工具是否反映了概念和命题的内部结构,这种方法常常在理论的研究中使用。
由于它是通过与理论假设相比较来检验的,因此建构效度也被称为理论效度。
信度与效度的关系(1)信度低,效度不可能高。
因为如果测量的数据不准确,也并不能有效地说明所研究的对象(2)信度高,效度未必高。
例如,如果我们准确地测量出某人的经济收入,也未必能够说明他的消费水平。
(3)效度低,信度很可能高。
例如,即是一项研究未能说明社会流动的原因,但它很有可能很精确很可靠地调查各个时期各种类型的人的流动数量。
(4)效度高,信度也必然高。
1、信度是指:测量结果的可靠性和一致性。
因为心理测验通常测量人的行为,行为会由于各种各样的原因,因时、因事、因地而产生变动,这些因素有些是偶然的,有些是固有的,人在完成心理测验时的行为也会受上述因素的影响,从而使测验结果与真实结果不完全一致,所以我们要用信度来衡量测验的可靠性和一致性。
2、信度的操作化定义:(1)误差理论认为:一个人的测验分数X是由真实分数(T)和误差(E)两部分构成的,公式是X = T + E.(2)因此信度就被定义为:一组测量分数的真实方差与实得方差的比,或者是指真实方差占总方差的百分比。
公式为:rxx = 1-SE 2/SX 2(3)根据统计学理论,真实方差与实得方差的比是一个相关系数的平方,所以我们把这种相关系数的平方叫做信度系数。
(4)计算公式为:rxx = ST2/SX23、由于误差的来源信度的可分为:这种分类是基于信度的传统定义-真分数理论。
(1)重测信度:考虑的误差来源是时间取样。
(2)复本信度:考虑的误差来源是内容取样。
(3)分半信度:它考虑的误差来源也是内容取样,它与复本信度的差别是:分半信度考查一个测验内容的两半题目测量的是否是同一个心理特点行为。
(4)同质性信度(内部一致性系数):考虑的是测验内容是否异质。
(5)评分者信度:考虑的误差来源是评分者间的差别。
4、信度的表示方法:(1)信度系数和信度指数:1 信度系数:rxx = rx2T = S2T/S22 信度指数:rXT = ST/SX(2)测量标准误:SE = SX 1-rxx5、信度的意义:(1)信度系数可以解释为样本测验分数的总方差中有多少比例是真分数方差,也就是测验的总变异中真分数造成的变异占百分之几。
它直接告诉我们测量的误差有多大。
(2)测量的标准误可以告诉我们有多大可能性真实分数在某一分数范围内,并且可以预测实得分数再测时可能的变化情况。
6、信度的作用:(1)解释预测个人分数的意义。
(2)解释真实分数与实得分数间的关系,明确告诉我们测验误差大小。
(3)新编的测验信度应高于原有的同类测验或相似测验。
(4)下结论说某测验比较可靠,必须是依据情境的,经多次证实的。
(5)它是确定测验好坏的一个指标。
一般的原则是:1 当rxx< 0.70时,测验不能用于对个人作出评价或预测,而且不能做团体间比较。
2 当0.70≤rxx<0.85时,可用于团体比较。
3 当rxx ≥0.85时,才可以用来鉴别或预测个人成绩或作用7、重测信度:有时也叫稳定性,主要针对时间变量。
(1)重测信度采集数据得方法是:对同一组被试间隔一定的时间重复测试一次。
(4)重测信度的计算方法是积差相关法,因而rxx就是皮尔逊的积差相关系数。
(7)重测信度的时间间隔选择依测验性质和目的而定,如果测验是用于长期预测,则测量间隔长一些。
对儿童的智力测验一般是两周到四周为宜。
对成年人,间隔可到半年,很少超过6个月。
(13)使用重测信度应注意:不是所有测验都可以计算重测信度。
并且重测信度只是反映了随机误差的影响,而不是反映被试心理特点的长期变化。
8、复本信度:又叫等值性系数。
(1)数据采集方法是:给被试施测两个内容等值但题目不同的测验,求两组数值的相关。
计算方法常见的也是积差相关法。
(2)复本信度的高低反映了两个互为复本的测验等价的程度,而不是反映一个测验本身受随机误差影响的大小。
复本信度的高低关键取决于复本测验的选择,因而施题目取样问题,或者说是测验的内容取样问题。
(3)复本信度优于重测信度的地方是:避免了重测带来的记忆效应和练习效应;可用于长期追踪研究前后测量;减少了作弊的可能性。
(4)复本信度的缺点:有些测验的复本很难找到;有些测验因正迁移效应使测验性质改变;如测量的内容很容易受练习的影响,复本信度也无法清除这种练习效应。
(5)重测复本信度,即再不同的时间里施测两个等值的测验(复本),得到的相关就是重测复本信度,也叫稳定等值系数。
它比单一的重测信度或复本信度都要严格、全面一些。
9、斯皮尔曼-布朗公式:rnn = nrtt/1 +(n-13、1)rtt,14、rnn是校正以后的相关系数,15、rtt是实得的相关系数,16、n为rnn对应的测验长度与rtt 对应的测验长度之比。
分半时,17、n = N/(N/2)= 2(N为测验全长),18、所以分半法信度的校正公式是:rxx = 2 rnn/1 + rhh 其中rhh为两半测验的相关系数。
(1)卢伦公式:rxx = 1-Sd2/Sx2 其中Sd2是两半测验分数之差的方差,Sx2为总方差。
(2)从理论上分析,分半信度反映的实际上是两半测验能够测量相同内容或心理特点的程度。
10、内部一致性信度(同质性信度):同质性是指测验的所有题目间性质的一致性,即测的是同一种心理特质或行为。
同质性是测量单一特质的必要条件。
这里讲的同质性是指测验题目得分反映的心理特质一致,同质性的判别标准是:题目间呈高正相关,如果相关很低或是呈负相关,则题目为异质。
(1)库德和里查德森提出的K-R20公式只适合预测题目是二分法计分的。
克伦巴赫α系数适合于非二分法计分的测验的内部一致性信度估计法。
(2)从同质性信度的含义我们不难看出,分半信度是求测验两半之间的一致性或同质性,而同质性是求所有题目间的一致性。
因此分半信度实际上是同质性信度的一种,可以作为测验同质性评价的粗略估计指标。
因为可以根据测验得分来推论或验证某种概念或理论构思,因此同质性信度也是一种构思效度,或叫结构效度,它实际上介于信度与效度之间。
11、评分者信度:有些心理测验的得分不是根据客观的计分系统计分的,是由评分者来给被试打分,因此,这样的测验的可靠性如何取决于评分者评分的一致性和稳定性如何。
评分者信度因评分者人数不同而估计方法不一样。
如果是两个评分者,独立对被试的反应评分,则可以用积差相关来计算,或用斯皮尔曼等级相关法计算。