当前位置:文档之家› 第七章 效度

第七章 效度

教案课题:《第七章效度》课型:新授课课时:3学时教学目标:1.了解效度的意义。

2.掌握效度的类型及各种估算方法。

3.了解提高测验效度的方法教学重难点:∙教学重点:效度估算的各种类型,提高测验效度的六种方法。

∙教学难点:效度估算各种类型的计算方法。

教学方法:读书指导法、讲授法、练习法。

教学过程:一、导入:列举效度的意义,激发学生的学习动机。

二、感知:引导学生感知学习内容。

三、讲授:通过具体内容的讲授分析,促进学生进一步理解学习内容。

讲授主要内容如下:一、内容效度(一)内容效度的概念内容效度是指测验内容与预定要测的内容之间的一致性程度。

也可以说是测验题目所涉及的内容对所要测验的全部内容的取样代表性程度。

取样代表性是指测验题目能最大限度地代表欲测的内容范围。

因此,一个测验要具有较高的内容效度必须具备两个条件:其一是测验内容范围明确,即必须明确界定所要测验的内容范围;其二是取样具有代表性,即测验题目对所有测验内容的覆盖面要大。

在理解测验的内容效度时,不要与测验的表面效度相混淆。

表面效度是指从外表直观地看,测验题目与测验目标的一致性程度。

表面效度从严格意义上讲不能算作一种效度的,但在实际测验中却是不能忽视的。

(二)内容效度的估计方法1.逻辑分析法用逻辑分析法估计内容效度,主要是指依据教材内容、课程标准的范围以及教学目标分析测验内容,检查测验内容究竟在体现教材内容和教学目标方面达到多大的程度。

用逻辑分析法估计内容效度实际上是在进行定性分析。

这种方法的缺点主要表现在:没有数量指标来描述教材内容、教学目标与测验试题的一致性程度;内容效度一般采用专家主观性评判,因而很难做到客观、准确,不同判断者的判断标准不同,可能导致批评结果的不一致。

因而,对内容效度的估计必须谨慎,而且对内容效度的估计值也应当一分为二的看待。

2.统计分析法统计分析法主要是采取定量分析手段来描述测验的内容效度,其方法主要有以下几种:(1)克龙巴赫法克龙巴赫曾提出估计内容效度可以用同一教学内容范围的总体中抽取两套独立的测验试题,用这两套测验试题对相同的被试分别进行测验,测验之后求得两次得分的相关系数,如果相关系数大,就可推论内容效度高,若相关系数小,则说明这两套试题中至少有一套测验的内容效度比较低。

(2)评分一致性考查法内容效度的确定也可以计算不同评分者之间评分的一致性程度,即考查评分者的信度。

虽然它代表的是测验信度,但由于来自两个独立的评判者,因此符合程度越高就反映测验的内容效度也越高。

(3)前后测比较法这种方法是,先对一组被试进行前期测验,这一组被试对测验的内容知之甚少,然后对这一组被试进行有关内容的教学与训练,经过一定时间后,再对这一组被试进行后期测验,这样可以看出测验是否测验出课堂上进行的教学与训练的效果。

二、构想效度(一)构想效度的概念构想效度是指测验成绩能够解释心理学理论上的某种结构或特质的程度,构想效度主要适用于心理测验效度的确定。

所谓构想,是指心理学理论所涉及的抽象而属假设性的概念、特质或变量,如智力、能力倾向、行为习惯、成就动机、人格结构等。

(二)确定构想效度的步骤和方法确定构想效度的步骤和方法是:首先根据一定的心理学理论建立某种心理品质的理论结构;然后根据这一理论结构提出有关测验成绩的假设;最后用逻辑和实证的研究由果求因来验证提出的假设。

三、效标关联效度(一)效标关联效度的概念效标关联效度是指测验分数与作为效标的另一独立测验结果之间的一致性程度,一般是用本测验与效标测验去测同一被试得到的两组分数的相关系数表示。

所谓效标,是检验测验效度的参照标准。

效标实际上是奔测验所想测验或要预测的特性或功能,这些特性或功能通常以另一独立测验的结果来表示。

效标关联效度分为两种:1.同时效度同时效度是一种测验的结果与另一大约同时获得的测验结果之间的一致程度,同时效度的高低用两次测验结果的相关系数来估计。

它常用于标准化测验的建立,用它作为检验所建立测验能否成为标准化测验的一种手段。

2.预测效度预测效度是指测验分数与将来的效标之间的关联程度,或者说预测效度是测验是预测被试将来从事某种学习或工作能够达到应有水平的有效程度,预测效度的高低用两次测验结果的相关系数来估计。

预测效度常用于评定原测验的预测功能,在实际中预测效度的高低由预测的准确程度来决定。

效标关联效度的关键是选好效标,一个好的效标必须具备以下几个条件:(1)可靠性,即效标测验必须具有较高的信度;(2)有效性,即效标测验本身必须是有效的;(3)客观性,即效标测验必须尽量客观标准化,力求排除主观偏见,特别是防止效标污染的影响;(4)实用性,即效标应尽量使其用法简单、省时、花费少,讲究经济实用。

预测效度与同时效度都是把测验分数和一种效标分数相比将,用求得的相关系数来表示。

但是,两种效度的意义是有区别的。

同时效度主要用于查明自编测验的效度,以便有效地研究、编制和使用新的测验;预测效度主要是用于评价原测验的预测能力,而且预测效度的效标要在原测验之后隔相当长的时间才能获得。

(二)效标关联效度的计算1.相关法相关法是确定效标关联效度最为普遍的方法。

其基本思想是求得测验分数与效标分数之间的相关系数,所求得的相关系数称为效度系数。

相关法既可以用积差相关公式求相关系数,也可以用等级相关、点二列相关等公式来求其相关系数。

2.分组法分组法是先将效标分数按规定的分数线分组,分成成功组和失败组,然后考查组与组之间原测验分数的差异是否显著。

如果经检验差异不显著,则可认为原测验的效度还未达到要求;如果经检验结果差异显著,就可以认为原测验的效度达到了要求,也可以说原测验的预测效度是较高的。

利用分组法确定预测效度时,若样本容量n 大于等于30,则用大样本Z 检验法,其公式为:nqS npS qX p X qp22Z +-=若n <30,则用小样本t 检验法,其公式为:)11(2)1()1(t 22qp q p qq p p n n n n S n S n qX p X +-+-+--=2-+=q p n n df在这里,p X 为成功组的平均分数;q X 为失败组的平均分数;S p 为成功组的标准差; S q 为失败组的标准差;n p 为成功组的人数; n q 为失败组的人数; d f 为自由的度。

3.预期表法预期表是一种双向列联表,表的左边是原测验分数,表的右边是效标分数,这两种分数都以等级类别排列。

表中间的数字不是绝对数而是相对数,即以原测验得若干分的人数除其中列入各种等级的人数所得的百分数。

预期表从左下角至右上角对角线上的数字越大,其他数字越小,则测验的效标关联效度就越高。

所以,可用从左下角至右上角对角线上的数字所占的百分比表示效标关联效度的高低。

例如,240人在学期开始参加数学推理测验和期末的代数测验成绩所制成的预期表如下表所示。

预期表本例对角线上的数字比较大,可以直观判断效度系数比较大。

我们可以这样确定对角线数字,B A 4060−−→−−−→−)()(,良优,中−−→−+5020与D 、差−→−20E 。

因此效度系数为:%792401902402050204060==++++)(4.命中取舍法当测验是用来作取舍的依据时,其测验有效性的指标就是正确决定的比例。

具体地说,预测与效标之间有四种情况:预测成功而且事实上成功;预测成功但事实上不成功;预测不成功但事实上成;预测不成功而且事实上也不成功。

我们称一、四两种正确的预测为命中,二、三两种不正确的预测为失败,这样,可以计算以下两种指标来表示预测效度的高低。

总预测数目命中失败命中命中总命中率=+=预测成功人数人数预测成功且事实成功的正命中率=以上两种指标的值越大,说明测验越有效。

第二节 提高测验效度的方法 一、控制系统误差考虑测验效度时,假设随机误差足够小而且不变,那么系统误差方差越小,则有效方差就越大,因此达到测验目标的程度也就越大,即效度越高。

所以,效度也就可以定义为有效方差与实得方差之比,即:22vS xS r =由此可知,随机误差方差和系统误差方差都会对效度产生影响。

而事实上,影响测验效度高低的主要因素是系统误差的大小。

比如测验题目和指导语有暗示性、答案组型有规律性等都影响测验效度。

所以,控制系统误差可以提高测验效度。

二、精心编制量表量表是形式和内容都会影响测验长度,所以测验量表在形式上必须表述清楚、明了,排列应由易到难,长度适中,应在形式上就引起被试的兴趣,特别是量表印刷必须清楚而且精美。

测验量表在内容上必须保证测验的目的性,力求测量出所要测量的东西,而且测验项目难度应合适,并保证有足够的区分度,所有这些都有助于提高测验的效度。

三、有效组织测验测验的实施情况对测验的效度有很大的影响。

首先要确保有良好的施测环境(包括物理环境和心理环境)。

其次,在测验过程中掌握好时间,统一测验程序,评分时要客观准确,避免错误。

并且应把握好测验之间的间隔时间,间隔时间的长短一定要按测验目的合理安排。

四、扩大样本的容量扩大样本的容量,可以增加样本对总体的代表性,增加代表性便可以抵消测验的随机误差,使测验更稳定可靠。

扩大样本容量可以扩大有效分数的方差,从而使效度22vS xS r =增大。

所以,要提高测验效度应扩大样本容量。

一般而言,样本容量应大于30才可靠。

另外,为了提高测验效度,获得样本的方法也是很重要的,要根据测验的目的选择最能代表研究总体的样本,比如,通过随机抽样获得的随机样本,代表性强,这也有助于提高测验的效度。

五、合理处理信度与效度的关系测验效度要受测验信度的限制,事实上,效度的最大值受它的信度所制约,有公式:信效r ≤r 。

比如说,一个测验的信度是0.49,那么它的效度不会高于0.7,即0.70.49=。

由此可知,信度是效度的必要条件,虽然信度高的测验效度不一定高,但效度高的测验,信度一定比较高。

还应注意效标信度与信度的关系。

如果效标的测量误差较大,则信度就较低,其效度也会就较低。

如果选一个不大可靠的测验成绩作效标,效度系数是不会大的。

如果所选用的效标信度系数不理想,则可按下列公式校正,以免影响测验结果的效度。

YYXY 'XYr r =r在这里,'XY r 为校正后的效度系数; XY r 为效度系数; YY r 为效标的信度。

六、适当增加测验的长度测验的题目数即长度对测验的效度有一定的影响。

因为测验的题目数增加,可提高试题的代表性,从而提高测验的信度。

又由于效度系数的最大值与测验信度有关,因此增加试题的数目也能提高测验的效度。

不过,增加测验长度对信度的影响大于对效度的影响。

关于测验长度与信度、效度的关系,如表所示。

从上表可以看出,当测验题数增加到6倍时,信度系数增加到2.4倍,而效度系数只增加到1.55倍;当测验长度增加到48倍时,信度增加到3.18倍,而效度只增加到1.78倍。

相关主题