当前位置:文档之家› 戴海崎《心理与教育测量》(第3版)课后习题(第10章 目标参照测验——第12章 智力测验(上))【圣

戴海崎《心理与教育测量》(第3版)课后习题(第10章 目标参照测验——第12章 智力测验(上))【圣

第10章目标参照测验
1.请根据表10.3中专家评定结果的平均数对表中14道题目的内容效度进行评定,并决定题目取舍。

答:从表10.3的结果中,可以直接分析每一道题目的内容效度并进而决定题目的取舍:(1)若以中数为基础进行分析,表中第2、7、14题均是针对目标内容l而编制的,经专家评定,这三题所测内容均和其目标内容之间具有完美的匹配(等级评定中数均为5);同理,第4、12、5、11题的内容效度亦得到很高的评价。

因此,这七道题目无疑可以原封不动地保留下来。

再看,第1、3、6、9题所测内容与其目标内容之间的匹配程度分别被评定为较好(中数为3)或很好(中数为4),说明这四题也还是可取的,只需根据专家意见略作修改即可,最后,第8、13、10题的内容效度一般(中数为2)或较差(中数为1),说明这三题没有能够很好地反映出其欲测的目标内容,内容效度很低或根本不具备内容效度,一般需作较大的修改或删除。

(2)若以均值为基础进行分析,得到的结果与上述以中数为基础进行分析的结果是十分类同的。

(3)为了增加参加评定的专家们之间的一致性,也可根据每位专家在所有题目上所评等级与中数间的差异量来决定专家的取舍。

如表所示,第二位专家在所有题目上所评等级与各中数间的差异之和为24,说明该专家的评定结果与其他8位专家之间具有较大的差异,因此可以不考虑这位专家的意见,只保留8位专家的评定结果,在此基础上得到均值和中数等统计数据并进一步决定题目的取舍。

2.目标参照测验的题目区分度可以通过哪些方法来确定?
答:测验项目的区分度一般采取两类指标:难度差值和相关系数。

(1)难度差值
①掌握组——未掌握组鉴别指数(D)
a.分别计算掌握者和未掌握者两组在某项目上的平均通过率,记为P A和P B,则该项目的鉴别指数为:K=P A-P B。

b.鉴别指数D的大小,可以直观反映出该项目在多大程度上对掌握者和未掌握者作出了区分。

D值从-1.00到+1.00之间变化,越接近于+1.00,题目区分度越高。

②个人获得指数(D IG)
a.采取前测—后测方法,可获得在前测中错误回答某项目而在后测中能够正确回答的被试人数比例,此即该项目的个人获得指数,其值在0至+1.00之间变化,其大小直接反映了经过教学活动之后受益的被试比例。

b.由于D IG只考虑到前测中失败而在后测中通过的被试,却没有考虑到在前测中通过而在后测中反而失败的被试,因而其值不会出现负值,这使它所能反映的问题少于一般的区
分度指标,因此其应用也受到限制。

(2)相关系数
以相关系数为指标的区分度在-1.00至+1.00之间变化,当其值为负时,应检查题目的问题所在,予以修改或删除;当其值为正时,越接近于1,题目越有效;当其值为0时,题目不具区分力,一般不予保留,但在纯粹目标参照测验中应视该题所测内容在内容范围中的重要性而决定其取舍。

3.目标参照测验的信度与效度为何不适宜以相关系数为指标?
答:(1)目标参照测验的信度不适宜以相关系数为指标的原因
①信度是指测量结果的一致性或稳定性。

任何类型的测验,都应该保证测验结果的信度。

在常模参照测验的信度评估中,通常是以相关系数作为信度指标,相关程度越高,信度就越高,测验越可靠。

②然而,由于以相关系数表示的测验信度的高低在很大程度上受到受测者团体异质性的影响,即被试异质性越高,测验分数分布就越广,从而相关系数越高,测验信度相应也就越高,因而,这些信度指标在目标参照测验上的应用价值就不免受到怀疑:目标参照测验的目的一般不在于鉴别个体差异,而在于了解个体在所测内容上的掌握水平。

③因而在大多数情况下,被试团体在目标参照测验上的分数分布比较集中,如高中毕业会考,一般来讲,绝大多数考生都能达到所要求的水平。

这样一来,若用相关系数作信度指标,由于其受到分数分布的影响,那么即使测验本身具有较高的稳定性和一致性,所得的信度系数也会很低。

可见,通常以相关系数所表示的信度指标在目标参照测验上是不太适用的。

(2)目标参照测验的效度不适宜以相关系数为指标的原因
①测验的效度是任何一个测验的质量好坏的最重要的指标,因而,效度分析在目标参照
测验的质量评估中同样占据重要地位。

目标参照测验的效标关联效度分析方法与常模参照测验中所介绍的方法在具体实施中没有太大差异,其不同之处主要在于统计指标上。

以相关系数所表示的效度指标在目标参照测验上是不太适用的。

②如在效标关联效度中,常模参照测验一般用测验与效标间的相关系数作为测验效标关联效度的指标,而相关系数大小受到分数分布的影响,不适用于目标参照测验,因而有人提出以“决策效度”来评估目标参照测验的效标关联效度。

4.试比较目标参照测验与常模参照测验的异同。

答:(1)两者的不同点
①定义不同:所谓目标参照测验,是根据某一明确界定的内容范围而缜密编制的测验,并且,被试在测验上所得结果,也是根据某一明确界定的行为标准直接进行解释的;常模是根据标准化样本的测验分数经过统计处理而建立起来的具有参照点和单位的测验量表。

常模参照测验是以常模为参照标准的测验,即将被试的得分与常模相互比较,从而确定其在被试群体中的位置。

②测量目的不同:目标参照测验关注的是个体是否达到某个特定的标准;而常模参照测验比较关注于个体在特定群体中所处的位置。

③适用范围不同:目标参照测验更多的运用于教育测验或技能培训等方面;而常模参照测验更多的适用于心理特质、人格等方面的研究。

④用来衡量信效度的指标不同:目标参照测验用决策信度来表示信度系数,而常模参照测验用相关系数来表示信度;在目标测验中,结构效度很少涉及,但是在常模参照测验中,结构效度是重要的参考指标。

(2)两者的相同点
①在衡量指标上,难度两者都用通过率来表示,并且在内容效度的评定方面,两者也都大致相同。

②对于目标参照测验的分数解释,有时并不排除同时采用一些常模参照测验的分数解释方法。

目标参照测验和常模参照测验虽然是两种不同的测验模式,但它们并非互不相容,当人们既对被试在测验中的绝对水平感兴趣,同时又想了解被试的成绩在其所处团体中的相对位置时,该测验便兼具了目标参照测验和常模参照测验的性质,对其测验分数,则既可以采取上述方法来解释,同时又可以采取常模参照测验的方法给出其百分等级等有关相对位置的信息。

5.试分析内容范围的界定在目标参照测验的标准化过程中的重要性。

答:任何一种测验的编制,其前期工作不外乎为测验目的的确定,测验内容的界定以及测验编制计划的设计。

一个测验的内容范围包括所欲测量特质中蕴含的全部行为,它可以非常大,也可以非常小。

内容范围的界定在目标参照测验的标准化过程中的重要性主要表现为:(1)内容范围具有边界。

当其边界得到明确界定时,研究者就可以判定什么行为属于这一内容范围,而什么行为却超出了这一范围。

(2)每一内容范围内容均可分为几类,每一类中又可分为更细更小的类,当每一类的内容及其在此内容范围内的相对重要性确定以后,内容范围就有了明确的结构。

而当一个内容范围具有了明确的边界和结构时,人们便认为此内容范围得到了明确界定。

6.试分析分数分界点在目标参照测验的质量评估中的作用。

答:目标参照测验是参照某一明确界定的行为标准进行解释的,这一标准就是测验分数的分界点,亦称切割分数线,或称及格线。

从以下几个角度分析分数分界点在目标参照测验
的质量评估中的作用。

(1)根据分数分界点,可以将被试进行分类,通常分为“及格”和“不及格”两类。

在这种分类过程中,分界点的确定是至关重要的。

(2)就目标参照测验本身而言,分数分界点并非必需。

可以用“被试掌握了测验的内容范围的百分之多少”来解释被试的分数,而不必在测验分数这一连续体上寻找某个切割点,进而将被试断然分为两类:掌握者或非掌握者。

一般来讲,人们倾向于认为知识的学习是一个连续的过程,知识的掌握也只是一个程度的问题,因而从理论上说并不存在可以清晰辨别的掌握者或“非掌握者”。

这使得分数分界点的确定成为测量学家们争议最大,存疑最多的问题。

(3)在目标参照测验的实际应用中,分数分界点的确定却是无法逃避的问题。

在教育领域,常常需要根据测验结果来判断:“某学生是否达到了升一个年级所要求掌握的最低知识技能水平”,从而对该学生“升级”或“留级”,“毕业”或“肄业”等作出决策;在专业领域,也常需要根据资格或水平考试结果来判断考生是否达到从事特定专业工作所需的最低水平,从而作出是否给予颁发合格证书的决策。

在这些实际需要中,人们不得不去寻找一个最低标准,一个分数分界点或及格线,将考生分为及格或不及格两类。

而且,这一分界点的确定科学与否,直接决定了最终决策的正确与否。

7.试析题目内容效度与目标参照测验的内容效度间的联系。

答:内容效度是指测验题目对有关的内容或行为范围取样的适当性,即编制测验时所选定的测验题目,是否代表了所要测的心理特点。

题目内容效度与目标参照测验的内容效度间的联系可从以下几个方面进行分析。

(1)目标参照测验注重被试在其所测内容范围内的掌握程度,因而测验本身的题目组。

相关主题