浅析语言测试中信度与效度两者之间的关系语言测试在语言教学中处于中心地位,是从属于应用语言学这一学科的。
在过去语言测试在应用语言学中处于边缘地位,而在长达三十多年的发展中,语言测试现已发展成为一个相对独立的学科,已经在学术上占有了一席之地。
通过语言测试教育者可以及时发现学习者学习上存在的不足之处并在日后的教学过程中加以正确引导,也可以衡量教学任务和教学大纲的执行情况,但是这些都是基于科学的语言测试能够得到良好的反馈情况,反之,如果是一套不科学的语言测试就很可能对学习者做出错误的判断从而影响学习效率,所以科学的语言测试无论是对受教育者还是对教育者来说都是非常重要的。
一套设计比较科学的测试应该是具有信度,效度,难度和区分度四点特征,信度与效度是难度和区分度的基础,同时也是语言测试的两大根本要求,只有正确认识了信度与效度两者之间的关系才能寻找出一个科学的方法使得语言测试更加科学准确。
信度指的是测量的一致性,一个实验或测试的信度指它在重复测量时产生同样结果的程度,也就是说测量的稳定性是否一致。
影响信度的因素很多,其不仅存在于考试过程中的各个环节,也存在于阅卷的过程中,如试卷中的试题长度偏长,项目种类多,那么测试的信度就会提高,反之则会降低,考试分数集中于某一点或某一个区域时信度也会有所降低;考试期间考生时间充裕那么估算能力考试的信度也相对较高等等,这些都是存在于考试过程中各个环节的部分举例,在阅卷过程中阅卷者自身的信度和阅卷者之间的信度等问题也是影响信度的因素之一,如在评阅主观性的题目时(作文,口语等),阅卷者在评分时就具有很大的主观色彩,而不同的阅卷者掌握的主观的评分标准在评阅主观性试题时,不容易取得一致,也会使得测试的信度不稳定。
效度指的是我们所获的证据在多大程度上支持我们根据分数所做出的推断,也就是考试是否检测到了它所要检测的东西,是否达到了它的预定目标。
效度共分为三种不同的类型,其不同类型的效度测试有各自不同的测试着重面,内容效度测试的目的是为了了解测试者在一些实际环境中是如何运作的,如果测试的样本能够充分代表总体,那么测试在内容上就是有效的,反之效度则不高;预测效度和共时效度都是属于与标准有关的效度,预测效度是标志测试者将来能力的标准,如通过摸底考试分班,共时效度是指一个测试结果与另一个同时使用的标准的结果的关系;构想效度是指要考察一个测试者在多大程度上和我们根据某一理论所作出的预测是否一致,也就是说验证的是我们所做的假设是否有效。
信度和效度是语言测试中的两个最重要的方面,两者之间既相互依存又相互对立,可以说二者是存在于对立统一的一个整体中。
语言测试是以语言能力为测量目标的,而语言能力又是抽象的,是通过具体的语言行为体现出来的,很难直接测量,因此在语言测试的目的是通过对受试者语言行为样本的测量结果来推测受试者的语言能力,在语言测试中效度反映所测试的语言行为和语言能力之间的关系,信度则是说明考试结果与语言行为的关系,没有信度只有效度的语言测试并不能真实反映应试者的语言能力,没有效度只有信度的语言测试也是毫无意义的,由此可见,信度和效度不仅在语言测试中扮演着重要的角色,而且二者之间的关系也是相互依存,密不可分的。
信度与效度在语言测试中二者是缺一不可的,这是两者之间的统一性。
但是另一方面,信度与效度在一定程度上又是相互对立,相互矛盾的,两者具有相互排斥的作用。
首先是量和质之间的矛盾,量的测量容易保持高信度,但是语言测试要实现效度,这就要求质的测量,量的测量要求测量对象必须是可数的,而我们所测量的语言不仅是语言形式结构的运用,而且还包括不可数不可见的语言运用能力,因此从本质上来讲,信度与效度之间就是对立的,矛盾的。
如果语言测试偏重信度,那么测试就可以设置为定量型,但忽略了效度;反之测试设置为定性型,那么就忽视了效度。
其次是有限的语法和无线运用之间的矛盾,一种语言的语法总是有限的,如果将它作为语言测试的目的,很容易保证语言测试的信度,但是语言测试又不能仅仅测试语言的语法,也要测试运用语言的能力,语言运用的能力又是不可见不可数的,将其作为语言测试的目标能力就很难去把握信度,因此这就是信度与效度的又一大矛盾。
最后是抽象的行为和具体的行为之间的矛盾,行为是目标能力的表征,如果把言语行为置身于没有真实语境的情况下,这种行为便是抽象的,语法规则越抽象,其概括性就越强,概括性强,抽样的外推性就越强,那么测试的可信度就高;反之,如果把言语行为置身于真实语境的情况下,那么这种行为就是具体的,行为越具体,作为抽样的外推行就越欠缺,那么信度自然也就不高,但是语言的测试的效度就会相应高很多。
关于语言测试中信度与效度之间的矛盾并不是只有这三点,应该有很多矛盾,如两分判断和连续判断的矛盾,分割法和整体法的矛盾,单维观和多维观的矛盾等等,但在论文中只参考课本罗列了三种说明论点即可。
语言测试中信度和效度存在着多方面的矛盾,在语言测试中应该如何正确处理两者之间的矛盾便成了需要解决的问题,查询资料后发现现在有四种不同的处理方式,分别是保证高效度,忽略信度;保证高信度,忽略效度;消极妥协和积极平衡,用信度高的形式测试效度高的内容,但是在这四种处理方式中都存在不同程度的问题,在目前的语言测试中采用的最多的方式是积极平衡,从而在科学的发展中不断在积极探索新的方法去完善语言测试中的不足。
在信度和效度难以
兼得的情况下,我觉得语言测试应首先考虑效度要求,然后在此基础上再追求信度的提高。
参考文献:
齐沪杨,陈昌来主编的《应用语言学纲要》
外语教学与研究出版社《语言测试的设计与评估》
上海外语教育出版社《语言测试要略》
温俭,杨华《论语言测试的效度与信度》。