科技信息 2008年第 17期 SCIENCE &TECHNOLOGY INFORMATION我们知道 , 测试是教与学的向导 , 而为了让它发挥出向导的作用 , 一份好的试卷是必不可少的 , 而且是至关重要的 . 一般情况下 , 我们判断一份试卷的好坏的主要标准是:是否有信度、效度、区分度、实用性、全面性、公正性及后期效应。
其中, 以信度和效度最为重要。
一、语言测试的信度语言测试的信度, 又叫可靠性, 是指考试结果的可靠性和稳定性。
即看学生的分数是否稳定, 如果同一个学生做同一套试卷 , 做的几次的结果都是一致的 , 那么我们说这次考试是有信度的; 反之 , 如果分数忽高忽低就说明信度不高 , 那么表明考试的信度不高。
信度可以分为复测的效度、判卷的效度和每一个测试项目的效度。
同一学生不管考多少次, 所得的分数都是一样, 那么就说这个分数有复测的可靠性。
影响分数的一个很重要的因素就是判卷人, 在判卷过程中, 不同的判卷人对同一试卷也会做出不同的反映; 同一个人在不同的时间对同一试卷给的分数也是不一样的。
试卷不仅要达到其整体的可靠性, 而且每一题都必须能达到这个标准, 那才是一份有信度的试卷。
与能力无关却又会影响试卷信度评判的因素有很多,例如:1. 考试条件差, 天气热、考场周围太吵闹等。
2. 考试条件不一样。
同一个学生在安静与吵闹的环境中做同一份试卷,其结果不一样。
3. 监考施策。
不同的老师对考生的松与严, 看见考生作弊或违纪不勒令禁止。
4. 题目要求不清, 学生根本无法弄清题义, 也就无法真实的反映考生的水平。
5. 保密工作做的不好, 泄题事件发生。
6. 评分。
主观测试的评分常常因评卷人而异, 难以达到较高的信度; 客观试卷的评分不受评卷人的影响因此信度较高。
7. 样品数量太小, 样本不足。
8. 身体及心理状态不好等等, 这些因素都会影响到信度。
因此, 为了提高信度, 我们必须对症下药, 采取各种措施。
例如:提供统一规范的考试环境、规范监考、题目必须做到明了易懂等等。
通常, 用来检测信度最常用的有三种方法:1. 考后复测法。
在考试后再让学生做同一套试卷, 如果几次考试的结果是一致的, 这份试卷就是有信度的。
但是在实际操作过程中, 学生在不断的学习提高, 而且记忆因素也会影响复测的结果,因此用这一方法很难检测考试的信度。
2. 平行测试法。
设计试卷时, 设计两份难度一样的试卷, 在不同的时间给学生做, 如果结果一致, 则有效。
但是, 在设计试卷时我们无法确信两套试卷在难度及内容上是否完全相同,因此操作起来很困难。
这种方法常用在补考试题的设计中。
3. 分半法。
设计一套试题让学生做, 然后把结果分为奇数和偶数题进行分析评判, 并算出它们之间的相关性。
二、语言测试的效度效度, 即有效性, 是指试题是否考了出题者想考的内容或多大程度上考了出题者想考的内容。
效度是语言测试的最重要的一个指标, 或者说是语言测试的基本出发点, 效度不高的测试是没有意义的。
效度可分为以下五种:1. 表面效度。
表面效度就是说, 一套试卷看起来是否合适, 像不像一套试卷。
具有表面效度的测试容易引起人的兴趣。
Alan Davies 曾说, 表面信度是可以达到的, 但却不是必要的, 表面的但却又是有用的。
他可以让别人相信试卷是有效的。
2. 内容效度。
内容效度是指是否符合大纲的要求, 是否与测试目的有关。
例如:老师教了一个学期想看看学生对于所教内容掌握得如何, 但是在选题时, 所出的题目与学生学的内容无关, 则这套试卷没内容效度。
在有内容效度的测试中考查的语言要素和技能都能有所体现。
成绩测试和诊断测试尤其要注意符合教学内容。
3. 同期效度。
同期效度就是一次测试的结果与另一次时间相近的有效测试的结果相比较,或同教师对学生的评估相比较而得出的系数。
4. 预测效度。
它是指试卷结果是否, 或者在多大程度上可以预测将来的考试成绩。
5. 结构效度。
即从理论上说, 试卷的各个部分是否出的有道理。
结构效度测试是说一套测试要以一定的语言学习理论为依据。
Alan Davies 在论述语言测试的信度时说,信度的种类与运用有关。
例如:成绩考试既要表面效度又要内容效度; 能力测试要有表面效度、结构效度和内容效度特别依靠内容效度; 水平测试必须要有表面效度、预测效度和同期效度。
语言测试的种类不同, 对各种效度的要求也就不同。
语言潜能测试多基于某种语言行为理论和语言学习理论, 因此重视编制效度。
水平测试强调共时效度和预示效度。
成绩测试和诊断测试要受教学大纲的限制, 因此首先要看内容效度。
提高效度的常用方法有:明确考试的目的、决定与目的相反的考试内容、决定考试的方法以及增加考试的信度四种。
三、信度和效度的关系通常, 我们把信度和效度看成是不同的, 但是却在测试中两者又是具有相互联系的特征。
尽管效度是最重要的特征, 但是信度却是效度必不可少的条件。
但在涉及到测试的方法时, 两者的差异就变的模糊了。
Campbell , Lyle F. Bachman 和 Fiske 都曾对信度和效度的关系做过经典的论述。
Lyle F. Bachman 认为:在研究影响分数的因素时, 信度和效度是互为补充的两个方面。
信度回答的是引起考试结果不一致的原因有多少是由测量误差所引起的; 然而, 效度则是找出考试结果中那些导致有效的不一致的因素, 即考试结果有多少是由考生的某种特殊语言能力的程度而引起的。
因此, 我们可以说信度是考查考试结果哪些是由想考的内容以外的因素引起的, 效度则是看考试结果的差异哪些是由语言能力所引起的。
信度和效度有密切的联系, 但它们的关系是单方面的。
效度是信度的前提, 但有信度的试卷可能是高效度的, 也可能是效度较低的, 即效度较高不能保证信度也一定较高。
一项测试有信度 , 它的效度有可能高 , 也有可能低; 但是如果一项测试没有信度, 则这次测试必然是无效的。
信度差效度就差, 但效度差不一定信度就差。
信度是效度必不可少的条件, 试卷如果没有信度根本不可能对测试进行(下转第 214页语言测试的信度和效度及其关系曹桂花(孝感学院外国语学院湖北孝感 432000【摘要】语言测试是对语言教学的评价。
通过对语言知识或语言技能及语言能力的测试, 老师可以了解教学效果, 了解到学生对知识的掌握程度, 看到他们的进步与不足, 有利于教学的调整。
要达到这个目的, 就必须有好的试卷, 我们一般从信度、效度、区分度、实用性、全面性、公正性及后期效应来对试卷进行评价。
本文讨论了其中极其重要的两个标准信度和效度以及它们之间的关系。
【关键词】语言测试; 信度; 效度The relationship between validity and reliability of language testingCao Gui-hua(school of foreign language, Xiaogan University【 Abstract 】 Language testing is a way to value the language teaching. From language testing, the teachers can know whether the students master what they have taught, the students ’ weaknesses and strengths and improvement, which is helpful to the language teaching. To achieve this purpose a well-designed paper is needed. Usually, we think good qualities of good test include:validity, reliability, discrimination, practicality, and backwash effect. This paper is mainly validity and reliability and the relationship of these two.【 Key words 】 language testing ; validity ; and reliability○ 高校讲坛○182科技信息 2008年第 17期 SCIENCE &TECHNOLOGY INFORMATION(上接第 182页有效的解释。
例如:我们希望对学生进行一次期中测试, 检查一下学生半学期以来对所学知识的掌握程度。
假如试卷本身设计得不合理, 有些题目好学生不会做而基础较差的学生却做得出来, 或者由于外界的条件较差, 非常吵闹, 气温很高, 或者评卷人的主观评卷等, 都会影响测试的信度, 那么的测试结果就根本达不到检测学生的目的, 因为评判的条件没有达到, 此次测试就是无效的了, 也无从判断试卷本身的效度。
只有我们确信测试是有效的了之后, 对效度做出判断才是有意义的。
在确信了测试是有效的之后, 我们才可能从内容、结构共时、预测和表面等几个方面来判断测试是否达到了考试的目的,即是否考了想考内容。
又如, 我们想了解学生的写作能力, 可是给他们考的题型却是多项选择题、听力和阅读, 根本没有设计写作的题型。
这样的考试虽然是有效的, 但却偏离了考试的初衷, 因此不能很好的检测学生的写作能力, 因此此次考试无效的。
反之, 我们确信试卷的效度很低, 即没考想考的内容, 那么我们说其信度可能高也可能低, 因为影响信度的因素主要是我们上文提到, 与效度没有多大关系。
需要指出的是, 高效度和高信度是测试者的目标, 但是这只是一种理想, 一项测试既有高信度, 又有高效度是不可能的。
四、结论语言测试的信度及效率问题一直是语言测试专家关注的问题, 也是教师所关心的。
了解了测试中的信度和效度这两个最重要的标准及其关系后, 试卷的设计者在设计试卷时一定要注意试题的本身的科学性, 紧扣考试的目的; 而监考者在测试的过程中也应尽量减少来自于外界的影响测试的效度和信度的因素,以期测试能更好的服务于教学。
【参考文献】[1]李筱菊 . 语言测试科学与艺术 [M]. 湖南教育出版社 ,1997.[2]刘润清, 韩宝成 . 语言测试和它的方法 [M]. 外研社 ,2000.[3]Davies, Alan. 1990. Principles of Language Testing . Oxford:Basil Blackwell.[4]Bachman, Lyle F. 1990. Fundamental Consideration in Language Testing . Oxford University Press.[5]Bachman, L. F. &Adrian S. Palmer . 1996. Language Testing in Practice. Oxford University Press.作者简介:曹桂花(1979— , 女, 湖北荆州人, 孝感学院外国语学院讲师, 英语语言文学硕士。