当前位置:文档之家› 教育测量与评价

教育测量与评价

教育测量与评价文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)《教育测量与评价》习题(一)填空题1. _桑代克_的论着《精神与社会测量导论》一书标志着教育测量理论的诞生,泰勒领导了着名的八年研究并提出“行为目标评价模式”,最早提出了教育评价的概念,被称为“当代教育评价之父”。

2. 按照测量的精确程度,教育测量量表从低级到高级分为称名量表、顺序量表、区间量表/等距量表和比率量表。

3. 某道论述题满分12分,所有考生在这道题上的平均得分为分,则此题的难度为。

4.教育基本理论研究、教育测量与评价科学研究以及教育发展理论研究已成为现代教育科学研究的三大领域。

5. 教学工作评价的内容包括对教师的备课、上课、批改作业、课外辅导、命题考试等教学工作基本环节的评价。

(二)判断题(√)1. 测验的信度受许多因素的影响。

一般来讲,增加测验的长度,可以提高试题取样的代表性,因而有助于提高测验的信度。

(√)2. 标准分数本身是关于原始分数的一种线性变换,因此,标准分数不改变原始分数的分布形态。

(×)3. 假如某学生在期中语文统考中卷面分数为85分,又知该学生所在年级中有60%的学生成绩低于85分,则该学生的百分等级为51。

(×)4. 等距变量具有等级变量的特征,要求连续数量之间的差距相等,亦即具有相等的单位。

因此,等距变量可以作加减乘除运算。

(×)5. 教育评价的主要功能就是甄别和选拔,通过各个层次的教育评价可以监督教师的教学工作和学生的学习活动,确保学校教育教学工作的正常进行。

(√)6. 测验试题的难度影响着测验分数的分布。

(×)7. 现代测量理论是在经典测量理论的基础上发展起来的,修正了经典测量理论的不足,所以现代测量理论可以完全代替经典测量理论。

(√)8. 发展性教学评价认为面面俱到的课不是好课,只是“教教材”,没有“用教材教”的课也不是好课。

(三)简答题1. 常见的指标权重分配方法有哪几种【答题要点】:常见的指标权重分配方法包括:(1)关键特征调查法;(2)两两比较法;(3)专家评判平均法;(4)倍数比较法;(5)Q分类法。

答题时一是要阐述清楚这五种方法各自的内涵是什么,二是简单说明这五种方法的操作步骤。

相关内容可参考第七章“制定教育评价表的一般方法和步骤”中第二节“教育评价表的构成及编制”。

2. 衡量测验质量的四个指标分别是什么【答题要点】:(1)衡量测量质量的四个指标分别是信度、效度、难度和区分度。

(2)在答案中需阐述清楚这四个指标分别的定义是什么。

(3)一个良好的测验应该具备恰当的难度和区分度,具备较高的信度和效度。

(4)指出这四个指标对于测量质量的意义,即前两个指标主要是对整个测验而言,后来两个指标主要是对测量的项目而言。

相关内容可参考第三章“教育测量与评价的质量特性”。

3. 在现代社会中,具有健康人格的学生具有哪些特征【答题要点】:在现代社会中,青少年学生所具有的健康人格应是:能客观地认识自我和外部世界;开放的;对所承担的学习和其他活动有胜任感;充分发挥自己潜能;对父母、朋友有显示爱的能力;有安全感;喜欢创造;有能力管理自己的生活;有责任感等。

相关内容可参考第八章“学生评价”中第五节“学生人格心理发展的测评”。

4. 制定教育评价表需要遵循哪些原则【答题要点】:教育评价表是根据教育教学的特性编制而成的,它由评价指标、评价项目(条目)、评价标准、评定等级、指标权重等构成。

它是进行教育测量与评价的工具,为了使评价的结果更为可靠,需要对教育评价表进行更深入的研究,制定教育评价表应遵循以下的原则:(1)科学性与导向性原则(2)完备性与独立性原则(3)发展性与整体性原则(4)操作性与可测性原则(5)可行性与可比性原则作答时需对以上五个原则分别展开阐述,说明其各自内涵。

相关内容可参考第七章“制定教育评价表的一般方法和步骤”中第一节“制定教育评价表的意义与原则”。

(四)论述题1. 现代学生评价具有那些特点如果您是一名评价者,您将从哪些方面评价学生【答题要点】:(1)在回答现代学生评价的特点是,注意结合以下几点进行阐述,注意把握它们的内涵并结合实践进行说明。

强调了评价功能的形成性。

重视评价内容的全面性。

重视评价类型的多样性。

(2)现代学生评价的这些特点也反映在现代学生评价的原则与操作方法上。

现代学生评价的基本原则包括:发展性原则、全面性原则、明确性原则和过程性原则。

(3)可从综合的角度出发,提出学生课业发展的内容框架。

这个内容框架,除了学生的健康与体能发展目标外,还可包括如下九个方面:学生个体一般性发展学科理论知识和学科能力或技能的发展思维技能与品质的发展研究与学习技能创新精神与实践能力的发展态度、观念与兴趣的发展欣赏与审美的发展适应与习惯的发展个体独特性的发展阐述上面九个方面时,同样需要把握实践对它们的内涵进行阐述。

2. 简述教师评价的方法,并重点论述如何处理不同评价方法之间的关系。

【答题要点】:教师评价方法包括:(1)教师自评(2)学生评教(3)同行评议(4)观察与会谈(需阐明每种评价方法的具体含义、优势等以及如何处理不同评价方法之间的关系)1. 信度的定义信度,简单地说就是测量结果的可信程度,指的是测量结果的稳定性或一致性程度。

2. 信度的估算方法(一)重测信度重测信度也叫稳定性系数,指的是用同一个量表,对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数。

(二)复本信度复本信度指的是两个平行测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数。

(三)同质性信度同质性信度也叫内部一致性信度指测验内部所有题目间的一致性程度。

题目间的一致性有两层意思:其一是指所有题目测的是同一种心理特质;其二是指所有题目得分之间都具有较高的正相关。

(1)分半测验指的是将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。

反映了测验内两半题目间的一致性。

用斯皮尔曼—布朗公式加以校正。

(2)库德—理查逊信度适合于测验题目全部为二分计分题。

两种公式。

(3)克龙巴赫系数当测验题型较多,并且都是二分计分题时,估计测验信度可采用克龙巴赫系数。

(4)荷伊特信度1941年提出用方差分量比来估计测验内部一致性的方法。

(四)评分者的信度定义:指的是多个评分者给同一批被试的答卷进行评分的一致性程度3. 提高测验信度的方法(1)适当增加测验题目的数量(2)测验的难度要适中(3)测验的内容应尽量同质(4)测验的程序应统一(5)测验的时间要充分(6)评分要尽量做到客观化、减少评分误差(7)应试者参加测验的动机水平、积极性、疲劳程度也会影响测验分数,从而影响信度。

引起应试者参加测验的强烈动机,提高其积极性,使其保持旺盛的精力,都对提高测验信度有一定作用。

4. 效度的定义效度(validity)指的是一个测验或量表实际能测出其所要测量的特性的程度,记为rxy。

顾名思义,效度就是一次测量的有效程度。

效度分为:内容效度、效标关联效度和结构效度。

5. 内容效度、效标关联效度和结构效度(1)内容效度内容效度是指测验目的代表所欲测量的内容和引起预期反应所达到的程度。

也就是测量内容的代表性程度。

在编制测验时,内容效度是一个相当复杂和不易解决的问题。

以成绩测验来说,固然要求测验题目能代表所学习过的全部内容,但仅仅在形式上做到这一点还不能保证足够的内容效度,因为学习成绩的高低要从学习内容的巩固程度、理解程度和应用能力几种行为反应去考察,如果测验题目大多是只需牢记教材就可以回答的问题,那么,对全面测验学生的成绩这一目的来说,内容效度仍然不够高,也就是说,还没有完全测验到所想测量的特性和功能。

(2)效标关联效度效标关联效度又可称为经验效度或统计效度,是以测验分数和效标之间的相关系数来表示测验的效度的高低的。

效标就是足以显示测验所欲测量的特性的变量或足以显示测验所欲预测的特性的变量,作为检定效度的参照尺度。

效标关联效度又可分为同时效度和预测效度。

同时效度是指测验与当前效标之间的关联程度;预测效度是指测验与将来的效标之间的关联程度。

例如,用全国高考的成绩作为效标来检验高中毕业会考的成绩,计算两者之间的相关系数就是会考的同时效度;而用大学一年级的成绩作为效标来检验高考的成绩,计算两者之间的相关系数就是高考的预测效度。

(3)结构效度所谓结构效度,是指一个测量能实际测量出理论上的构念或心理特性的程度。

它的目的在于用心理学的概念来说明分析测验分数的意义,也就是说从心理学的理论观点就测验的结果加以解释和探讨。

这里的结构的含义是心理学理论所涉及的抽象而属假设性的概念、特性或变量,如智力、焦虑、机械能力倾向、成就、动机等。

6. 提高效度的方法(1)控制系统误差(2)精心编制量表(3)规范测验程式(4)扩充样本的容量和代表性(5)合理处理效度和信度的关系(6)适当增加测验的长度7. 信度与效度的关系信度高是效度高的必要但非充分条件。

测验的效度受制于它的信度,即效度系数不会大于信度系数的平方根。

8. 难度难度指被试完成测验或量表时所遇到题目的难易程度记为P。

难度的计算(1)难度对测验的影响影响测验分数的分布状态。

影响测验的鉴别能力。

(2)影响题目难度的因素考查知识点的多少考查能力的复杂程度或层次的高低考生对题目的熟悉程度命题的技巧利用经验判断或者通过预测调整难度9. 区分度区分度指测验或量表题目区别被试水平能力的量度,记为D。

区分度的高低直接影响到测验的信度和效度。

具体关系如下:(1)提高区分度可以达到理想的测验信度;(2)难度适中,可使区分度达到最大值。

区分度的计算(1)相关法。

区分度的实质是题分与总分的相关。

计算方法:点双列相关系数(适应用于0\1计分的题目或二分变量,总分是连续变量)二列相关系数(适用于两个变量都是正态连续变量,但其中一个变量被人为分为两类)积差相关系数(适应于非二分变量项目)(2)高低分组法。

1. 确定评价指标的方法提出初拟评价指标的方法主要有以下几种:(1)头脑风暴法:利用头脑积极思维,进行智力碰撞,激发智慧灵感,从而提出评价指标。

根据人数的多少,可分为个人头脑风暴法和多人头脑风暴法。

还可以分为直接头脑风暴法和质疑头脑风暴法。

直接头脑风暴法是指按照统一要求从正面论述自己的观点;质疑头脑风暴法是连续召开两个会议,第一个会议按直接头脑风暴法要求进行讨论,而第二个会议则对第一个会议提出的指标进行质疑。

(2)因素分解法:将评价指标按照评价对象本身的逻辑结构逐级进行分解,把分解出来的主要因素作为评价指标。

分解出来的因素,从高到低逐层次缩小内涵,越往下层次的指标越明确、越具体、范围越小、越可以观测。

相关主题