当前位置:文档之家› 教育测量与评价

教育测量与评价

第一章、教育测量与评价的学科发展教育测量与评价一.教育测量1、测量:根据法则给事物赋予数量。

(史蒂文斯)测量:客观事物及其属性;所依据的规则或方法;数量化的结果。

2、教育测量:广义:对于教育领域内的事物或现象,根据一定的客观标准,作缜密地考核,并依据一定的规则将考核的结果予以数量的描述。

狭义:是指对学生某些学科经过学习和训练之后,所获得的知识、技能的测量。

又称成就测量、学业成绩测量或学科测量。

3、教育测量的特点:1.间接性和推断性2.测量对象的模糊性和测量误差的不可避免性3.量表具有多样性,结果具有相对抽象性4.测量目的的针对性二.教育评价评价:评:评定;价:价值——教育价值教育评价:注重效果:美国的泰勒;注重资料的获得:美国的克龙巴赫、斯塔弗尔比姆;注重评价方法、手段:中国的张秀理、日本的长谷川容1、教育评价的概念:教育评价是评价者对教育活动或行为主客体价值关系、价值实现过程、结果及其意义的一种认识活动过程,其核心内容是揭示教育活动或行为中的客体对主体的需要、目标的价值意义。

三.教育测量与评价的关系联系:教育测量就是指根据一定的理论、规则,运用一定的测量工具对教育现象进行数量化描述的过程教育评价是对教育现象状态和价值的判断,这一判断是以对评价对象的客观描述为前提的,没有对评价对象的客观描述,就不会有对评价对象价值的客观判断教育测量是教育评价的基础,教育评价要在教育测量所获得的客观信息的基础上进行.同时,教育测量的结果要通过评价才能获得实际意义.教育测量与评价的区别:第一,测量是对事物数量特征的获得。

而教育评价则是对教育现象客体的价值进行判断。

第二,教育测量是一种纯客观的过程,其突出特点是客观性。

而教育评价则具有两种属性,即客观性和主观性第三,测量的任务是对事物的量的认识,而评价作为一种认识活动,是人的意识对实践活动及其结果的综合反映,它反映的是活动的过程和终点,又是新的实践活动的起点。

教育测量与评价的产生与发展过程:一.教育测量的产生1904年以前(教育测量的萌芽期)中国的科举制(隋炀帝大业二年,公元606年)科举制的特征:逐级考核、制度完备、考场严格、命题规范科举制的考核方法:口试、贴经、墨义、策间、诗赋产生在中国、发展在西方美国贺拉斯曼1845年将“笔试”引入美国英国费舍在1864年《作业量表集》美国赖斯在1897年的《拼字实验》1904—1915年教育测量的开拓期:美国桑代克的巨著《精神与社会测量导论》问世。

标志着以科学理论为指导的教育测量理论的诞生。

桑代克在这本巨著中提出:无论什么东西,只要存在,总存在于数量之中麦克尔提出:任何东西,存在于数量中的,都可以被测量这就是后来人们说的“凡存在的东西必有数量;凡有数量的东西都可以测量”这两句话,看成是构成一切测验和量化评价的公理。

1909年,桑代克根据“等距原理”发明了编制量表的单位,编制了标准化的测验量表。

1915---1930年教育测量的兴盛期:在桑代克的影响下,教育测量的运动轰轰烈烈的开展测验品种有算术测验、书法测验、学科测验、智力测验、个性测验、兴趣测验等,在数量上已有3000多种标准化测验的问世1930---1940年教育测量的批判期:对教育测量批判的原因:教育测量虽然能使教育成就定量化、客观化、标准化;但毕竟不能测量出人的学力和人格的全部内容。

第一次大战以后,人们的教育观点发生了很大的变化,不在将教育看成是单纯的传授知识,而是将人的全面发展作为教育目标。

而人的全面的重要因素如:社会道德、人的情绪态度、动机兴趣、鉴赏力等是不能光靠测量的。

教育测量存在的弊端:为测量而测量,盲目追求量化,忽视教育服务对象的整体目标与价值。

教育测量的理论基础只有心理学、统计学和测量学,而没有教育学原理。

二.教育评价的产生1、教育评价产生的社会背景:1929—1933年席卷美国、波及全球的经济大萧条社会与教育危机四起生产过剩、工厂倒闭、工人下岗学校因经济不景气,部分学校关闭,有些学校的班级减少。

整个社会和教育皆处于反省之中1930年美国有25%的失业,青年近乎100%找不到工作,1910年14—17岁的青年17%上大学,而到1930年上升到51%。

有相当一部分人上高中并不想上大学,而当时的美国高中设课就是为了上大学服务的,为此中学设课与失业青年的需求就产生了尖锐的矛盾2、教育评价的起源:美国进步主义联盟负责人艾钦于1933—1940年领导了中学课程改革实验研究,其中课程评价委员会由俄亥俄州的州立大学教授泰勒主持,这就是美国教育历史上著名的“八年研究”,也是教育评价问世的开始。

八年研究的内容:泰勒教授选了30所参加实验的高中学生,对这些学生进行了4年中学、4年大学学习的追踪研究,历时“八年”,这也是“八年”研究的由来。

当时选进步学校和和传统学校学生各1475人,按性别、年龄、种族、学业能力倾向、家庭、社会环境、职业兴趣和嗜好等基本原则进行一一配对,进行比较。

评价是八年研究的有机组成部分,泰勒认为课程计划和编制必须回答以下四个基本问题1、应帮助学生达到什么目标?2、为达到目标应帮助学生学习那些预期的知识?3、怎样组织学习过程才能使学生的学习成效最大?4、怎样评价教学方案结果发现:来自实验的学生在大学四年中,每年获学术性荣誉略多;具有更强的理智、好奇心和学习动机;思维更精密、更系统、更客观;对教育的意义有更清晰的看法;对新情况有更强的应变能力;具有更有效的解决问题的办法;更多的参加有组织的学习团体;获得非学术的荣誉更多些;对职业的选择有更好的定向;更积极的关注全国和全世界的事物。

新旧课程比较结论:前三项经统计检验均存在显著性差异记忆活动传统的高于进步学校,但经统计检验两者没有显著性差异教育评价的问世:八年研究后泰勒等人的研究结论是:旧课程及其教育测验是教科书主义,测验内容只是要求学生记诵教材中的知识,是片面的,不能反映学生的全面发展。

泰勒提出:以全面发展的教育目标为核心和依据的两条相互依存的原理,即课程编制原理和评价活动原理,也就是泰勒原理教育评价的创始人—泰勒:在八年工作报告中第一次提出教育评价这个报告被称为“划时代的教育评价宣言”宣布了教育评价的诞生给出了教育评价的原理、方法和手段奠定了泰勒---教育评价之父的地位同时也迎来了美国教育史上“泰勒时期的到来”3、评价的发展:1940—1957年教育评价的平稳期:特点:教育评价的理论在不断的进行深入研究布鲁姆完成教育目标分类学教育评价活动没有普及这与当时美国的历史背景有关,二战后,美国处于“筹划与享受生活的时代”。

社会对教育的发展很少提出新的要求。

1957—1972批判泰勒模式时期:特点:1957年前苏联的人造卫星上天引发美国对教育的不满开始批判泰勒教育模式1972----现在专业化时期特点:高等学校出现了许多教育评价的硕士、博士、博士后专业点各类教育评价研究中心纷纷建立如:美国有西密执安大学评价中心、洛杉矶加里福尼亚大学研究中心等教育评价专著、杂志大量出版如:《评价研究》《评价评论》《评价信息》等4、教育测量与评价的发展趋势及特点教育测量的政治性得到强化教育测量的重心发生了变化教育测量的理论得到飞跃发展计算机技术的发展提高了测验的效率测验的统计模型为教育测量学科发展提供强有力的理论支持更加重视测量结果的解释教育测量内容的发展:评价方法由注重相对评价转向重视绝对评价重视教育目标研究教育评价研究中不断引入新的研究方法越来越重视发展性教育评价理念和被评价者的参与越来越重视元评价越来越重视对评价结果的全面解释和慎重处理第二章、教育测量与评价的基本原理教育评价与测量的类型一、教育评价的分类1、根据评价对象的层次和内容来划分:宏观评价:指对影响到全社会的那些指导、规范教育活动的各种因素进行的评价。

微观评价:指对某项具体的教育活动过程,对实施、管理教育活动的组织与个人.对教育活动指向的具体对象等内容进行的评价2、按评价内容的复合程度来划分:单项评价:指针对教育评价对象某一方面状况进行的评价。

综合评价:指对评价对象状况的方方面面作整体评价。

3、按评价的功能及用途来划分:诊断性评价:为使教育活动的形式、内容、过程等更适合活动对象的自身条件及需要而进行的评价。

如:摸底考试。

形成性评价:在教育活动过程中为不断了解活动进行的状况以便能及时对活动进行调整,进而提高活动质量进行的评价。

如:单元测验。

终结性评价:指对教育活动的效果进行的评价。

如:期末考试4、按评价参照的标准来划分:相对评价:根据评价对象的实际状况设定评价标准。

评价标准在被评对象群体内部产生。

绝对评价:依据某种需要或要求设定评价标准。

评价标准在被评对象群体外部产生,且标准固定。

个体内差异评价:以评价对象某一状况作为设定评价标准依据的评价。

5、按评价主体来划分:他人评价:由活动实施者以外的人作为评价主体进行的评价。

自我评价:由活动实施者作为评价主体进行的评价。

6、按评价方法来划分:定性评价:采用开放的形式来获取评价信息、对评价结果的性质进行说明的评价活动。

定量评价:采用结构式的方法,预先设定操作化的评价内容,收集评价对象可以量化的信息,得出数量化结果的评价活动。

二、教育测量的分类1、根据测验目标来划分成就测验:目标在于测量学生在各学习阶段学到了什么,旨在检测教育目标希望学生能达到的具体行为。

如:学科测验如:教学阶段测验(诊断和总结性测验)能力测验:旨在测量个体的不因外界环境影响而轻易改变的、较稳定的、表现在认知能力方面的心理特质.比如观察力、记忆力、理解力、概括力、空间能力、判断推理能力等等。

也被称为“智力测验”。

能力倾向测验:目的在于测量学生的潜在学习能力及学术发展趋向。

潜在能力是指个体从未来教育或训练中可能受益的能力。

这类测验主要用于预测学生的未来成就和能力,从而可以帮助决策者和学生自己选择合适的学校、专业及最佳职业。

能力倾向测验分为:一般学习能力测验、特殊能力倾向测验。

2、根据测验分数的解释标准来划分常模参照测验:目的在于考查被试的个体差异,一般用于衡量被试相对水平的,以选拔为目的的大规模测验。

标准参照测验:目的在于考查被试是否已达到某种标准。

一般用于以教学目标为标准考查学生实际水平的测验。

常模团体⏹总体要明确⏹常模团体必须是被试总体的一个代表性样本⏹样本的大小要适当⏹注意常模团体的更新⏹测验手册中必须详尽描述取样过程常模参照测验与标准参照测验的比较:1、从考试的目的和用途来看,它们都通过测量学生的学习成绩,考查其优劣,但常模参照性测验将考生成绩做横向比较,着眼于个别差异,主要用于选拔性测验和总结性测验等。

2、从考核目标的陈述来看,都明确具体,为编制测验提供依据,但常模参照性测验可采用一般目标或具体目标,而标准参照性测验必须采取非常具体且详细的目标。

相关主题