当前位置:
文档之家› 赵德成-教育评价基本理论与实践反思-长春
赵德成-教育评价基本理论与实践反思-长春
泰勒:教育评价之父
• 泰勒是贾德的博士研究 生。而贾德的导师是心 理学家冯特。 • 泰勒的思想深受20世纪 初伟大的社会学家杜威、 桑代克和贾德的影响。 • 他在8年研究中主持课 程与评价方面的研究。
Ralph W. Tyler
(1902-1994)
泰勒对教育评价的认识
• 评价过程在本质上是确定课程和教学 大纲在实际上实现教育目标程度的过 程。但是,鉴于教育目标实质上指人 们发生的变化,也就是说,所要达到 的目标是指望在学生行为模式中产生 某种所期望的变化,因此,评价是一 种确定行为发生实际变化程度的过程。
以可观察的术语界定目标; 寻找证明目标实现的情景;
清楚界定 目标
开发或选择测量与评价方法; 以我们经验所提到的建议是:只有 学校将目标转化成明确的操作性定 收集数据资料; 义,才能从目标着手,否则只能留 把数据资料与既定目标相对比。 下美丽的希望或只是一些陈词滥调 而已。(Bloom,1961)
• • • • • • • • 对……进行证明。 把原理……用于新的情境。 阅读…… 辨认…… 用图表表示…… 排除……的原因 以……为题演讲 ……
认知目标分类学(1956年)
识记
理解
运用
分析
综合
评价
新版认知目标分类学(安德森等人, 2001)
2001年版认知领域教育目标分类——认知过 程维度
量具 数字或符号
桌子的长度 以一个人张开手后 拇指与中指之间的 最长距离为一个单 位,看桌子有多少 个单位长。 手 1~100
视力测量
• 被检者的视线要与1.0的一行平 行 • 距离视力表5米。如室内距离不 够5米长时,则应在2.5米处放置 平面镜来反射视力表。
• 进行检测先遮盖一眼,单眼自上 而下辨认“E”字缺口方向,直 到不能辨认为止,记录下来即可。 • 若被测试者0.1也看不到时,要 向前移动,直到能看到0.1为止,
进步主义教育联盟的主张
• 儿童的个性、趣味、需要,应受尊重
• 教材不应脱离生活,应透过生活而学 习。 • 非注入的教育,即启发式教育。 • 教育即生活,以儿童为中心
八年研究(1933-1940)
• “八年研究”(the Eight-Year Study)是 20世纪30年代由美国进步教育联盟 (EPA)发起的一项大规模教育实验,目 的在于通过实验建立中学与大学的有 机衔接,协调中学升学与就业的双重 目标,验证或确立进步教育所提出的 教育目标。
2.1 解释
从一种表征方式(如数字的)变成另外的一 种(如文字的)(如解释重要的演讲和文档)
2.2 举例 2.3 分类 2.4 总结
Illustrating(举例) Instantiating(例示) Categorizing(分类) Subsuming(归类) Abstracting(概括) Generalizing(归纳)
第一代 测验时期 用标准化测验测量学生的学习成就与心理表 现 将一个人的分数与他人分数或常模分数做比 较,就可以判断其水平。
第二代评价(描述时期)
(1930-1957)
• 1930年代初期,测验运动受到了批判 和质疑。
−测验的热潮使考试客观化和标准化,把 人的能力转化成数字,但测验毕竟不能 测得人的全部,如社会态度、创造力和 兴趣等。在重视考试与测验的时代,一 些重要的素质往往被冷落,这不符合全 面发展、全人教育的思想。
找到具体的例子或者解释概念或原理的说 明 判定属于一类的事情(如对精神错乱观察 或者描述的案例进行归类) 概括一般的主题或者要点(如对于录像带 中描述中的事件写一篇简短的总结)
2.5 推断
Concluding(推断) Extrapolating(外推) 从呈现的信息中进行逻辑的推断(在学习 Interpolating(内推) 外语的时候,从例子中推断语法规则) Predicting(归纳) Contrasting(对比) Mapping(对应) Matching(匹配) Constructing Models (建模) 发现两种观点、对象或其它类似物之间的 一致性(比较同时期历史性事件) 建构一个系统的因果模型(如解释法国18 世纪重要事件的原因)
– 随机误差(random error)(用E表示): 由偶然因素引起又不易控制,它既影响 稳定性,又影响准确性。 – 系统误差(systematic error)(用I表
经典测量理论
• 测量分数(观察分数,或原始分数): 指个体在某一测验中获得的分值。记 为X。 • 真分数:反映被试某种心理特质的真 实分数。记为T。 • 随机误差:测量分数与真分数之间的 X=T +E=V+I+E 差值。记为 E。
模糊目标举例
• • • • • • • • 学生具有……的知识。 学生领会…… 学生批判性地思考有关…… 学生理解…… 学生对……表示欣赏。 学生对……感兴趣。 学生掌握……的意义。 学生学会……
布卢姆的分析
• 在讨论教学目标时,教师们常常使用 “理解”、“应用”、“领会”之类 的词汇。这些词汇是名义性或描述性 的术语,是用来描写某类可观察行为 的,而不是具体的行为。……没有人曾 经看见过“理解”。
2.6 比较 2.7 说明
3.应用——在给定的情境中执行或者利用一种程序 3.1 执行 Carrying Out (执行)
对于一个熟悉的任务运用一种程序(如对 多位数的整数做除法) 对于一个不熟悉的任务运用一种程序
3.2 实施
Using (利用)
4.分析(——把材料分解成各个组成部分,确定各部分之间的相互关系以及与总 体框架的关系 Discriminating(辨别) Distinguishing(区分) 对现有的材料中区分出无关和相关或重要 Focusing(集中) 和不重要的部分 Selecting(选择) Finding(发现) Coherence(连贯) Integrating(整合) Outlining(概述) Parsing(分解) Structuring(构造)
短时记忆广度测验改进与标准 化
• 用任意一列数字作为实验材料,请主 试向被试口述这列表中的每一个数字, 从位数少的开始,由上到下,让被试 紧跟着复述,通过一个,就读下一个, 直到被试复述出现错误或不能复述为 止。 • 为了使测验结果准确可靠,用3列不同 的数字表进行测验,取三次结果的平 均数。
短时记忆广度测量
第一代评价(测验时期)
(19世纪末至20世纪30年代)
• 心理学为教育测验运动的兴起奠定了 学科基础
– 实验心理学的发展。1879年,冯特在莱比锡大 学设立了心理学实验室。 – 个别差异研究的发展。1882年,高尔顿在伦敦 设立了人类学的测验实验室,收集人类身体特 性与心理特征的资料。 – 对身心缺陷者的临床关心。1905年,比内和西 蒙编制了智力测验量表。
[美]布卢姆等编,邱渊等译.教育评价[M].上海:华东师范大学出版社,1981 :23
操作化目标举例(上)
• • • • • • • • 陈述……之间的关系。 区分…… 把……配对。 用自己的话来…… 翻译一段…… 对……做出评价。 注销图书馆出借的图书…… 列举……的后果。
操作化目标举例(下)
教育评价基本理论 与实践反思
赵德成 北京师范大学教育学部
在我心中,有很多疑问: 如何理解教育评价? 测量、测验及考试,与教育评价的关系是怎 样的? 经常听人说第四代评价,这是怎么回事?
让我们 沿着教育评价学科发展的历史脉络, 看西方教育评价概念及模式的演变。
第一代评价(测验时期)
(19世纪末至20世纪30年代)
5.2 评论
6.创造——把要素放在一起形成连贯的或者实用的整体;重新组织要素成一种 新的模式或结构 6.1 产生 6.2 规划 6.3 创作 Hypothesizing(假设) Designing(设计) Constructing(制作) 基于标准来产生可选择假设(如产生假设来 说明可观察的现象) 为完成某些任务设计一种程序(如对于给定 的历史主题来设计一篇研究论文) 发明一个产品(为专门的目的建造一个生活 环境)
类别 相关词 定义与示例
1.回忆——从长时记忆中提取相关的知识 1.1再认 1.2 回忆 Identifying(识别) Retrieving (追忆) 在长时记忆中定位与当前材料相一致的知识
从长时记忆中回忆相关的知识
2.理解—从教学信息包括口头、书面和图形等形式中建构意义 Clarifying (澄清) Paraphrasing(释义) Representing(陈述) Translating(翻译)
有关假设
• 若一个人的某种心理特质用平行测验反复 测量足够多次,则其观察分数的平均值会 接近于真分数。 • 随机误差分数的平均值等于零。 • 测量分数的平均值等于真分数的平均值。 • 真分数和随机误差分数之间的相关是零。
• 各平行测验上的随机误差分数之间相关是 零。
• 测量分数的方差等于真分数方差与随机误
4.1 区别
4.2 组织
确定一个结构中的各要素是如何作用的 (如构造赞成和反对特定历史解释的描述 性证据)
4.3 归因
确定现有材料中的观点、偏见或者隐含的 Deconstructing(解构) 观点(就作者的政治观点来确定他/她在一 篇文章中的观点)
5.评价——基于标准做出判断
5.1检查 Coordinating(协调) Detecting(探测) Monitoring(监控) Testing (测试) Judging (判断) 发现一个过程或者成果的矛盾或错误;确定 一个过程或者成果是否具有内部一致性;察 觉实施程序的有效性(如,确定一个科学的 结论是否根据观察的数据得来的) 发现一个成果和外部准则的矛盾,确定是否 一个成果有内部一致性;发现一个给定问题 的程序的恰当性(如判断两种方法中哪个是 解决一个给定问题的最好办法)