当前位置：文档之家› 赵德成-教育评价基本理论与实践反思-长春

赵德成-教育评价基本理论与实践反思-长春

泰勒：教育评价之父
• 泰勒是贾德的博士研究生。而贾德的导师是心理学家冯特。 • 泰勒的思想深受20世纪初伟大的社会学家杜威、桑代克和贾德的影响。 • 他在8年研究中主持课程与评价方面的研究。
Ralph W. Tyler
（1902-1994）
泰勒对教育评价的认识
• 评价过程在本质上是确定课程和教学大纲在实际上实现教育目标程度的过程。但是，鉴于教育目标实质上指人们发生的变化，也就是说，所要达到的目标是指望在学生行为模式中产生某种所期望的变化，因此，评价是一种确定行为发生实际变化程度的过程。
以可观察的术语界定目标；寻找证明目标实现的情景；
清楚界定目标
开发或选择测量与评价方法；以我们经验所提到的建议是：只有学校将目标转化成明确的操作性定收集数据资料；义，才能从目标着手，否则只能留把数据资料与既定目标相对比。下美丽的希望或只是一些陈词滥调而已。（Bloom，1961）
• • • • • • • • 对……进行证明。把原理……用于新的情境。阅读…… 辨认…… 用图表表示…… 排除……的原因以……为题演讲 ……
认知目标分类学（1956年）
识记
理解
运用
分析
综合
评价
新版认知目标分类学（安德森等人， 2001）
2001年版认知领域教育目标分类——认知过程维度

量具数字或符号

桌子的长度以一个人张开手后拇指与中指之间的最长距离为一个单位，看桌子有多少个单位长。手 1～100
视力测量
• 被检者的视线要与1.0的一行平行 • 距离视力表5米。如室内距离不够5米长时，则应在2.5米处放置平面镜来反射视力表。
• 进行检测先遮盖一眼，单眼自上而下辨认“E”字缺口方向，直到不能辨认为止，记录下来即可。 • 若被测试者0.1也看不到时，要向前移动，直到能看到0.1为止，
进步主义教育联盟的主张
• 儿童的个性、趣味、需要，应受尊重
• 教材不应脱离生活，应透过生活而学习。 • 非注入的教育，即启发式教育。 • 教育即生活，以儿童为中心
八年研究（1933-1940）
• “八年研究”(the Eight-Year Study)是 20世纪30年代由美国进步教育联盟 (EPA)发起的一项大规模教育实验，目的在于通过实验建立中学与大学的有机衔接，协调中学升学与就业的双重目标，验证或确立进步教育所提出的教育目标。
2.1 解释
从一种表征方式（如数字的）变成另外的一种（如文字的）（如解释重要的演讲和文档）
2.2 举例 2.3 分类 2.4 总结
Illustrating（举例） Instantiating（例示） Categorizing（分类） Subsuming（归类） Abstracting（概括） Generalizing（归纳）
第一代测验时期用标准化测验测量学生的学习成就与心理表现将一个人的分数与他人分数或常模分数做比较，就可以判断其水平。
第二代评价（描述时期）
（1930-1957）
• 1930年代初期，测验运动受到了批判和质疑。
−测验的热潮使考试客观化和标准化，把人的能力转化成数字，但测验毕竟不能测得人的全部，如社会态度、创造力和兴趣等。在重视考试与测验的时代，一些重要的素质往往被冷落，这不符合全面发展、全人教育的思想。
找到具体的例子或者解释概念或原理的说明判定属于一类的事情（如对精神错乱观察或者描述的案例进行归类）概括一般的主题或者要点（如对于录像带中描述中的事件写一篇简短的总结）
2.5 推断
Concluding（推断） Extrapolating（外推）从呈现的信息中进行逻辑的推断（在学习 Interpolating（内推）外语的时候，从例子中推断语法规则） Predicting（归纳） Contrasting（对比） Mapping（对应） Matching（匹配） Constructing Models （建模）发现两种观点、对象或其它类似物之间的一致性（比较同时期历史性事件）建构一个系统的因果模型（如解释法国18 世纪重要事件的原因）
– 随机误差（random error）（用E表示）：由偶然因素引起又不易控制，它既影响稳定性，又影响准确性。 – 系统误差（systematic error）（用I表
经典测量理论
• 测量分数（观察分数，或原始分数）：指个体在某一测验中获得的分值。记为X。 • 真分数：反映被试某种心理特质的真实分数。记为T。 • 随机误差：测量分数与真分数之间的 X=T +E=V+I+E 差值。记为 E。
模糊目标举例
• • • • • • • • 学生具有……的知识。学生领会…… 学生批判性地思考有关…… 学生理解…… 学生对……表示欣赏。学生对……感兴趣。学生掌握……的意义。学生学会……
布卢姆的分析
• 在讨论教学目标时，教师们常常使用 “理解”、“应用”、“领会”之类的词汇。这些词汇是名义性或描述性的术语，是用来描写某类可观察行为的，而不是具体的行为。……没有人曾经看见过“理解”。
2.6 比较 2.7 说明
3．应用——在给定的情境中执行或者利用一种程序 3.1 执行 Carrying Out （执行）
对于一个熟悉的任务运用一种程序（如对多位数的整数做除法）对于一个不熟悉的任务运用一种程序
3.2 实施
Using （利用）
4．分析（——把材料分解成各个组成部分，确定各部分之间的相互关系以及与总体框架的关系 Discriminating（辨别） Distinguishing（区分）对现有的材料中区分出无关和相关或重要 Focusing（集中）和不重要的部分 Selecting（选择） Finding（发现） Coherence（连贯） Integrating（整合） Outlining（概述） Parsing（分解） Structuring（构造）
短时记忆广度测验改进与标准化
• 用任意一列数字作为实验材料，请主试向被试口述这列表中的每一个数字，从位数少的开始，由上到下，让被试紧跟着复述，通过一个，就读下一个，直到被试复述出现错误或不能复述为止。 • 为了使测验结果准确可靠，用3列不同的数字表进行测验，取三次结果的平均数。
短时记忆广度测量
第一代评价（测验时期）
（19世纪末至20世纪30年代）
• 心理学为教育测验运动的兴起奠定了学科基础
– 实验心理学的发展。1879年，冯特在莱比锡大学设立了心理学实验室。 – 个别差异研究的发展。1882年，高尔顿在伦敦设立了人类学的测验实验室，收集人类身体特性与心理特征的资料。 – 对身心缺陷者的临床关心。1905年，比内和西蒙编制了智力测验量表。
[美]布卢姆等编，邱渊等译．教育评价[M]．上海：华东师范大学出版社，1981 ：23
操作化目标举例（上）
• • • • • • • • 陈述……之间的关系。区分…… 把……配对。用自己的话来…… 翻译一段…… 对……做出评价。注销图书馆出借的图书…… 列举……的后果。
操作化目标举例（下）
教育评价基本理论与实践反思
赵德成北京师范大学教育学部
在我心中，有很多疑问：如何理解教育评价？测量、测验及考试，与教育评价的关系是怎样的？经常听人说第四代评价，这是怎么回事？
让我们沿着教育评价学科发展的历史脉络，看西方教育评价概念及模式的演变。
第一代评价（测验时期）
（19世纪末至20世纪30年代）
5.2 评论
6．创造——把要素放在一起形成连贯的或者实用的整体；重新组织要素成一种新的模式或结构 6.1 产生 6.2 规划 6.3 创作 Hypothesizing（假设） Designing（设计） Constructing（制作）基于标准来产生可选择假设（如产生假设来说明可观察的现象）为完成某些任务设计一种程序（如对于给定的历史主题来设计一篇研究论文）发明一个产品（为专门的目的建造一个生活环境）
类别相关词定义与示例
1．回忆——从长时记忆中提取相关的知识 1.1再认 1.2 回忆 Identifying（识别） Retrieving （追忆）在长时记忆中定位与当前材料相一致的知识
从长时记忆中回忆相关的知识
2．理解—从教学信息包括口头、书面和图形等形式中建构意义 Clarifying （澄清） Paraphrasing（释义） Representing（陈述） Translating（翻译）
有关假设
• 若一个人的某种心理特质用平行测验反复测量足够多次，则其观察分数的平均值会接近于真分数。 • 随机误差分数的平均值等于零。 • 测量分数的平均值等于真分数的平均值。 • 真分数和随机误差分数之间的相关是零。
• 各平行测验上的随机误差分数之间相关是零。
• 测量分数的方差等于真分数方差与随机误
4.1 区别
4.2 组织
确定一个结构中的各要素是如何作用的（如构造赞成和反对特定历史解释的描述性证据）
4.3 归因
确定现有材料中的观点、偏见或者隐含的 Deconstructing（解构）观点（就作者的政治观点来确定他/她在一篇文章中的观点）
5．评价——基于标准做出判断
5.1检查 Coordinating（协调） Detecting（探测） Monitoring（监控） Testing （测试） Judging （判断）发现一个过程或者成果的矛盾或错误；确定一个过程或者成果是否具有内部一致性；察觉实施程序的有效性（如，确定一个科学的结论是否根据观察的数据得来的）发现一个成果和外部准则的矛盾，确定是否一个成果有内部一致性；发现一个给定问题的程序的恰当性（如判断两种方法中哪个是解决一个给定问题的最好办法）

e商务文档

赵德成-教育评价基本理论与实践反思-长春

相关文档推荐：