当前位置:文档之家› 心理测量理论与技术的新发展

心理测量理论与技术的新发展

以数据结构分: 交叉设计: 测量目标在所有侧面的各个水平上被测量。 如 p× I 、 p × i × r
(二)测验设计的模型与种类
数据采集方法类型(续): 嵌套设计:测量目标在一个或多个侧面的部分水平 以下被测量。 如 p:r 、p:r:s 混合设计:既有交叉,又有嵌套的测验设计。 如 i×(p:r)
一般一场测量目标只能一个
研究同一测量问题测量目标一经确定不能改变。
(一)概化理论的测验情境关系说
2、测量侧面
测量侧面:测量的条件。
测量侧面水平:测量条件的不同水平。
测量侧面类型:随机侧面 固定侧面
(一)概化理论的测验情境关系说
2、测量侧面(续)
固定侧面的优点: 测量的误差会减小,测量的信度会提高。 固定侧面的缺点:
(二)项目特征曲线
(Item Characteristic Curve, ICC ) 项目特征曲线原理: 编制质量良好的试题,随着被试水平的提高,其 正确作答的概率会越来越大。
(二)项目特征曲线
经典测量理论项目特征曲线实质:
被试正确作答概率对测验总分的回归曲线
项目反应理论项目特征曲线实质:
(四)D研究
D研究的最后工作:
根据综合指标,找出最优测
验设计方案。
概化理论分析常用软件:
GENOVA 或mGENOVA。
三、概化理论评价 优点: 1、概化理论是一套全新的测验误差分析方法,而 且非常精细。 2、概化理论引进了测验设计的思想和方法。 3、概化理论具有严谨的科学理论体系。
2.Rasch模型
丹麦学者拉希建 Rasch 模型
Pi ( ) exp( bi ) /[1 exp( bi )]
Rasch模型的最大特点是它的项目参数只有难度。
(三)项目反应理论的基础模型(续)
3.Logistic模型
伯恩鲍姆(Birnbaum,1958)双参数 Logistic模型:
1、测验分数方差的测量学意义
测验分数方差有目标分数方差和误差分数方差之区 别。如:
被试真正能力水平间的分数方差是目标分数方差。
同一被试不同次测验分数间的方差是误差方差。 同一作品多个评分间的方差也是误差方差。
(一)概化理论的发展思路
2、误差来源的多样性与总分方差结构 的复杂性
测量误差的原因多方面,误差方差的种类多种。
(三)概化理论发展史
用方差分量分析研究测量误差的历史可以追溯到20 世纪上半叶。 公认的GT正式诞生的标志物是克朗巴赫等的专著
《行为测量的可靠性》的正式出版。
二、概化理论基本框架
(一)概化理论的测验情境关系说
为了探清测验误差的来源、类型、大小,必须建立
一个理论模型。
二、概化理论基本框架
固定侧面成目标的一部分,测量结果拓广受限。
(一)概化理论的测验情境关系说
3、概化理论下的真分数概念
经典测验理论认为个体真分数只能有一个。
概化理论认为在不同测量条件下会有不同的真分数。
(一)概化理论的测验情境关系说
测验情境关系说结论:
情境关系中的测量目标、测量侧面、侧面的水平变 化,会引起测验误差的来源,误差的大小、真分数 的种类以及测验信度的变化,进而引起测验分数的 解释范围发生变化。
Pi ( ) exp[Dai ( bi )] {1 exp[Dai ( bi )]}
其中D一般取1.7 令a=1,成单参数Logistic模型。
(三)项目反应理论的基础模型(续)
增加一个参数c成为三参数Logistic模型:
P i ( ) ci (1 ci ) {1 exp[ Dai ( bi )]}
各测量侧面效应期望均方差:各侧面对目标干扰程 度描写量,就是误差;
各交互效应期望均方差:各侧面对目标的交互干扰 程度描写量,也是误差。
二、概化理论基本框架
(四)D研究
D研究的目的:在G研究的基础上,在原设计的测
验情境关系范围之内,分析比较各种可能的测验方
案,由研究者结合实际,优选实施方案。
经典理论以同一误差估计值评价所有被试测值非常
笼统,很不精确。
一、经典测验理论回顾
结论:
经典测量理论的这些局限性限制了测量在实践中的 应用。 项目反应理论(IRT)是在这背景上发展起来的一
种全新的现代测验理论。
二、项目反应理论基础
(一)潜在特质理论(Latent Trait Theory) 潜在特质:制约行为的心理特质,没有明确其物理与生理属性 测量学研究“潜在特质” 的目的: 探清结构和性质,将其数量化,
(四)D研究
D研究调整原方案获取新方案的方法:
1、固定原测验情境关系中的某一个或某几个 侧面。
2、改变原测验情境关系中的一个或某几个测
量侧面的水平数。
3、改变原测验情境关系中某些测量侧面的结
构关系。
(四)D研究
D研究的统计分析步骤(两步)
1、估计拓广领域(新测验方案)下各种效应期望 方差。 2、估计新方案下测验误差的总体指标和测验质量 指标,以提供比较依据。
中测量目标方差和各个测量侧面方差,以及其间的
交互作用的方差。
方差分量分析(二步):
1、分解总体方差为测量目标主效应方差、 各测量侧面主效应方差和各种交互效应方 差。 2、应用样本方差估计各种效应的期望均方 差。
(三)G研究
各种期望均方差性质:
测量目标效应期望均方差:测量目标个体差异的描 写量;
(二)测验设计的模型与种类
数据采集设计原则:
数据充分体现测量目标与各个测量侧面及各侧面相 互之间关系 侧面数、水平数的设置要符合客观的测验情境;
能获得充分的数据信息; 简化模型、节约投入。 施测时要控制设计之外的各种无关变量。
(三)G研究
G研究目的:用方差分量分析,定量估计观察领域
2.项目参数估计独立于被试样本 项目特征曲线的本质:被试作答正确率对能力的回 归。 刻画回归曲线形态的参数,即a、b、c与被试分布 无关。 这一性质为建设大型题库提供了保证。
(二)测验设计的模型与种类
测验设计的任务(两个方面):
(1)界定测量目标和测量侧面的个数及名称、意 义,确定各侧面的水平数。 (2)设计数据采集方法。
(二)测验设计的模型与种类
数据采集方法类型:
以侧面数分: 单侧面测验设计的模型与种类
数据采集方法类型(续):
参数c是S曲线的下渐近线,称为“伪机遇参数”
三参数项目特征曲线
P(
1 )
(1+c)/2
c

三参数模型的项目特征曲线
(四)项目反应理论的优良性质
1.被试能力估计独立于测验项目的选择 项目反应理论生成独立于项目内容的被试水平测量。 这一优点为发展自适应测验提供了理论基础。
(四)项目反应理论的优良性质
(一)潜在特质理论
完备的潜在特质空间定义:
如果一个K维潜在特质空间包含了制约人某种任务
行为的所有潜在特质,称其为一个完备的潜在特质
空间,简称全特质空间。
(一)潜在特质理论
测量单维性定义:
如果制约某种任务行为的空间既是一维的,又是完
备的,则称这一任务行为的测量具有单维性。单维
IRT模型是最为人们熟悉的。
1.双参数正态肩形曲线模型
a的意义:
将模型对 求导,将 b 代入,
可得 a
2 tgA 。
a是曲线拐点(难度点)的斜率。
曲线越陡峭,难度点附近不同被试正确作答概率的
差异越大
a 定义为区分度
1、双参数项目特征曲线
1
1/2
0 b 图 双参数模型的项目特征曲线

(三)项目反应理论的基础模型(续)
评价指标:测验原始总分
局限:分数的解释依赖于测验的具体内容。
对被试的比较被迫限制在同一份试卷上
一、经典测验理论回顾
(二)测验性能指标的估计依赖于被试样本
项目难度估计值会随被试水平的变化而变化。 区分度、信度和效度,本质上是相关系数,也都依 赖于被试样本。
同一测验在不同被试样本上施测所估性能指标不一
(一)概化理论的测验情境关系说(续) 概化理论模型的建立依赖于对测验情境关系的详细 调查。 测验情境关系是指测量目标与各测量侧面所组成的 一种关系结构。
(一)概化理论的测验情境关系说
1、测量目标
测量目标:测量者希望通过测量用测量值描绘的心
理品质。
确定测量目标的方法:问“测谁”和“测什么”。
(一)概化理论的发展思路
4、概化理论的研究目的 探清总分方差结构、 区分误差原因, 明确各种误差大小, 找到最优设计方案。
(二)概化理论发展的理论与技术基础
1、经典测验理论 概化理论与经典测验理论相比,不同之处多于相同 之处。 2、方差分量分析 依靠方差分量分析将总分方差分解、定性。
第14讲 心理测量理论与技术的新发展
第 一 节 第 二 节
概化理论 项目反应理论
第 一 节
概化理论简介
一、概化理论的发展
(一)概化理论的发展思路
概化理论(Generalizability Theory,GT)
是经典理论宏观发展,重在研究误差控制、研究测 验整体设计。
(一)概化理论的发展思路
三、概化理论评价
缺点:
1、概化理论本质上还是抽样,研究本身会有误差。
2、计算方法相对复杂,给应用带来一定困难。
第 二 节
项目反应理论简介
一、经典测验理论回顾
巨大贡献、重要地位、继续发挥作用
相关主题