心理与教育测量第一章心理与教育测量概论(一)一般测量概论1. 测量:依据一定的法则使用量尺对事物的属性进行定量描述的过程。
2. 测量的基本要素:(1)参照点:①绝对参照点:以绝对的零点作为测量的起点,如长度测量②相对参照点:以人为确定的零点为测量的起点,如对地势高度的测量。
(2)测量的单位:①要有确定的意义,即对同一单位,所有人的理解都是相同的。
②要有相等的价值,即第一个单位与第二个单位之间的距离等于第二个单位与第三个单位之间的距离。
3. 测量的量表:能够使事物的特征数量化的数字的连续体。
①陈名量表--用数字代表事物的成分或用数字对事物经行分类,但该类数字没有数量的意义。
可细分为两种形式,一是命名量表(用数字指代个别事物,如用数字给运动员编号);二是类别量表(用数字指代事物的种类,如用1、2、3分别代表不同的职业类型)。
其适用的统计方法有百分比、次数、众数和卡方检验。
②顺序量表--其中的数字不仅能够指代类别,而且能够表明不同类别的大小、等级或事物具有某种特征的程度,它既没有相等距离的单位,也没有固定的测量原点。
适用的统计方法有中位数、百分位数、等级相关系数和肯德尔和谐系数等。
③等距量表--不仅能够指代事物的类别和等级,而且具有相等距离的测量单位。
没有绝对的零点,适用的统计方法有平均数、标准差、积差相关系数、等级相关系数以及t检验和F检验。
④比率量表--具有类别、等级和等距的特征外,还具有绝对的零点或固定的原点。
适用的统计方法除了与等距量表相同外,还与几何平均数、变异系数相同。
(二)心理与教育测量的性质1. 心理与教育测量的定义:依据一定的心理学和教育学理论在测验上对人的心理特质和教育成就进行定量描述的过程。
2. 心理与教育测量的量表属于顺序量表的原因:①从所使用的参照点来说,教育测量和心理测量领域的参照点均为相对零点。
②从所使用的单位来说,教育与心理测量的单位远没有其他测量的单位成熟和完善。
3.标准化需具备的条件:①测验内容的标准化②施测条件的标准化③评分规则的标准化④测验常模的标准化4.心理与教育测验的种类:(1)①常模参照测验--以常模为参照编制的测验(如高考只有百分之几的人可以进入重点大学)②标准参照测验(目标参照测验)--以标准为参照编制的测验(如,视力测验、考驾照)(2)①智力测验--测量个人的智力(一般认知能力)水平的高低②能力倾向测验--测量个人的潜在才能,预测个人的能力发展倾向③成就测验--测量个人在接受教育后的学业成(3)①个别测验--同一主试在同一时间只能测量一个被试②团体测验--同一主试在同一时间内能够测量许多被试(4)①难度测验--识别个人能够达到的最高水平②速度测验--识别个人做题的最快速度第二章心理与教育测量简史1.高尔顿:把统计方法应用到对个别差异资料的分析之中2.卡特尔:①首次提出“心理测验”这个术语②认为心理学只有立足于实验与测量,才能达到如同自然科学一样的准确性③认为心理测验只有建立普遍的统一标准,并与常模相比较,才能充分地实现其科学价值和实用价值3.比内:①1903年,《智力的实验研究》问世,提出了智力的定义,认为智力是高级心理过程,包括推理、判断以及运用已知知识解决新问题的能力②1904年与其助手西蒙合作完成了世界上第一个智力测验量表----比内--西蒙量表,因此成为了心理测验的鼻祖4.智力测验的发展:①最著名的的是推孟于1916年修订的斯坦福--比内量表。
其中影响最为深远的变动是推孟采用了比率智商的概念来表示智力水平的高低②第一个团体测验--陆军甲种测验和陆军乙种测验③30年代后,瑞文相继编制了瑞文标准推理测验、瑞文彩色推理测验、瑞文高级推理测验④韦克斯勒舍弃了比率智商,而用离差智商代之,从而克服了比率智商的局限;他编制的智力量表分为言语量表和操作量表两部分5.能力倾向测验的发展:最初被称为“学业能力倾向测验”,后来进一步扩展到职业咨询、工业部门及军事领域的人才选拔和安置工作领域。
在编制成套能力倾向测验的过程中,因素分析方法起了重要的作用。
6.成就测验的发展:①20世纪初,桑代克编制了第一个标准化的教育成就测验。
因此而被公推为教育测量的鼻祖。
②1923年,凯利、鲁奇和推孟合作编制了第一个成套成就测验----斯坦福成就测验③20世纪30年代后期,在美国出现了跨州、跨区域乃至全国的测验程序7.人格测验的发展:①20世纪初叶,出现了自陈人格问卷。
伍德沃斯用自陈问卷法编制了适用于诊断士兵神经症的个人资料调查表;卡特尔编制了卡特尔16种人格问卷;埃森克编制成埃森克人格问卷;美国明尼苏达大学的哈撒韦和莫垦利编制成明尼苏达多项人格调查表。
②另一种技术是投射测验。
罗夏克墨迹测验;哈罗尔编制了以团体方式实施的墨迹测验。
第三章经典测验理论的基本假设1.心理特质:表现在一个人身上所特有的相对稳定的行为方式2.测量误差:(1)含义:在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应(2)种类:①随机误差--由与测量目的无关的偶然因素引起的而又不易控制的误差,其方向和大小的变化完全是随机的。
例如在进行手枪射击时,新手往往很难控制手臂的轻微摆动。
②系统误差--由与测量目的无关的变因引起的一种恒定而有规律的效应。
例如,在设计过程中,尽管射击手非常优秀,每次结果都很一致,但若是枪的准心有点儿毛病,则其射击结果将会有稳定的偏差。
(3)来源:①测量工具:心理测量量表是否稳定、是否真正测到了我们所要测的东西是测量工具造成误差的两种主要原因。
②测量对象:主要原因是受测者的真正水平是否得到真正发挥。
③施测过程:主要是一些偶然因素(恒定因素较易控制)3.真分数:(1)概念:反映被试某种心理特质真正水平的那个数值称作该特质的真分数(简称T分数),真分数是一个在理论上构想出来的抽象概念,在实际测量中是很难得到的。
(2)数学模型:观察分数(记为X)与真分数(T)之间是一种线性关系,并只相差一个随机误差(记之为E)。
即 X=T+E(3)假设:①若一个人的某种心理特质可以用平行的测验反复测量足够多次,则其观察分数的平均值会接近于真分数。
②真分数和误差分数之间的相关为零。
③各平行测验上的误差分数之间相关为零。
(4)推导: S2X =S2T+S2E即在一次测量中,被试观察分数的方差等于其真分数方差与误差分数方差之和。
第四章测量信度1.概念:测量结果的稳定性程度。
也是一致性,可靠性。
2.定义:①信度(信度系数)是一个被测团体的真分数的变异数与实得分数的变异数之比,即rXY = S2T/S2X②信度是一个被试团体的真分数与实得分数的相关系数的平方。
即 rXY =ρ2xT③信度是一个测验x(A卷)与它的任意一个“平行测验”x’(B卷)的相关系数,即rXY =ρxx’3.作用:(1)信度是测量过程中所存在的随机误差大小的反映(2)信度可以用来解释个人测验分数的意义①标准误:每个人两次测量的分数之差可以构成一个新的分布,这个分布的标准差就是测量的标准误,它是此次测量中误差大小的客观指标,有了这一指标,我们就可以对团体中任何一个人的测验成绩做出恰当的解释。
公式:SE =SX√1-rxx’(SE是标准误,SX是实得分标准差,rxx’是信度)②置信区间:当测验满足经典测验理论的三大假设时,根据以上估计的测量标准误便可用以下方法构建测验真分数估计的置信区间:公式:x - ZC SE≤ T ≤ x + ZCSE(x是被试的观测分数,SE为测量标准误,ZC是对应于某个统计检验显著性水平的标准正态分布下的临界值)注:例题参考P52最上面。
4.信度的估计方法:(1)重测信度:①定义--用同一个量表对同一组被试施测两次所得结果的一致性程度。
其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数:∑∑----≡----))(()()(22yyxxyyxxrxx(x和是-x第一次测量的实得分数及实得分数的平均值;y和-y是第二次测量的实得分数及实得分数的平均值,xx r是重测信度。
公式不要求记,但要会用)②使用的前提-- A所测量的心理特性必须是稳定的B遗忘和练习的效果基本上相互抵消C在两次实测的间隔期内,被试在所要测查的心理特质方面没有获得更多的学习和训练③误差来源------A测验本身B被试方面(个体差异)C偶发因素干扰④优缺点---------A能提供测验结果是否随时间而变化的资料,可作为预测被试特定行为的依据。
B 易受练习和记忆的影响⑤意义------------A 反应的是在测验时间上的等值性B 适用于速度测验与人格测验,不适用于难度测验(2)复本信度:①定义---A 复本信度--指两个平行的测验测量同一批被试所得结果的一致性程度。
其大小等于同一批被试在两个副本测验上所得分数的皮尔逊积差相关系数。
(同上面) B 等值性系数--两个复本测验是同时连续施测的。
C 稳定性与等值性系数--两个复本测验相距一段时间分两次施测。
D 平衡设计--为低效施测的顺序效应,随机地选出一半被试先做A 卷后再做B 卷,另一半被试先做B 卷再做A 卷。
②使用的前提--A 首先要构造出两份或两份以上真正平行的测验(即A 、B 卷) B 被试要有条件接受两个测验。
③误差来源---A 测验的两种形式是否等值(是否是平行测验)B 被试情绪波动,动机变化等测验情景变化、偶发因素干扰。
④优缺点------A 代表性强,信度准,避免练习、记忆效应 B 编制复本难,影响积极性,被试容易触类旁通 ⑤意义---------A 反应的是在测验内容上的等值性(3)分半信度:①定义--将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。
由于描述的是两半题目间的一致性,所以有时也称内部一致性系数。
②计算-- A 方法与复本信度的类似,但是被试在两半测验上的得分的相关系数只是半个测验的信度,所以还要用斯皮尔曼-布朗公式矫正:hhhhxx r r r +=12(xx r 是两个分数间的相关系数,hh r 是整个测验的信度值) B 上式只有在两半测验分数的变异数(即总体方差)相等时才能使用,否则,就用下面的弗朗那根公式或卢伦公式。
)1(2222xb a xx S S S r +-=(2a S 和2b S 分别表示所有被试在两半测验上的得分的变异数,2x S 表示全体被试在整个测验上总得分的变异数)22/1xd xx S S r -=(2dS 表示同一组被试在两半测验上得分之差的变异数,其他与上式相同)③使用前提---A 在只能施测一次或没有复本的情况下使用 B 当一个测验无法分成对等的两半时,不宜使用 C 常用的分半方法有奇偶分半、按题目难度分半等 注:速度测验不适合分半信度(4)同质性信度:①定义-A- 也叫做内部一致性系数,是指测验内部所有题目间的一致性程度。