0276《心理测量学》2013年12月期末考试指导一、考试说明本课程闭卷考试,满分100分,考试时间90分钟。
考试包括以下四种题型:1、单项选择题2、名词解释题3、简答题4、论述题二、重点复习内容第一章心理测量的发展史一、心理测验的先驱:高尔顿二、首创“心理测验”一词:卡特尔三、世界上第一个智力量表:比内-西蒙量表1905年,他在《心理学年报》上发表了文章《诊断异常儿童的新方法》,介绍了该量表。
第二章心理测量的基本概念一、心理测量:基于测量的定义,心理测量指的是依据一定的心理学理论,使用一定的操作程序,对人的行为和心理属性确定出数量化的价值。
二、测验量表:用于测量的标尺,它是由具有单位和参照点的连续体,将被测量的事物置于该连续位置,看它离参照点多少单位的计数,可以得到测量值。
三、测量的要素是:参照点和单位。
四、量表的种类有:命名量表、顺序量表、等距量表和等比量表。
1、命名量表:只是用数字来代表事物或对事物进行分类。
命名量表中的数字没有任何数值意义,不能作量化分析。
无大小意义,只表明类别。
无参照点和单位。
无法比较大小或进行任何数学运算。
2、顺序量表:表明类别的大小或某种属性的多少。
主要用于分等论级和分类。
数字仅表示等级并不表示某种属性的真正量或绝对值。
无参照点(没有绝对零度)和单位。
无法进行数学运算。
3、等距量表:存在大小关系。
无绝对零点,但存在相对零点,参照点是人为制定的,能表明量的相对大小,可以进行数学加减运算,有相等单位。
一般来说,心理测验的分数属于等距量表。
4、等比量表:是最精确的测量。
可以知道事物之间的某种特点上相差多少及它们之间的倍数关系。
有相等单位和绝对零点。
不仅可以进行数学加减运算,还可以进行乘除运算。
大多是物理量表,而心理量表一般只能达到等距量表水平。
第三章信度(公式不要求记忆)一、信度:测量结果的可靠性,指同一群人在同一个测验上多次测量结果的一致性。
1、信度的操作化定义:误差理论认为:一个人的测验分数X是由真实分数(T)和误差(E)两部分构成的,X = T + E误差理论假设:①测量的平均误差为0;②真分数和误差不相关;③不同测量的误差之间不相关。
确定可接受的信度水平的一般原则是,当r xx<0.70时,测验不能用于对个人做出评价或预测,而且不能进行团体比较。
2、根据统计学理论,真实方差与实得方差的比是一个相关系数的平方,所以我们把这种相关系数的平方叫做信度系数。
因此信度就被定义为:一组测量分数的真实方差与实得方差的比,或者是指真实方差占总方差的百分比。
第四章效度一、效度:即准确性,指一个测验能测量到它所要测量的心理特质的程度。
二、表面效度:一个测验在被试或参与者看来,直觉地认为它在测量什么,是否测到了所要测量的东西。
是被试的一种主观认识,并不是真正意义上的效度。
三、内容效度:测验题目对有关内容或行为总体取样的适当性程度,即一个测验实际测量的内容与要测量的内容温和的程度。
四、结构效度:也称构想效度,即一个测验测量到它要测量的某一理论概念或特质的程度。
1、构想:心理学中提出的人假定具有的属性或特质,如智力,动机,兴趣,创造性等。
2、确定构想效度的方法:测验内部的方法、测验间的方法、效标效度的研究、实验和观察法验证。
3、结构效度的特点(1)结构效度大小取决于事先假定的心理特质理论。
具有不同理论构思的测验,其结构效度是无法进行比较的;(2)结构效度有时很难获得,也就是说没有得到实际测量的资料证实并不意味着理论一定不成立(实验设计不当也可能有影响);(3)结构效度没有单一的指标,是由各方面的证据累积起来进行评价的。
一般来说,内容效度主要用于学科测验,而结构效度主要用于心理测验。
五、区分效度:新老测验之间的相关(两测验测的不是同一心理特质),若相关低,则说明新测验可能有较高的效度。
六、效标关联效度:又叫实证效度或预测效度,即一个测验对于特定情境中的个体行为进行预测或诊断时的有效程度。
1、效标:本测验要诊断或预测的行为。
2、效标的特性。
(1)多样性:一个测验可能有不同的观念效标,同一个观念效标又可能有不同的效标测量。
(2)复杂性:几乎每一种效标行为都由多种特质构成,包含复杂的成分。
(3)特殊性:即使一个普通的效标,在应用时也有特殊性。
(4)时间性:近期效标与最后效标。
3、要确保效标测量的客观性测验的客观性包括测验的刺激、对反应的量化和对结果的推论。
要确保效标测量的客观性,应该做到:(1)避免偏见影响效标测量,特别是以等级评定作为效标测量时,评分者的主观偏见会有很大影响,应该加以注意。
(2)防止效标污染,即指个人的效标应评定者知道个体的测验分数(预测源分数)而受到影响。
(3)效标测量要较好的反映观念效标,那么就要保证效标测量本身就必须是有效的,可靠的,而且应该实用。
七、信度与效度测验的效度受它的信度制约:根据效度的数学定义效度= S co2/ S t2,信度的数学定义S∞2/St2以及St2= S∞2+ S e2,推出效度=信度—S e2/ S t2一个测验的信度必然比效度高,至少相等。
第五章项目分析一、难度①不分组的计算方法:题目以0、1计分,难度值P= R/ N(P为通过率,R为答对人数,N为参考总人数)题目不以0、1计分,难度值P= X′/X max (X′为所有人在此题上得分的平均数,X max 为该题满分)②分组的计算方法:(被试人数较多时可使用)分组:将试卷按测验总分由高到低排列,最高分往下取全部试卷的27%作为高分组,从最低分往上取全部试卷的27%作为低分组。
题目以0、1计分:P=(R H+R L)/2nR H 为高分组答对人数R L为低分组答对人数N为一个组(高分组或低分组)的人数题目不以0、1计分:P=(X H+X L-2nL)/2n(H-L)X H为高分组得分总和H为该题最高分L为该题最低分注意:难度值大,表明通过率越高,即难度越小。
二、区分度:测验项目对被试心理品质水平差异的区分能力或鉴别能力。
1、区分度分析的一般方法:鉴别力指数、项目-总分相关、项目间相关。
2、鉴别力指数:运用极端组计算项目鉴别力的一种简单方法。
公式为:D = PH-PL是高分组在项目上的通过率,而是低分组在项目上的通过率。
当D<0.19是,项目差,必须淘汰;但D在0.20 ~ 0.29之间时,项目尚可,但必须修改;当D在0.30 ~0 .39之间时,项目良好,但还是最好稍做修改;而当D>0.40时,项目完全可以被接受,但一般测验,D>0.30,项目就可以接受了。
D值的取值范围为-1—1。
第六章测验的常模和分数的解释一、常模:以标准化的考生团体在测验上的平均分为参照点,以适当的分数距离为单位建立起来的数量连续体。
二、常模团体:构成参照标准的被试团体,就叫常模团体,也叫参照团体。
常模团体是由具有某些共同特征的人所组成的一个群体,或者是该群体的一个样本。
构成常模团体的条件主要有:(1)群体构成的界限必须明确应该对每个常模团体的性质和特征的给予简短且明确的描述。
(2)常模团体必须是所测群体的代表性样本克服取样偏差,采用正确的取样方法:随机取样,系统抽样,分层取样。
(3)取样的过程必须明确且有详尽的描述在测验手册中,有关取样的大小、取样方法、取样时间等的说明和描述,越明确、越详尽越好。
(4)样本大小要适当从统计学原理上说,样本是越大越好,但考虑到经济、实用,样本数量也不能无限扩大。
总体性质。
总体性质越复杂,样本容量就越大。
测验结果的精确度。
精确度要求越高,样本量就越大。
(5)常模团体必须是近时的。
三、常模样本:找一个有代表性的样本来代表目标总体,也代表常模总体,这个用来代表常模总体的样本,就是常模样本。
常模样本必须具备常模总体的基本特征。
四、年级当量:即年级常模,用年级代替年龄,指把学生的测验成绩与各年级学生的平均成绩比较,看他相当于几年级的水平。
五、常模样本的容量:总体的数目。
一般情况,最小样本为30 ~ 100个。
要是全国性的常模,一般地要求有2000 ~ 3000人为宜,一般不少于800到1000。
六、Z分数:指的是以一批分数的平均数为参照点,以标准差为单位的等距量表,不仅具有可比性,而且具有可加性。
标准分数:是以标准差为度量单位原始分数离开其平均数的分数之上多少个标准差,是一个抽象值,不受原始测量单位影响,不仅具有可比性,还具有可加性。
T分数:由标准分数(Z分数)线性转换而得,T=10*Z+50,经过这种转换弥补了Z分数存在负数和小数的缺陷,T是为了纪念推孟和桑戴克的意思。
七、在对测验结果进行解释时,应该遵循下列原则(1)主试应充分把握有关测验的性质和功能。
(2)对于导致测验结果的可能原因的解释必须非常慎重,警惕片面极端的错误。
(3)必须充分考虑到常模和效度存在的局限性。
(4)在解释过程中必须充分参考其他有关资料。
(5)将测验分数视作“一段分数”来解释,而不是“特定的分数点”。
(6) 对于来自不同测验的分数不能直接加以比较。
第七章测验的编制一、测验的标准化:指测验的一致性;包括:编制、实施、计分及解释程序;上述过程都会对测验的准确性产生影响。
编制:行为的代表性;实施:考试环境不同等等。
二、测验编制过程中如何做到标准化。
要做到测验编制过程中的标准化,就要做的遵循以下程序:确定测验的目的1.明确测量用途,首先确定将要编制的测验是用于测量哪一种心理特质或心理结构,其理论基础是什么;其次确定将要编制的测验是标准参照测验还是常模参照测压;2.明确测量对象,每一个测验都有其针对性的测量对象群体。
要考虑到年龄、教育水平和文化背景的差异。
3.明确测量目标,确定能表现将测量的心理特质的行为(确定有代表性的行为样组);确定项目比例,考虑到每一类行为在所测心理特质中的比重。
产生测量题目1.测题形式与目的匹配。
利用不同测题形式的优点和使用范围,将其与测验目的相结合。
2. 初步形成测题,由于经济和实践上的考虑,我们不可能收集能够说明某一行为的所有测题,因此必须确保测题的代表性。
可供考虑的测题来源:(1)已有的优秀的相关测验;(2)修改前人测验中的有关测题:(3)自己编写。
初选题库项目数量是计划题数的2-3倍。
3. 测题检查及修改,包括:(1)测题编制的技术性问题,如:措辞,语法,歧义,文化偏见问题等;(2)初步确定测题的可靠性和可信度。
4. 预测验及分析,在此过程中注意满足下列要求:(1)预测样本和测验对象必须来自同一全域,即预测样本的代表性;(2)人数不必太多,但也不能太少,教育测验一般370人,智力测验至少30人,同时要考虑到预测题目的数量,题多则要求人数也高。
(3)按照正式测验的过程实施;(4)时间要充分,便于收集充分的反应资料;(5)随时记录预测过程中的反应情况,如时间,题意不清的问题,误解,停顿等。