心理问师三级心理测量学知识点整理心理问师三级第五章心理测量学知识点整理一、测量要素:参照点:1)绝对零点;2)相对零点。
在心理测量中不会找到绝对零点,只能人为的采纳相对零点(常模)。
单位:(必须具备两个条件):1)有确定的意义;2)有相同的价值。
二、测量量表:是一具有单位和参照点的延续体:从低级到高级分成四中水平:(1)命名量表:数字只能用来做标记和分类,别能做数量化分析。
(2)顺序量表:数字仅表示等级,并别表示某种属性的真正量或绝对值。
(3)等距量表:有相同单位,其数值能够做加减运算,但没有绝对零点,所以别能做乘除运算。
注:等距量表的数值加或减一具常数或用一具常数乘或除,别破坏原来数据的关系。
(4)等比量表:既有相等单位,又有绝对零点。
所得的数值均能够做加、减、乘、除运算。
如长度、分量和时刻基本上等比量表。
注:心理测量首先是在顺序量表上举行的。
然后运用某些统计学的办法,把这种顺序量表得到的数据,换算到等距数据举行转换。
三、测验的分类:按测验的功能分类:1、智力测验 2、特别能力测验;3、人格测验。
按测验材料的性质分类:1、文字测验;2、操作测验(非文字测验)。
按测验材料的严谨程度分类:1、客观测验;2、投射测验(受社会赞许妨碍别大;受应试动机的妨碍较小)。
按测验的要求分类:1、最高作为测验(有正确的答案。
如智力测验、成就测验等);2、典型行为测验(没有正确答案。
如人格测验均属典型行为测验)。
四、确定常模团体时,要先确定普通总体,再确定目标总体,最终确定样本。
常模团体的条件1、群体的构成必须明确界定;2 常模团体必须是所测群体的代表性的样本;3、样本的大小要适当(样本大小适当的关键是样本具有代表性,普通性常模:最低很多于 30 或 100 个)。
4、全国性常模:普通 2000~3000 人为宜。
5、标准化样组是一定时空的产物五、常模团体取样的办法:从目标人群中挑选有代表性的样本。
分为:1、简单随机抽样;2、系统抽样(目标总体无序可排,也无等级机构存在);3、分组抽样(总体目标较大,如全国取样);4、分层抽样(分层比例抽样,分层非比例抽样)。
六、常模,是一种供比较的标准量数,由标准化样本测试结果计算而来,它是心理测验时用于比比较和解释测验结果的参照份数标准。
常模分数:将被试者的原始分数按一定的规则换算出来的导出分数(又叫常模表)。
常模分数的要素:原始分数;导出分数。
七、进展常模:年龄量表中的个人分数指出他的行为在按正常途径进展方面处于啥样的进展水平。
智力年龄:1936年吴天敏和陆志韦修订的《中国比内--西蒙智力量表》为例。
每个年龄有6个题目,答对每个题目代表2个月的智令,例如:某儿童 6 岁组的题目全部经过,7 岁组经过 4 题,8 岁组经过 3 题,9 岁组经过 2 题,其智龄为:6 岁+4*2(月)+3*2(月)+2*2(月)=6 岁+18=7 岁6个月。
(满 12 个月令=1 智龄)八、百分位常模包括:百分等级:是指在常样子本中低于那个分数的人数的百分比。
百分等级支出的是个体在常模团体中所处的位置,百分等级越低,个体所处的位置就越低。
百分点也称百分数:是计算处于某一百分比例(百分等级)的人对应的测验分数(原始分数)是多少。
在分数量表上,相关于某一百分等级的分数点就叫百分点或百分位数。
经过如此的双向方式编制的原始分数百分等级对比表,算是百分位常模。
四分位数和十分位数:1)四分位数:相当于百分等级的 25%、50%、75%对应的三个百分位数分成的四段。
注:最小的是 1%;2)十分位数:1%-10%为第一段,41%-50%为第五段,91%-100%为第十段。
百分等级标准二十分离差智商10(平均数)3(标准差) 100(平均数)15(标准差)16 98% 130 213 84% 115 110 50% 100 07 16% 85 -14 2% 70 -2九、标准分常模:是将原始分数与平均数的距离,以标准差为单位表示出来的量表。
因为它的基本单位是标准差,因此叫标准分数。
标准分数可分为经过线性转换和非线性转换两大类。
常态化的标准分数(线性转化的标准分)有:T 分数:以 50 为平均数(加一具常数 50),以10 为标准差(乘以一具常数 10)所表示的标准分,通常叫 T 分数。
T=50+10*z(相当于 z);标准九分:平均数为 5,标准差为 2,普通用于评价教学中成绩的分级和美国空军,标准十分:平均数为 5.5,标准差为 1.5,;标准二十分:平均数为 10,标准差为 3.离差智商是常态化标准分中应用最广,妨碍最大的标准分。
非线性转换标准分:常态化过程:①将原始分转化为百分等级;②再将百分等级转化为常态分布上相应的标准分数。
原始分数别是正态分布时,也能够经过非线性转换。
十、比率智商:局限性:因个体心理年龄与实脚年龄并别同步增长的,因此它别适合年龄较大的受测者。
离差智商:是依据测验分数常态分布来确定的。
离差智商的平均数为 100,标准差为 15。
其优点为:韦克斯勒的离差智商建立在统计学的基础上;它表示的是个体智力在同年龄组中所处的位置;离差智商是表示智力水平高低的一种理想指标。
其公式:IO=100+15*z=100+15*{X(量表分数)-X(平均量表分数)}/SD(量表分数的标准差) *100。
的斯坦福一比内量表中采纳了离差智商平均数为 100,标准差为 16.十一、信度评估的恐怕办法:1 重测信度又称稳定性系数:要紧考察了跨时刻的一致性。
优点:能提供有关测验是否随时刻而变异的资料,可作为被试未来行为表现的依据。
缺点:易受练习和经历的妨碍。
普通分为两周到四周为宜,间隔时刻最好别超过六个月。
2、复本信度又称等值性系数:它要紧考察了跨形式的一致性(等值性)。
假如两个复本的施测相隔一段时刻,则称重测复本信度或稳定与等值系数。
他既思考了测验在时刻上的稳定性,又思考了别同题目反应的一致性。
3、内部一致性信度;要紧反映的是题目之间的关系,表示测验可以测量相同内容或特质的程度。
4、评分者信度:普通要求在成对的受过训练的评分者之间平均一致性达 0.90以上,才以为评分是客观的。
十二、信度解除个人分数的意义:一是恐怕真实分数的范围;二是了解实得分数再测试时也许的变化情形。
标准误差:SE=SX√1-rxx。
在 95%的或然水平常,其置信区间为X-1.96SE<XT≦X+1.96SE。
XT 是真分数。
即大约 95%的可能性真分数落在所得分数±1.96SE 的范围内有 5%的可能性落在范围之外。
十三、妨碍信度的因素:样本特征:1、样本团体异质性的妨碍。
样本团体较为异质的化,往往高估测验的信度,反之则会低估测验的信度。
2、样本团体平均能力水平的妨碍。
测验长度:测验越长测题取样或内容取样越有代表性;测验越长被试的推测因素妨碍就越小。
注:增加测验长度的效果应遵循酬劳递减率原则,则测验过长会引起被试的疲劳和反感而落低可靠性。
3、测验难度:若测验对某团体太难或太易,则分数范围将缩小,从而使信度落低。
假如某个测验适用范围非常广,其难度水平通常适合于中等能力水平的受测者,而对较高水平或较低水平的受测者也许较易或较难,使得分数分布范围缩小,信度水平落低。
4、时刻间隔:以再测法或复本法求信度,两次测验间隔时刻越短,其信度系数越大;越久,其他变因介入的也许性越大,受外界妨碍也越大,信度系数便越小。
十四、效度的评估办法:1、内容效度:它和测验的内容有关。
内容效度的评估办法:1)专家推断法(是一具逻辑分析的过程,所以又称逻辑效度)其步骤是:①定义好测验内容的总体范围;②编制双向细目表;③制定评定量表来测量测验的整个效度;2)统计分析法:除了描述性语言外,内容效度的统计办法能够采纳一些统计分析办法如评分者信度。
克伦巴赫提出,内容效度可由一组受测者在独立取自同样内容范围的两个测验复本上得分之复本相关来恐怕。
再测法可用于内容效度的评估。
3)经验猜测法。
2、构想效度的评估办法:①对测验本身的分析:内容效度可作为构思效度的证据;测验的内部一致性指标可提供证据;被试者对题目的反应特点可提供证据。
②测验间的相互比较:相容效度可提供依据;区分效度可提供证据;因素分析法可提供验证办法。
③效标效度的证明研究;④实验法和观看法证实。
3、效标效度又称实证效度:它分为并且效度和预测效度。
评估办法:①相关法②区分法;③命中率法:是当测验用来做取舍的依据时,用其正确的比例作为效度指标的一种办法。
它分为四种事情:预测成功实际也成功:预测成功但实际上失败;预测失败而实际上成功;预测失败实际上也失败。
我们称正确的预测为命中,别正确的为失误。
总命中率=命中/命中+失误;正命中率=测验与效标皆成功的人数/预测成功人数=B/A+B。
临界分数越高,正命中率越高;反之,就越低。
十五、效度的功能:1、预测误差:效度系数常用决定性系数来表示,即相关系数的平方,它表示测验正确预测或解释的效标方差占总方差的比例。
如:效度是 0.8,则表示总方差中有 64% 的方差是测验分数的方差,即测验分数正确预测的比例是 64%,其余 36%则无法做出正确的预测。
2、预测效标分数:Y=a+byxX。
Y 是预测的效标分数,a 是丛轴的截距,byx 是歪率,X 是测验分数。
十六、妨碍效度的因素:1、测验本身的因素;2、测验中的干扰因素:①主试的妨碍因素;②被试的妨碍因素;3、样本团体的特质:①样本团体异质性。
样本团体越异质,分数分布范围越小,效度越低;反之亦然;②干预变量(关于别同性质的团体,如年龄、性不、教育水平、智力、动机、兴趣、职业等,由于这些特征的妨碍,使得测验关于别同的团体具有别同的预测能力,而这些特征算是干预变量)。
十七、命题的普通原则:(1)内容方面:符合测验目的:取样有代表性;题目间相互独立;(2)文字方面:准确,幸免使用生僻字词;简明扼要;一句话讲明一具概念;尽可能少用双重否定句;(3)明白方面:应有确切答案;题目内容别超出受测团体的知识水平和明白能力;题目格式不可能被人误解;(4)社会敏感性方面:避开社会敏感性咨询题:题目别涉及社会禁忌或个人隐私,其假设是:①命题时假定被试者具有某种行为;②命题时假定规范别一致;③指出该行为的常见的,尽管是违规的。
十八、项目分析包括定性分析和定量分析,经过项目分析能够挑选和修改测验题目,以提高测验的信度和效度。
难度的定义:难度的指标通常一经过率表示,即答对过经过该题的人数的百分比。
P(项目的难度)=R(答对或经过该项目的人数)/N(全体被测人数)*100%数越多,难度越低;反之亦然。
P 值大小和难度高低成反比。
在费能力测验中(如人格测验),类似的指标是“通俗性”。
难度的计算:二分法记分的项目大多数挑选题,经过记 1 分,错误记 0 分。