心理测量的基本理论Ps:我是今年才考完北师大心理学专硕的研究生,这是自己在准备研究生考试时整理的一些心理测量方面的资料,希望能够帮助到想考心理学研究生或者是心理学本科专业的同学,有错误的话,也希望能够指出来,评论或者私信都好,目的是方便大家共同学习。
(一)心理测量的理论基础1.心理测量的基本概念(1)心理测量的定义心理测量:根据一定的法则用数字对人的行为加以确定即依据一定的心理学理论,使用一定的操作程序,给人的行为和心理属性确定出一种数量化的价值。
心理测验:对行为样组进行客观和标准化的测量,其本质上是心理测量的工具心理测验有三个要素,即行为样组、标准化、客观性。
(2)心理测量的特点①间接性——心理属性是内在的不可直接测量到的特质,但可表现为一系列具有内在联系的外显行为,测量者可以通过一定的方法测量这些外显行为,并由这些行为判别特质的性质。
②相对性——对人的行为进行比较,没有绝对的标准,亦即没有绝对零点,我们有的只是一个连续的行为序列。
所有的心理测量都是看每个人处在这个序列的什么位置上,也就是只有顺序量表的特征。
③客观性——实际上就是测验的标准化问题。
测验用的项目,说明、言语、态度、评分、分数转换、解释都需要标准化。
2.心理测量的特征分类(1)按所测量的心理特征分类①能力测验——个人已有的知识、经验、技能②成就测验——经过正式教育或训练后对新知识和技能的掌握程度③人格测验——性格、气质、兴趣、态度、品德、情绪、动机、信念、价值观等(2)按接受测量的人数分类①个别测验——一名主试在一段时间内测量一名被试②团体测验——一段时间内一名主试同时测量许多人(3)按测验目的分类①描述性测验——仅仅是进行描述②诊断性测验——对为了解决存在的问题而预先做出的诊断③预示性测验——了解人的潜能和未来的表现(4)按测验要求分类①最高作为测验——被试尽可能做出最好的表现②典型作为测验——被试按通常的习惯和没有压力的方式做出反应(5)按评价所参照的标准分类①常模参照测验——将被试的水平与常模比较,以评价被试在团体中的相对地位为目的②目标参照测验——将被试水平与一个绝对标准比较③潜力参照测验——将被试水平与自身潜力相比较3.经典测量理论和真分数理论模型(1)基本定义真分数:反映被试某种心理特质真正水平的数值其是一个在理论上构想出来的抽象概念,在实际测量中很难得到观察分数:实测到的分数我们希望通过改进和完善测量工具及方法的方式来使得观察分数尽量接近真分数。
CTT 数学模型:观察分数与真分数之间是一种线形关系,并只相差一个随机误差X T E =+其中X 表示观察分数;T 表示真分数;E 表示随机误差(不包含系统误差)(2)CTT 模型的三个假设公理①反复测量得到的观察分数的平均值会接近真分数,E 服从均值为零的正态分布②真分数和误差分数之间的相关为零③平行测验上的误差分数之间相关为零平行测验:题目不同的测验测的是同一特质,且题目形式、数量、难度、区分度以及测查等值团体后所得分数的分布一致(3)CTT 模型的方差关系①在一次测量中,被试观察分数的方差等于其真分数方差与误差分数方差之和222X T E S S S =+ ②真分数变异还可以分成与测量目的有关的变异和与测量目的无关的变异222T V I S S S =+(二)测量的信度与效度1.测量的信度(1)信度的定义信度:测量结果的稳定程度若能用同一测量工具反复测量某人的同一心理特质,则其多次测量的结果间的一致性程度就叫信度。
信度的三个等价操作定义:①信度是一个被测团体的真分数的变异数与实得分数的变异数之比②信度是一个被试团体的真分数与实得分数的相关系数的平方③信度是一个测验与其任意一个平行测验的相关系数(这个定义具有实际意义)(2)信度系数的估计Ⅰ 重测信度:用同一个量表对同一组被试施测两次所得结果的一致性程度计算:其大小等一同一组被试两侧测验所得分数的皮尔逊积差相关系数(参见《MJ 心理大纲详解-心统》P8) 实用的前提条件:①所测量的心理特性必须是稳定的②遗忘和联系的效果基本上互相抵消③两侧测验的间隔被试的特质没有变化Ⅱ 复本信度:两个平行的测验测量同一批被试所得结果的一致性程度计算:其大小亦等于两侧测验分数的皮尔逊积差相关系数。
前提:①有条件构造出两份或以上真正平行的测验②被试有条件接受两个测验Ⅲ 分半信度:将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度也可以把对等的半测验堪称是在最短时距内施测的两个平行测验。
计算:先按照复本信度的方式计算出半个测验的信度,然后用斯皮尔曼-布朗公式校正()21hh XX hh r r r =+若两个分半测验分数变异不等时则用()22221a b XX X S S r S ⎡⎤+=-⎢⎥⎢⎥⎣⎦或221d XX X S r S =- 前提:①通常在只能施测一次或没有复本的情况下使用②由于将测验分半的方法很多,因此一个测验有多个分半信度值Ⅳ 同质性信度:测验内部所有题目间的一致程度这里的一致性指所有题目都测的是同在一种心理特质,也指所有题目得分之间都具有较高的正相关 计算:()()211i i XX X p q K r K S ⎡⎤⎡⎤=-⎢⎥⎢⎥-⎣⎦⎢⎥⎣⎦∑,K 为题目数,i i p q 为答对答错i 题的比例 ()()2211i XXX S K r K S ⎡⎤⎡⎤=-⎢⎥⎢⎥-⎣⎦⎢⎥⎣⎦∑,2i S 表示所有被试在i 题上的分数变异Ⅴ 评分者信度:多个评分者给同一批人的答卷进行评分的一致性程度计算:评分者为2用积差相关或登记相关,大于2用肯德尔和谐系数估计(参见《MJ 心理大纲详解-心统》P9)(3)信度的影响因素与改进影响因素:被试方面、主试方面、施测情景、测量工具、两侧施测间隔(越短越好)提高方法:①适当增加测验的项目数②使测验中试题的难度接近中等水平的正态分布③提高测验试题的区分度④尽量选取同质性较强的团体上的信度2.测量的效度(1)效度的定义效度:一个测验或量表实际能测出其所要测得心理特质的程度效度的操作定义:效度是总变异中由所测量的特性造成的变异所占的百分比效度的三个性质:①效度是针对一次或某几次测验的具体结果的②效度是针对某种特定的测验目的的③效度只是程度上的差异,不是有无的差别(2)效度的估计效度估计就是多方寻找证据来证明测验的有效性程度的过程。
(测量中效度与实验中不同,区别理解。
——MJ注)Ⅰ内容效度:一个测验实际测到的内容与所要测量的内容之间的吻合程度估计一个测验的内容效度就是去确定该测验在多大程度上代表了所要测量的行为领域。
适用范围:内容效度主要应用于成就测验,也适合于某些用于选拔和分类的职业测验而不是和能力和人格测验确定方法:①明确欲测内容的范围,包括知识范围和能力要求两个方面②确定每个题目所测得内容,并与测验编制者所列的双向细目表对照③制定评定表,考察题目对内容的覆盖率及其比例和内容的适当性并判断题目难度与能力要求间差异统计计算:从同一内容中抽两套平行测验对一批被试测验,两次相关高说明有效度(除非两个测验偏向同一方面);也可以用再测法,通过后侧成绩与前侧成绩比较。
Ⅱ结构效度:测验能说明心理学上的理论结构或特质的程度,或用心理学上某种结构或特质来解释测验分数的恰当程度结构指用来解释人类行为的理论框架或心理特质,是心理学中抽象的假设性概念、特性或变量。
特点:①结构效度的大小首先取决于实现假定的心理特质理论②当实际测量的资料无法证实我们的理论假设时,不一定表明该测验结构效度不高③结构效度是市通过对测量内容的选择的证据累计起来确定的,不是靠单一数量指标描述的确定方法:①提出理论假设,并把假设分解成一些细小的纲目②依据理论框架,推演出有关测验成绩的假设③用逻辑的和实证的方法来验证假设应用范围:主要用于治理测验、人格测验等估计方法:①从测验内部寻找证据,先考察测验的内容效度②在测验间寻找,将新编测验与已知有效的测验比较③考察测验的实证效度④多种特质-多种方法矩阵法Ⅲ实证效度:一个测验对处于特定情景中的个体的行为进行估计的有效性,也就是说以实践效果作为检验有效性的表准根据效标资料搜集的时间差异,实证效度可分为同时效度和预测效度两种。
效标是作为检验效度的标准的被估计的行为,即衡量测验是否有效且独立与测验的外在标准。
确定方法:①明确观念效标②确定效标测量③考察测验分数与效标测量的关系估计方法:①相关法——计算测验分数与效标测量的相关系数②区分法——被试接受测验后,让他们工作一段时间,再根据工作成绩的好坏分成两组。
这时再回过头来分析这两组被试原先分数的差异,将成绩与分数比较③命中率——决策的命中率是测验有效性的较好指标(3)效度的影响因素与改进影响因素:测验的构成、测验的实施过程、被试情况、所选效标的性质、测量的信度提高方法:①精心编制测验量表,避免出现较大的系统误差②妥善组织测验,控制随机误差③创设标准的应试情景,让每个被试都能发挥正常的水平④选择正确的效标、定好恰当的效标测量,正确地使用有关公式3.信度和效度的关系根据公式2222X V I ES S S S=++,可以得到信度与效度的关系如下:①信度高是效度高的必要而非充分条件②测验的效度受它的信度制约(三)心理测量的误差误差是世界本原通往人类认知途中的收费站和化妆师。
——Major S.Lu1.测量误差的定义测量误差:在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应心理测量的误差包括随机误差和系统误差两种。
随机误差:由与测量目的无关的、偶然因素引起的、而又不易控制的误差它使多次测量产生不一致的结果,其方向和大小的变化完全是随机的,只符合某种统计规律。
系统误差:由与测量目的无关的变量引起的一种恒定而又规律的效应这种误差稳定的存在与每次测量之中,尽管多次测量结果一致,但仍与真实值有所差异。
2.测量的随机误差来源及控制(1)来源①测试环境——温度、光线、噪音等②测试时间——时间安排不统一,或测试时间过短③主试因素——年龄、性别、穿着、言谈举止、表情,主试的数量过多也会造成压力④意外干扰——停电、巨响、有人生病、作弊、测验用品出问题、粮食涨价、火星人入侵⑤评分计分——主观题评分不客观,有个人偏好(2)控制测验准备尽可能充分细致,实测个方面尽量标准化3.测量的系统误差来源及控制(1)来源①测验难度——过高或过低②测验内容——选题不当、题数太少、模棱两可、表述不清③被试因素——应试动机变化、测验焦虑、测试经验、学习与发展、反应倾向、生理因素(2)控制题目编制认真用心,测验标准化4.测量误差的估计?E T S S =tt r 为信度系数(四)心理测验的项目分析项目分析:测验编制过程中,为了改善和提高测验的信度和效度,在组成测验之前,应对组成测验的每个题目进行分析1.题目的难度(1)定义难度:测验项目的难易程度,一个测验项目,如果大部分被试都能答对,则该项目的难度就小,反之亦然测验的记分方法不同,项目难度的计算方法也不同。