当前位置:文档之家› 第七章 测量与操作化(1)

第七章 测量与操作化(1)


以朱庆芳、吴寒光根据国家统计居城调队编的《1992 年中国城市统计年鉴》为例,来说明综合评分法的具 体步骤和作法。 第一步,搜集数据。 第二步,确定权数,即确定每一个指数的权数。 第三步,确定评分标准,即将每个指标按数值的高低 分成若干组,并给每个组确定标准分的分值。一般来 说,分组越多,准确性越高。 第四步,求出各个指标的得分、分类分和总分。 第五步,进行比较和评价。
3、建构效度 考察建构效度就是要了解测量工具是否 反映了概念和命题的内部结构,这种方 法常常在理论的研究中使用。 由于它是通过与理论假设相比较来检验 的,因此建构效度也被称为理论效度。 它涉及到一个理论的关系结构中其他 概念(或变量)的测量。
例如,假定我们设计了一种测量方法,来测量人们的“婚姻满 意程度”。 为了评价这种测量方法的效度,我们需要用到与婚姻满意程度 有关的理论命题或假设中的其他变量。 假设:婚姻满意程度与主动做家务的行为有关。 婚姻满意程度越高,越是主动承担家务。 那么,如果我们的测量在婚姻满意程度与承担家务方面的结果 具有一致性,则称我们的测量具有建构效度。如果婚姻满意程 度不同的对象在承担家务方面的行为都是一样的,那么,我们 测量的建构效度就面临挑战。 内容效度,它只需要一个单一的概念和对它的一个单一的测量 法。准则效度需要对一个概念的两个以上的测量法。而建构效 度,它不仅需要对一个概念的两个以上的测量法,而且还需要 其他概念及其通过命题与所研究的概念相关的测量法,是最强 有力的效度测定程度。
(二)效度的类型 1、内容效度 它指的是测量内容或测量指标与测量目标之 间的适合性和逻辑相符性。 考察内容效度旨在系统地检查测量内容的适 当性,并根据我们对所研究的概念的了解去 鉴别测量内容是否反映了这一概念的基本内 容。检验内容效度就是检验由概念到指标的 经验推演是否符合逻辑,是否有效。 内容效度实质上是一个判断问题。
2、复本信度 如果一套测验有两种以上的复本,则可交替使用,根据一个受 试者接受两种复本测验的得分计算其相关系数,即可得复本信 度。(复本是针对原本而言的,它使原本的复制品。) 复本类似于考试中的A、B卷,它是根据同一目的,编制出两种 平行的等值量表,就是说,研究者设计两套测量工具以测验同 一主题现象。 如,在测量英语程度时使用A、B卷,如果一个人在A卷和B卷的 得分相同,就说明考题具有信度;如果两者差异很大,则缺乏 信度。 在社会研究中,研究人员可以设计两份研究问卷,每份使用不 同的项目,但都用来测量同一个概念或事物,两份都让同时在 场的同一个或同一群回答者作答。然后根据两份问卷所得的分 数计算其复本信度。 复本信度可以避免上述再测信度的缺点;
二、测量的效度
(一)效度的含义 效度指的是测量的有效性或准确度,即测量工具或测 量手段能够如实反映某一概念真正含义的程度。效度 是指测量工具测出变量的正确性程度。 选择测量工具和设计问卷、表格时,首先要考虑其效度, 也就是说,要考虑测量出来的东西是否真的是研究者想 要得到的东西,所测得的结果是否能正确有效地说明所 要研究的现象. 在评估测量的效度时,如果某一测量方法能测出研究 者所要测量的变量,则此测量方法就可说合乎有效性。 反之,则称为无效的测量或者测量不具有效度。
(二)社会指标的特点 1、具体性或可感知性 2、计量性或可量度性 3、重要性或代表性 4、时间性
(三)社会指标的类型 1、客观指标与主观指标 2、经济指标与非经济指标 3、描述性指标和评价性指标 4、肯定指标、否定指标和中性指标 5、投入指标、活动量指标和产出指标
(四)社会指标的功能 1、反映功能 2、监测功能 3、比较功能, 4、评价功能 5、预测功能, 6、计划功能
3、折半信度 在一种测验没有复本且只能实施一次的情况下,通常 采用折半法来估计测验的信度。 常用的折半法是将受试者的测验结果,按题目的单双 数分成两组记分,计算这两组分数之间的相关系数, 这种相关系数就叫做折半信度。 例如一个态度测量包括30个项目,若采用折半法技术 来了解其内在一致性,则可将这30个项目分为相等的 两部分,再求其相关系数。 通常,研究者为了采用折半信度来检验测量的一致性, 需要在他的测量表中,增加一倍的测量项目。
▲ 内在效度和外在效度 如果在一项具体的研究中,对上述三种效度的检查没 有发现问题的话,就可以认为这一研究具有内在效度, 即它的资料和结论可以有效地解答所研究的问题。但 是,这一研究结论的有效性是否可以适用于其他时间、 地点和对象呢?这就涉及外在效度的问题了,即这种 研究结论的普遍有效性。 例如:在美国的一些城市抽取几百名工人进行研究发 现,“当代工人的阶级意识普遍淡漠”,考查它的外 在效度,就是看它是否在超越具体的时间、地点之后 是否具有代表性,是否具有普遍意义。
2、准则效度 准则是衡量有效性的参照标准。准则效度具体可分为两种情况: 其一,准则效度,指的是用几种不同的测量方式或不同指标对 同一变量进行测量时,将其中的一种方式或指标作为准则,其 他的方式或指标与这个准则作比较。 如果其他的方式或指标与准则的方式或指标具有相同的效果, 则其他的方式与指标就具有准则效度。 其二,准则效度,指的是用一种不同以往的测量方式或指标对 同一事物或变量进行测量时,将原有的一种测量方式或指标作 为准则,用新的方式或指标所得到的测量结果与原有准则的测 量结果作比较,如果新的测量方式或指标与原有的作为准则的 测量方式或指标具有相同的效果,那么,我们就说这种新的测 量方式或指标具有准则效度。 准则是被假设或被定义为有效的测量标准,符合这种标准的测 量工具可以作为测量某一特定现象或概念的效标。 对同一概念的测量可以使用多种测量工具,其中每种测量方式 与效标的一致性称为准则效度。
二、社会指标体系
(一)社会指标体系概念 社会指标体系,是根据一定的目的、一 定的理论设计出来的综合反映社会现象 的具有科学性、代表性和系统性的一组 社会指标。
(二)社会指标体系的特点 1、目的性 2、理论性 3、科学性 4、代表性 5、系统性
(三)社会指标体系的建立 1、社会管理型的社会指标体系。 通常是政府或各行政主管部门为进行社会规 划、社会管理,在原有统计指标的基础上, 经过加工改造而建立起来的。 2、专题研究型的社会指标体系。 通常是各种研究机构或学者为了研究某一社 会课题根据一定的研究假设或价值取向独立 设计出来的社会指标体系。
▲ 准则效度分:预测效度、共变效度、实用效度 a.预测效度 将已经得到的测量结果与未来实际发生的情况进行比较,以检查两 者的一致性。 例如:设计一种预测学生学习成绩的测验,用它来测量学生毕业时 的学习成绩。如果在学生毕业时,实际的成绩确实与预测相一致, 那么这一测验就具有预测效度。 b.共变效度 共变效度是判断其他的测量工具是否可以取代作为效标的测量工具。 例如:假如有一种心理测验方法能高度精确地鉴别出某种精神疾病, 但就是这种测验太费时、费力,在短期内不可能完成检查。如果能 够设计出另一种简单的、自我填写的量表,而且这一量表的测量结 果与心理测验的结果高度相关的话(即具有共变效度),那么它就 可以替代原先的心理测验方法。 c.实用效度。通常用来检查测量工具的实际效果。
信度的大小可以用信度系数(r)来表示。 信度系数,即用同一样本所得到的两组资料的相关系数作为测 量一致性的指标。 信度系数可以解释为在所测对象实得分数的差异中有多大比例 是由测量对象本身的差别决定的。 信度系数高表明测量的一致性程度高,测量误差少。 如,当 r=0.90时,可以认为实得分数中有90%的差异来自测量对象本身 的差别,只有10%来自测量误差; r=1.00时,则表示无测量误差,所有的差异都来自测量对象本身; 这是理想的状况,实际是办不到的。 r=0,则所有的差异均反映了测量误差。 一般来说,r≥0.80,即可认为该测量是达到了足够的信度。
一、测量的信度
(一)信度的含义 信度(reliability)即可靠性,它指的是采取同 样的方法对同一对象重复进行测量时,其所 得的一致的程度。换句话说,信度是测量结 果的一致性或稳定性。也即指测量工具能否 稳定地测量所测的变量。 社会调查必须真实可信的。而且经得起反复 的检验,这样的调查才有价值,因此,信度 是社会调查成功的基本条件。
对于同一种对象,人们常常会采取各种不同的测量方 法,常常会采用各种不同的测量指标。也许这些方法 和指标都没有错,但它们相பைடு நூலகம்之间一定会在效度与信 度这两方面存在程度上的差别。
评价和选择的标准
越是在准确性和一致性上程度更高的方
法和指标,就越是好的测量方法,就越是高 质量的测量指标。
如何评价一种测量是否具有内容效度? 首先,必须知道所测量的概念是如何定义的; 其次,需要知道这种测量所收集的信息是否和该概念密切相关。 然后,评价者才能尽其判断能力之所及,作出这一测量是否具 有内容效度的结论。 例如,用问卷去测量人们的消费观念,首先要弄清“消费观念” 的定义,然后看问卷中的问题是否都与人们的消费观念有关。 如果问卷中的问题明显是有关其他方面的,则这种测量就不具 有内容效度。如果发现问卷中的问题所涉及的都是有关消费观 念方面的内容,而看不出它们是在测量与消费观念无关的其他 观念时,则可以说这一测量具有表面效度。
▲ 内容效度主要考虑: a.测量工具所测量的是否正是调查人员所想要测量的 那种行为? b.测量工具是否提供了有关那种行为的适当样本? 例如,政治知识的考试。其不能列出所有的内容,但 是考试中必然对政治知识的每一部分都列出几道试题, 作为这一部分的样品。这样就能通过考察这些样品是 否代表了变量的各个部分来评判考卷的内容效度。 因此,检查内容效度就是检查由概念到指标的经验推 演是否符合逻辑,是否有效。
三、量表
本部分内容见教材111—119页,要求下 去自学。
第五节 测量的信度与效度
对于任何一种测量工具或测量手段来说,都会涉
及到这样一些基本问题:
测量所得的数据或资料是否与人们感兴趣的特征有关?
测量所得的结果是否正是人们所希望测量的东西?
当这种测量的时间、地点及操作者发生改变时,测量的结果将会受到什 么样的影响?
相关主题