第十章,调查数据的整理
• •
(四)目的性原则 目的性原则是指数据整理的目标应符合调 查研究的目的和要求。数据整理的内容很丰富, 层次也有高低之分。数据整理要达到什么目标, 层次是高是低,是简单还是复杂,在很大程度 上要取决于调查研究的目的和要求。只要整理 的结果能够满足研究的需要,整理结果具有较 好的系统性和条理性就可以了,而不必刻意去 追求形式,更不必要无用的烦琐。
• • • • • • •
组 别 名称码 百货组 01—30 食品组 31—50 家电组 51—65 服装组 66—80 其他组 81—100 这种编码能以较少的位数分组,其缺点是, 一旦编码体系确定遇到某些组内资料增加时, 处理起来就会相当麻烦。 • 4.表义式文字编码法 •
• 该方法又称为助忆编码法,是用数字符号等表 明编码对象的属性,并依此方式对调查数据进 行编码的方法。例如,用180BXJ表示容量为 180升的进口电冰箱,其中180为冰箱的容量, BX表示冰箱,J表示进口。这种方法比较直观, 易于理解,便于记忆。
•
需要说明的是,以上步骤是数据整理的大 致顺序和主要内容,各步整理工作有时是不能 绝对分开的。例如,数据的分组与数据的汇总 往往是同时进行的。
二、调查数据的整理
• 一、审核与筛选 • 收集到的数据是否真实可靠、符合研究的需要, 还应进行审核。一般从准确性、完整性两方面 进行审核。审核准确性是关键,主要是检查数 据是否存在差错,有无异常值。检查的方法有 逻辑检查与计算检查,逻辑检查是通过数据间 相关部分是不是存在违反常识常理彼此矛盾的 地方来判断数据的真实性,如问卷中的答案所 有选项均是A,就可能是填写者敷衍应付。
• •
三、数据整理的一般步骤 数据整理工作是由多个环节组成的,其一 般步骤如下: • (一)数据的审核 • 这是数据整理的第一步。为了保证调查数 据的质量,也为了保证整个调查研究的质量, 在数据整理之初,必须对原始数据的真实性、 准确性和完整性进行严格的审核。对于发现的 问题,要及时加以解决。
• •
• •
(三)科学性原则 科学性原则是指数据整理应根据调查研究 的目的和要求以及数据本身的性质,合理地选 择科学的方法和技术,对原始数据进行系统的 加工和处理,使之能够满足研究的需要。调查 研究的目的和要求不同,数据整理所使用的方 法也会有所不同。例如,如果研究的目的是要 分析居民的收入水平对消费水平的影响,则在 分组整理时,应该对居民的收入水平进行分组, 并计算各收入组的平均消费水平。数据的性质 不同,采用的整理方法也会有所区别。例如, 累计频数和累计频率,适合于定序数据,而不 适合于定类数据。
• •
二、数据整理的原则 数据整理是连接数据调查与数据分析的桥 梁和纽带,为了达到数据整理的目的和作用, 使整理出来的数据符合数据分析的需要,数据 整理应该遵循如下原则: • (一)真实性原则 • 真实性原则是指数据整理必须最大限度地 保证原始数据的真实性。这有两方面的含义: 一是在数据整理之初,必须严格审核原始数据 的真实性,对于审核出来的不真实的数据应该 坚决加以剔除,对于缺失的数据应采取相应的 补救措施;
• • •
二、编码 (一)编码的意义 随着电子计算机使用的普及,调查数据的 整理与分析工作一般都要借助电子计算机来完 成。调查数据中既有数量数据,也有品质数据。 由于计算机只能识别数字符号,因此,对于数 量数据,可以直接录入计算机,而对于品质数 据,则需要将其全部转化为数字符号,以便计 算机的识别。所谓编码,就是将调查数据中的 品质数据转化为数字符号的过程。数据的编码 总是与数据的分类紧密结合的,编码首先要将 数据进行分类,然后给每一个类别指派一个数 字代码。
•
计算检查是运用数据间的平衡关系来判断 数值是否有误。如总量应等于各个子项之和, 总额应等于数量乘单价。审核数据的完整性是 检查应调查的个体是否有遗漏,所要求了解的 范围能否达到,所要调查的项目是否齐全,有 无缺项等。如发现问题应积极采取补救措施, 重新调查搜集,更正错误,数据不全的需要进 一步补充。如果无法纠正错误,又不能补充完 整,对不符合调查要求的数据,则应进行筛选。 筛选有两方面的内容,一是对不符合要求或确 认有错误的数据剔除掉,保留可靠性的数据; 二是过滤,将符合某种特定条件的数据选取出 来,而不符合条件的数据予以剔除。
• 如果是问卷调查,对于封闭型问题,都设计了 若干选项,每一个选项就是一个类别,编码时 只需要对每一个类别指派一个数字代码即可; 对于开放型问题,则先要对全部的回答进行分 类,然后再进行编码。 • 编码有事前编码和事后编码之分。事前编 码是在调查问卷设计时对有结构的问卷所进行 的编码,所以,事前编码适合于问卷中的封闭 型问题。事后编码则是在数据的搜集工作结束 后整理开始之初,对调查问题的可能答案所进 行的编码。对于开放型问题,只能采取事后编 码的方式,而对于封闭型问题,如果未作事前 编码,则必须进行事后编码。
•
例如,某项关于社会公众保险意识调查中, 对被调查者个人的基本情况(性别、居住地、 家庭人口和月收入水平)进行了调查,运用分 组编码法对有关信息编码如下(见表2-1):
• 若某个被调查者是女性,居住在中等城市, 家中有三口人,月收入为1100-1200元,则其 回答信息的编码就是:22312。 • 分组编码法应用广泛,容易记忆,处理方便, 但有时位数过多,造成系统维护上的困难。 • 3.信息组码编码法 • 该方法是把调查数据区分为不同的组,给 每一个组以一定的组码(数字区间)来进行编 码的方法。例如,对某地市场上的100种商品 的价格变动进行调查,在运用信息组码编码法 对调查的信息进行编码时,首先可以将这100 种商品划分为百货组、食品组、家电组、服装 组和其他组,然后给每一个组分配一个组码:
• •
一、数据整理的含义 数据整理,就是根据调查研究的目的与任务,运 用科学的方法,将调查所获得的原始数据进行审核汇 总与初步加工,使之系统化和条理化,并以图表的方 式集中显示数据特征的工作过程。 • 数据整理在整个调查研究过程中具有很重要的作 用和地位: • 第一,数据整理全面地检查了调查数据的质量, 保证了调查数据的有用性。由于各种主客观原因,通 过调查所获得的原始数据,难免出现虚假、差错、缺 损、余冗等现象。因此,只有对调查数据进行科学的 整理与审核,捡漏与补缺,去伪存真,去粗取精,才 能保证调查数据的真实性、准确性、完整性和有用性, 从而保证整个调查研究工作的质量,达到调查研究的 目的。
•
由于在数据的编码工作完成后,为了便于 数据的录入,还要根据编码手册将问卷或调查 表上的数据数字化,并将这些数字过录到登录 卡上。一般的登录卡是每张80列(因为个人计 算机屏幕的宽度为80个字节;每列记录一个数 字)25行(每行记录一份问卷或调查表上的回 答信息,每行可以记录一个80位的代码数字)。 这样,就需要将每个调查项目的代码在行上的 位置确定好。代码位置的确定要根据调查项目 的顺序和各个项目的编码位数依次排列下来, 则各代码在登录卡上行列上的位置就自然确定 了。下面是本次调查编码手册一个• • • •
1.您的职务 (1)正高级 (2)副高级 (3)中级 (4)其他 2.您的年龄 3.您从事的专业 4.您对自己工作状况的评价是 (1)已充分发挥积极性 (2)基本发挥了积极性 (3)积极性有所发挥
• 5.目前,您是否有离开学校的想法 • (1)有 • (2)没有 • 6.请您按投入精力的多少,将下列三项活动排序 • (1)校内工作 • (2)校外兼职 • (3)生活琐事 • 第一位 第二位 第三位 • 上述六个问题中既有封闭型问题(1、4、5、6),也 有开放型问题(2、3)。该项调查收回有效问卷2000 份。对于封闭型问题,问题1、4、5的代码位数均为1 位,问题6的代码位数均为3位;对于开放型问题,问 题2的代码位数为2位(本次调查中年龄最大的为65 岁),问题3的代码位数为3位(本次调查根据被调查 者的回答,共涉及112个专业)。
•
第二,数据整理是数据分析的基础。数据 分析的目的是揭示所要研究现象总体的数量特 征和统计规律,而通过调查所获得的原始数据 是关于总体中若干个体的分散的、零碎的数据 资料,只有通过汇总整理,使原始数据系统化、 条理化、综合化,才能在此基础上对数据进行 分析和研究。数据整理的质量如何,直接关系 到数据分析的质量,关系到调查研究能否科学、 客观地认识事物和现象。 • 第三,数据整理是积累和保存资料的客观 要求。通过调查获得的原始数据,既是对现象 进行分析研究的客观依据,又是对今后研究同 类现象的重要参考资料。只有通过数据整理, 才能使原始资料具有真实性、可靠性和有用性, 才能使原始调查数据具有长期保存和利用的价 值。
• (1)小于500元 • (2)500元—1000元 • (3)1000元—1500元 • (4)1500元以上 • 这种编码方法操作简便,但不便于进行分 组处理。 • 2.分组编码法 • 该方法又称为区间编码法,是根据调查数据的 属性特点和处理要求,将具有一定位数的代码 单元分成若干个组(或区间),每一个组(或 区间)的数字均代表一定的意义。
第十章 调查数据的处理与呈现
框架
• 一、调查数据的整理 • 二、调查数据的整理方法 • 三,调查数据的显示
一、数据的整理
•
通过调查所获得的数据都是关于个体的有 关属性与特征的表现,这些数据零碎而不系统, 分散而无条理,还不能概括和描述所要研究现 象总体的数量特征,也不能直接据之分析现象 总体的本质特征与统计规律。所以,在对调查 数据进行分析之前,必须根据分析研究的目的 和要求,对其进行系统的加工与整理。这一阶 段的工作是联系数据调查与数据分析的中间环 节,在整个调查研究过程中具有重要的地位。
(二)数据的编码 对于一些样本量较大或调查项目较多的调 查,往往要借助计算机来进行数据的整理。这 就需要对调查数据进行编码,将问卷或调查表 的信息转化成计算机能识别的符号。 • (三)数据的分组 • 数据的分组是数据整理的一项十分重要的 工作。它是根据调查研究目的的需要,按照一 定的标准,对原始数据进行分组整理,为数据 分析做准备。