第十二章研究资料的审核、整理与统计分析
一、资料的审核与整理
1.资料审核的概念和原则
(1)资料审核的概念
指在着手整理调查资料之前,对原始资料进行审查与核实的工作过程,目的是保证资料的客观性、准确性和完整性,为资料的整理打下坚实的基础。
(2)资料审核的原则
①真实性原则。
对收集到的资料要根据实践经验和常识进行辨别,看其是否真实可靠地反映了调查对象的客观情况。
②标准性原则。
在较大规模的调查中,对于需要相互比较的材料要审核其所涉及的事实是不是具有可比性,对于统计资料更要注意指标的定义是否一致,计量单位是否相同等。
③准确性原则。
要对资料进行逻辑检查,检查资料中有无不合理和相互矛盾的地方。
④完整性原则。
要检查调查资料是不是按照提纲或统计表格的要求收集齐全。
2.资料的整理
(1)资料整理的概念
资料的整理是根据研究目的将经过审核的资料进行分类汇总,使资料更加条理化和系统化,为进一步深入分析提供条件。
(2)资料整理应遵循三条原则:
①条理化。
是指对资料进行分类从而为进一步的分析创造条件。
②系统化。
是指从整体上考察现有资料满足研究目的的程度如何,有没有必要吸收补充其他资料。
③统计汇总。
是指将调查得到的各种数据进行初步的统计整理,以把握其总体上的数量特征。
(3)分类与分组
从严格的意义讲,分类和分组都是一种定性分类方法,即根据研究对象的某些特征将其区分为不同种类。
分类适用于全部调查资料,分组只限于数量化的统计资料,习惯上将后者称为统计分组或称为统计分类。
①分类的类型
a.现象分类法:根据事物外部特征或外在联系进行分类的方法;
b.本质分类法:根据事物的本质特征或内部联系进行分类的方法。
本质分类法也被称为科学分类法。
②分类的意义
a.现象分类法可以帮助调查者建立资料存取系统,便于资料的存取、查找和利用。
调查初期建立的往往是这种分类系统。
b.本质分类不仅是资料的存取、检索系统,而且是调查者对客观事物和规律认识的总结系统。
它不是一个单纯技术性问题而是理论问题,反映出研究者的理论观点,并需要具体学科理论的指导。
(4)选择和确定分类标志的原则
①分类标志的类别。
分类标志可以分为品质标志和数量标志。
按品质标志分类就是选择
反映事物属性差异的品质标志为分类标准。
按数量标志就是选择反映事物数量差异的数量标志为分类标准。
②选择分类标志的原则。
a.从研究目的出发选择标志;
b.从反映事物本质的需要去选择标志;
c.根据具体的历史条件去选择标志;
d.分组标志的确立必须坚持穷尽性和互斥性的原则。
二、资料汇总
1.计算机汇总的步骤
(1)编码。
是指将问卷中的信息数字化,转换成统计软件和统计程序能够识别的数字,这项工作是一种信息代换的过程。
(2)登录。
是指将编好码的问卷资料过录到资料卡片上去,以便于将它们输入到计算机的软盘或硬盘等存储设备上去。
(3)录入。
是指将登录在资料卡片上的数据录入到计算机的存储设备(软盘、硬盘等)上,其工作性质同登录相同。
(4)程序编制。
要用计算机汇总资料就必须给计算机输入一种指令,指挥计算机进行工作,这种指令就是程序。
2.统计表
(1)含义
资料通过统计汇总,得出许多说明社会现象和过程的数字资料,把这些资料按照一定的目的,在表格上表现出来,这种表格就叫做统计表。
(2)统计表的意义
①能有条理、有系统地排列统计资料,使人们在阅读时一目了然。
②能合理地、科学地组织统计资料,使人们在阅读时便于对照比较。
(3)统计表的结构
从外表形式上看,统计表由总标题、横行标题、纵栏标题、指标数值四部分组成。
有的统计表下增列补充资料、注解、附记、资料来源等。
从内容上看,统计表由主词和宾词两部分构成。
(4)统计表的种类
①简单表,是指按总体未做任何分组,仅罗列各单位名称或按时间顺序排列的表格。
②简单分组表,是指总体仅按一个标志进行分组,即运用简单分组形成的表格。
按照分组方法的不同,又可分为单项分组表和组距分组表。
③复合分组表,是指总体按两个以上标志进行层叠分组的统计表,又称为交互分类表。
(5)统计表的设计
①统计表形式的设计
a.统计表的上、下两段应以粗线绘制,左、右两端习惯上不划线,采用不封闭的“开口”表示;
b.统计表应是长、宽之间保持适当比例的长方形,过于细长、短粗或正方形都应尽量避免。
②统计表的内容设计
a.统计表的总标题应当用简练而又准确的文字来表达统计资料的内容以及资料所属的空间和时间范围。
b.统计表中的指标数值有着一定的计量单位。
c.当数字为0时要写出来;如果不应有数字时应用横短线“一”表示;当缺某项数字或因数字小可忽略不计时,用省略号“…”表示;当某项资料应免填时,用符号“X”表示。
统计数字部分不应留下空白。
三、定量研究资料的统计分析
1.统计分析概述
(1)含义。
社会研究资料的统计分析是采用数理统计的方法和技术对社会研究中获得的资料进行定量分析。
(2)统计分析的作用表现在以下几个方面:
①其方法可以为社会研究提供一种清晰精确的形式化语言;
②是进行科学预测,探索未来的重要方法;
③统计分析技术是处理调查研究资料的必要工具。
(3)统计分析的特点:
①要以定性分析为基础;
②有一套专门的方法和技术。
2.单变量描述性统计分析
(1)集中量数分析
①平均数。
是表明一组数据的平均水平的数值。
平均数分为:
a.简单算术平均数。
简单算术平均数法就是直接由原始数据计算算术平均数的方法;
其计算公式为:
b.加权算术平均数。
当使用统计表中的分组资料计算平均数的时候,要用加权平均数法进行计算。
其计算公式为:
②中位数。
把一组数据按照其大小顺序排列起来,处于最中间位置那个数就是中位数。
③众数。
是指在一组数据中出现次数最多的标志值。
(2)离中量数分析
①异众比率。
是指非众数的次数与总体内全部总体单位的比率。
其计算公式为:。
式中,VR代表异众比率;n是总体内全部总体单位的数;f m0为众数的次数。
②四分位差。
把一组数据按大小排列成序列,然后分成四个数据数目相等的段落,各段落分界点上的数叫四分位数,四分位差就是第三个四分位数的值减去第一个四分位数值。
a.对定序类型资料计算的四分位差。
这时的计算公式应是:
Q=Q3一Q1
b.对于定距类型资料计算四分位差。
这时的公式是:
③标准差。
标准差又叫做均方差,是指资料中各个数值与算术平均数相减之间的平方和。