调查资料的整理方法
某车间50名工作日加工零件数分组表 按零件数分组
105-110 110-115 115-120 120-125 125-130 130-135 135-140
合计
频数(人)
3 5 8 14 10 6 4
50
频率(%)
6 10 16 28 20 12 8
100
组距式分组中的一些概念
上限 组限 组距 组中值 下限 区间数值的最大值 区间数值的最小值
每一组的区间长度 组距=上限-下限
每一组中点位置的数值
组中值=(上限+下限)÷2
开口组
注意
缺少上限数值或下限数值的组
开口组以相邻组的组距作为该组的组距, 确定其下限或上限,再计算组中值。
某地区100个国有企业 月销售额与流通费用情况
每百元商品销 如:组距d=U-L 销售额 商店数 售额中支付的 =100-50=50(万元 (万元) (个) 流通费(元) 上组限U 10 14.2 50以下 20 11.4 50~100 30 10.1 100~200 25 如:组中值 9.2 x=(U+L)/2 200~300 下组限L 300以上 15 8.5 =(100+200)/2
体中性质相同的单位组合成一组。
二、分组标志的选择
•所谓标志,是指反映事物属性或特征的名称。
选择分组标志的原则
根据统计研究的目的选择分组标志
根据现象的本质特征选择分组标志
考虑现象所处的具体时空条件。
关键:服从研究任务需要,反映总体本质特征
三、分组的类型
• (一)按分组标志性质的不同划分: –品质标志是反映事物属性的标志,如老年人按婚姻状况、
–是进一步分析研究资料的基础。 对分散、零碎的资料进行
加工整理,使之系统化、条理化,在此基础上,对资料的分析研 究才成为可能。
–是保存资料的客观要求。对资料进行整理后能使原始资料具
有真实性和可靠性,使原始资料具有长期保存和利用的价值。
二、资料整理的原则
–真实性。这是资料整理必须遵循的最基本原则。 –准确性。事实要准确,数据要准确,事实材料不能含糊不清、
三、资料的编码
• 整理后的资料一般均要使用计算机进行数据处理,在资料 的整理工作中须对资料进行编码,即将问卷或调查表中的 信息转化成计算机能识别的数字符号。 • 多用于结构性调查,如结构式问卷。 —对于问卷表或调查表中的少数开放式问题,可在对所有回 答进行分类的基础上,给每一类回答定一个代号,制成编 码表。
选择分 组标志
科学性: 组间差异 大,组内 差异小。
确定分 组体系
总体单 位归类
完备性和互斥 性:每个单位均 能且只能归到某 个组中。
拟定分组数目
互斥性
包容性 按品质标志分组
即决定分成哪些组,各组的内 容、名称和界限。
指各组之间界限明确,总体中的每一 个单位,都只应属于其中的一个组。 指在一个分组方案中拟定的所有组,能 够包容总体的全部单位,不能排斥和遗 漏任何一个单位。 选择反映事物属性差异的标志作为分 组依据。 性别 数量 女生 男生 18 16
0— 6岁组 按年龄 分组 7—17岁组 18—59岁组 60岁以上组
本科学生组 理科学生组 高等学校学生总体 本科学生组 文科学生组 专科学生组 专科学生组
男学生组 女学生组 男学生组 女学生组 男学生组 女学生组 男学生组 女学生组
三、分组的类型
• (三)按数量标志值的变动范围划分:
– 当数量标志值的变化范围较小,而且标志值的项数不多时,可进行
三、资料整理的一般步骤(续)
4.资料的汇总:将分散资料以集中的形式显示出来。全
部数据汇总,或在分组基础上汇总。
5.制作统计表和统计图:以统计表和统计图的形式,
集中、简明、直观的显示汇总资料。
第二节
资料的审核与汇总
一、资料审核的一般要求 二、资料审核的方法
三、资料的编码
四、资料的汇总
第二节
资料的审核与汇总
按数量标志分组
选择反映事物数量方面的差别 的标志作为分组依据
按数量标志分组的形式
单项式分组
年龄
17岁 18岁 19岁
指用单一的数值作为分组标志的分 组。每个数值作为一个组。
某班学生按年龄分组:
人数
2 6 8 10 11 12
20岁 21岁 22岁
合计
49
例:某车间20名工人日加工零件数如下:
23 22 23 25 20 21 22 23 26 22 21 21 25 23 22 22 23 23 23 22
户居方式、受教育水平分组;流浪儿童按外流原原因、外流生活 来源、流出地分组;人口职业分组等。
–数量标志是反映事物数量特征的标志,如分析贫困问题
将贫困户按家庭人口分组,了解职工生活按经济收入分组,研究 地区的社会保险按参保企业个数分组等。
–按数量标志分组,必须以分组结果能够反映被研究现 象的不同类型和性质差异为前提。
项目之间有无互相矛盾之处,与其他有关资料进行对照是 否有明显出入等等。
• 计算审核:即针对数字资料进行的审查。要检查计算方
法有无错误,度量单位有没有用错,前后数字之间有无相 互矛盾之处。 • 资料的审核中,如发现问题,视情况及时处理;补充或纠 正、注意在离开调查现场前进行审核。
第二节
资料的审核与汇总
1.划分现象类型
例:按所有制性质划分,我国现有8种经济类型:
国有经济;集体经济;私营经济;个体经济联营经济; 股份制经济;外商投资经济;港澳台投资经济。
2· 研究总体结构
例:上海市按GDP计算的三次产业结构(%) 1980年 1990年 1996年 GDP 100 100 100 第一产业 3.2 4.3 2.5 第二产业 75.7 63.8 54.5 第三产业 21.1 31.9 43.0 2010年 100 0.7 42.3 57.0
资料分组的作用(续)
3· 研究现象之间的依存关系
例:中国农村家庭人均收入与恩格尔系数的关系 年
75 农村家庭人均月收入与恩格尔系数的关系图 农村居民家庭 农村居民家庭 人均纯收入(元) 恩格尔系数(%) 126.01 74.0 63.9
325.24 325.24
份 .0
126.01
1978
恩格尔系数
三、分组的类型
(二)按分组标志数量的多少划分 :
–简单分组:对调查对象只按一个标志进行的分组。
– 如农村居民按家庭人均收入分组,妇女按初婚年龄分组,职工按性别分组等。
– 它们分别只能从一个角度说明现象的分布状况和内部构成。
–同总体的几个简单分组按某一规定排列起来就构成了一个平行 分组体系。人口按性别、年龄、民族等标志进行分组,这些简 单分组排列起来,就是平行分组体系 。
模棱两可、互相矛盾。
–完整性。反映某一社会现象的资料必须尽可能全面,如实地
反映该现象的全貌,不能残缺不全。
–统一性。各个调查指标要有统一的理解和解释,对调查指标
的计算方法和计算单位也要统一。
–简明性。整理后的资料要以简单、明确、集中的形式反映出
来。
三、资料整理的一般步骤
资料的审核 资料的编码 资料的分组 资料的汇总 制作统计表和统计图
—对于计划用计算机处理的数据资料,事先可在问卷上写上 编码。
—编码的技术或技巧。
第二节
资料的审核与汇总
四、资料的汇总
• 资料的汇总:根据调查研究的目的,将资料中的各种分
散的数据汇聚起来,以集中的形式反映调查单位的总体状 况以及调查总体的内部数量结构的一项工作。 • 资料的汇总分为: —总体汇总是为了了解总体情况和总体发展趋势的。 —分组汇总是为了了解总体内部的结构和差异的。
–复合分组:用两个或两个以上的标志对调查对象依次进行的分
组。
– 复合分组时,先按一个标志分组,然后,再对每一个组别按另一个标志作进一步分
组。复合复合分组在分组时,应根据分析的要求,确定分组标志的主次顺序,主要
标志在先,次要标志在后。
按性别 分组
男 女 按民族 分组
汉族组 藏族组 回族组 维吾尔族 组 ……
第10章
第一节 第二节 第三节 第四节
调查资料的整理方法
资料整理的意义和一般步骤 资料的审核与汇总 资料的分组 制作统计表和统计图
第一节 资料整理的意义和步骤
一、资料整理的涵义和作用 二、资料整理的原则 三、资料整理的一般步骤
一、资料整理的涵义和作用
资料整理:是指运用科学的方法,将调查所得的原始资料
三、资料整理的一般步骤(续)
1.资料的审核:审查资料
的真实性、准确性和完整 性,发现问题,及时解决。
2.资料的编码:如果所收集
的资料要输入计算机处理, 必须对原始资料进行编码。
三、资料整理的一般步骤(续)
3.资料的分组:根据调
查的目的和任务及分析研 究对象的需要,确定分组 标志,对原始资料进行分 组整理与统计。
采用单项式分组,可形成下表的频数分布: 日加工零件数 频数(人) 20 1 21 3 22 6 23 7 25 2 26 1
但对于数据较多,或连续型变量则无法采用这种分组方法, 而应采用组距分组。
组距式分组
将作为分组依据的数量标志的整个取值范
围依次划分为若干个满足互斥性和包容性
的区间,用这些数值区间作为组的名称。
单项式分组,即可直接将每个标志值列为一组。(百分制)
– 当数量标志值的变动范围较大,标志值的项数又较多时,就可将一 些邻近的标志值合并为一组,作为分组的依据,以减少组的数量,
即组距式分组。(五分制)
– 采用组距分组时,需要遵循“不重不漏”的原则。(“上组限(组
内最大值)不在内” )
统计分组的程序与原则