当前位置:文档之家› 统计数据整理

统计数据整理


比重(%) 10.00 20.00 32.50 25.00 12.50 100.00
(三)累计次数分布表(图)的编制
1.相关概念
(1)累计次数和累计频率
反映总体单位分布特征的指标,累计次数说明总体 中在某一变量值水平上下总共包含的总体单位次数; 累计频率说明总体中在某一变量值水平上下总共包含 的总体单位数占总体单位总数的比重。
二、分配数列的编制
(一)概念术语
1.全距(R)=数列中最大变量值-最小变量值
2.组限:每一组的最大变量值与最小变量值 上限:每一组的最大变量值 下限:每一组的最小变量值 3.组距(d):每一组的最大变量值与最小变量值之差 组距=上限-下限 4.组数:数列中的分组个数
组数和组距的关系
定性关系:全距一定的情况下,组数和组距呈 反方向变动
平行分组体系能从多个方面说明总体的特征, 是从广度上分析研究总体现象的。 (2)复合分组和复合分组体系 例如:人口总体在按性别分组的基础上,再按 年龄分组,得到如下复合分组: 人口总数:男性:0-14岁;15-64岁;65岁以上 女性:0-14岁;15-64岁;65岁以上
复合分组的标志不易过多,因为随着分组标志 的增多,组数将成倍增加,影响对总体的认识。
某市餐饮业按营业额分组 餐饮企业个数(家) 比重(% 1350 58.70 650 28.25 180 7.83 85 3.70 35 1.52 2300 100.00
单项式变量数列实例
表3.4
家庭人口数(人) 1 2 3 4 5 6 合 计
某市居民家庭按家庭人口数分组
家庭数(千户) 9.8 27.5 94.6 19.2 10.9 8.0 170.0 比重(%) 5.76 16.18 55.65 11.29 6.41 4.71 100.00
(一)钟形分布/丘形分布
1.含义: 特点是“两头小,中间大”,越靠近中间的变 量值分布次数愈多;愈远离变量值中点分布的次数愈少, 形如钟或山丘 正态分布:左右两侧对称分布 2.种类 左偏分布 偏态分布 右偏分布
正态分布
左偏分布
右偏分布
( 二 )U 形分布 : 是指较大和较小的变量值出现的次数多,
而中间变量值出现的次数少,特点是“两头大,中间 小” 。
二、数据分组的作用
(1)区分现象的类型 (2)反映总体的内部结构 (3)揭示现象之间的依存关系
三、统计分组的原则 1、科学性原则 2、完整性原则 要求分组时要列出一切可能的类别, 把所有总体都包含进去,避免出现无组可 归的总体单位。 3、互斥性原则 组限划分要分明,不能模棱两可。
三、选择分组标志的原则
频数分布
一、概念
在统计分组的基础上,将总体中的所有单位按 组归类整理,并按一定顺序排列,形成总体单位数 在各组间的分布,这个分布情况称为频数分布。
分布在各组中的总体单位数叫次数或频数。
各组次数或频数占全部总体单位数的比重叫频率。
分布数列构成要素:组、各组频数
分布数列
表3.1
按海拔分组 (米) 500 以下 500~1000 1000~2000 2000~3000 3000 以上 合计
第二节 统计数据的整理
数据整理的一般问题
一、数据整理的概念与作用
(一)概念
对统计调查所搜集到的数据进行分类和汇总,使 其系统化、条理化、科学化,以得出反映事物总体综 合特征的资料的工作过程。
(二)作用
统计数据整理,是统计调查的继续,也是统计分 析的前提,承前启后,在整个统计工作中具有重要的 作用。
(三)统计表种类 (按主词结构分)
简单表:主词未做任何分组 简单分组表:主词按一个标志分组 复合分组表:主词按两个或以上的标志分组
(四)统计表的编制规则
二、统计图
(一)统计图的概念 (二)统计图的种类 1.直方图(P60) 2.条形图 3.折线图(P60)2)
数值变量数列:按数值变量分组形成
2.数值变量数列又可分为:
单项数列:每组只有一个变量值的变量数列。 组距数列:每组变量值是一段区间的变量数列。 连续变量数列:按连续变量分组形成的数列 离散变量数列:按离散变量分组形成的数列
数值变量数列实例
表3.3 营业额(万元) 10 万元以下 10- 50 50-100 100-500 500 万元以上 合 计
数据排序并计算全距 确定变量数列的形式(单项式或组距式) 确定组数和组距 确定组限
计算各组次数和频率
计算各组累计次数和频率 编(绘)制图表
累计次数分布数列的示例
表3-7 某班级学生考试成绩累计次数分组表
按成绩分 学生人数 组(分) (次数) 50~60 60~70 70~80 80~90 90~100 合计 3 8 16 8 5 40
(三)分组标志的排列方式
平行分组体系和复合分组体系
(1)简单分组和平行分组体系 例如:工业企业按规模、经济类型和轻、重工 业3个标志分别进行分组,得到如下平行分组体 系: 1、按企业规模分组:大型企业;中型企业;小 型企业 2、按轻重工业分组:轻工业;重工业 3、按经济类型分组:国有经济;集体经济;私 营经济;股份制经济;外商投资经济;港澳台 投资经济;其他经济。
统计表示例
某居民小区家庭按月收入简单分组表
家庭月收入 800-1000 1000-1200 1200-1400 1400-1600 1600-1800 1800-2000 2000-2200 2200-2400 合计 户数 5 7 10 13 8 6 3 2 54 比率 9.26% 12.96% 18.52% 24.07% 14.81% 11.11% 5.56% 3.70% 100.00%
75 54 62 75
解题思路
*编制步骤之一----数据排序并确定全距
将数据从低到高排列,形成如下变量序列: 51 67 76 85 54 68 77 86 57 70 78 86 59 71 78 88 62 72 79 89 64 72 81 90 65 74 83 93 65 75 84 94 66 75 84 96 66 76 84 98
统计图示例
条型图——用长短或高矮来显示数值的大小
Ò Í ¼ ¥ È Ë ¾ ù É ú » î Ñ ·Ê Õ È ë ´ Î Ê ý · Ö ² ¼ Í ¼ 14 12 10 10 7 5 8 6 3 2 13 800£ ­ 1000 1000£ ­ 1200 1200£ ­ 1400 1400£ ­ 1600 1600£ ­ 1800 1800£ ­ 2000 2000£ ­ 2200 2200£ ­ 2400
组距式变量数列实例
表3.5
月工资(元) 500 元以下 500-600 600-700 700-800 800-900 900-1000 1000 元以上 合 计
某车间工人按月工资分组
工人数(人) 16 28 34 56 38 18 10 200 比重(%) 8.00 14.00 17.00 28.00 19.00 9.00 5.00 100.00
24对夫妇结婚年数和每年争吵次数统计
结婚年数 5 2 4 1 3 6 5 8 3 7 10 20 13 15 9 6 8 5 10 7
争吵次数
设计整理方案,资料审核是前提
统计分组是基础 统计汇总是中心环节 编制统计表绘制统计图是结果
统计分组
统计汇总
统计图表
数据分组
一、数据分组的概念
根据统计研究目的和客观现象的内在 特点,按照选定的某个或几个标志,将被 研究的总体数据分成若干部分的科学分类。 “相同者合并,不同者分开”原则。
频率 (%) 7.5 20.0 40.0 20.0 12.5 100.0
向上累计 次数 3 11 27 35 40 — 频率 7.5 27.5 67.5 87.5 100.0 — 40 37 29 13 5 —
向下累计 次数 频率 100.0 92.5 72.5 32.5 12.5 —
二、次数分布
我国土地状况分组表
面 积 (万平方公里) 241.7 162.5 239.9 67.6 248.3 960.0 占总面积比重 (%) 25.18 16.93 24.99 7.04 25.86 100.00
组别
频数
频率
(二)分配数列的种类
1.按分组标志的性质不同
品质变量数列:按品质变量分组形成(如按性别)
*编制步骤之五----计算各组的频数和频率
[分析] 根据排序后的变量序列清点各数据区间的频数 并计算比重,也可利用excel统计软件进行
解题思路
编制步骤之六----绘制表格
表3-6 某车间工人日产零件分组表
日产零件数量(件) 50-60 60-70 70-80 80-90 90-100 合计
工人数(人) 4 8 13 10 5 40
二、数据整理的程序
数据整理方案的设计 数据的审核与检查
数据分组 数据的显示——统计图表
1、数据整理方案的设计 确定统计指标及统计指标体系,确定统计分组方法, 确定统计汇总的方法,确定表现统计指标的形式等。
2、数据的审核与检查 “不审不汇,不核不报”,只有经过审核后的资料才 能进行汇总。审核内容:资料的准确性,及时性, 完整性。 资料的准确性审核方法:逻辑审核和计算审核。 逻辑审核:原始资料的内容是否合理。 计算审核:检查各项数字之间是否平衡。
数据排序并计算全距 确定变量数列的形式(单项式或组距式) 确定组数和组距 确定组限 计算各组次数和频率
绘制表格
简单次数分布数列的编制实例
[例3-1]:数据资料 某车间40名工人日产零件如下: 65 72 66 57 90 86 83 68 84 66 59 67 70 79 51 81 78 86 94 64 77 74 76 96 98 85 71 79 84 65 72 89
相关主题