当前位置:文档之家› 第三章 统计整理

第三章 统计整理


第三节 统计整理的具体方法
一、次数分布
(一)次数分布的概念 将总体按某一标志分组,并按一定顺序排列,把总体的所有单 位按组归并,列 出各组单位数,所形成的数列,叫分布数列。 构成要素两个: 一个是总体的分组,另一个是各组的单位数(也叫频数)或各组单位数占总 单位数的比重(也叫频率)例如:
一、次数分布
1.划分复杂现象的类型 2.研究现象的内部结构 3.分析现象间的依存关系
二、统计数据分组的方法
(一)正确选择分组标志 分组标志是将总体划分为性质不同的组的依据和标准。 1.根据统计研究目的和任务选择分组标志。 (1)选择能反映现象本质或主要特征的分组标志 (2)根据现象所处的历史条件和经济条件选择分组标志
第三章 统计整 理
– 统计表的结构,从外表形式上看,是由四部分构成 总标题 表的名称,用于概括统计表中要说明的 内容。 各组的名称,反映总体各组成部分的。 分组标志或指标的名称,说明纵行所列 各项资料的内容。 统计表的具体内容,每一项数值由相应 的横行标题和纵栏标题限定,可以是总 体单位数,也可以是标志总量,或者平 均数、相对数等,也称数字资料。
第二节 数据分组
一、统计分组的概念和作用
(一)统计分组的概念 数据分组,是根据客观事物的内在特征和统计研究的目的,选择一定标志 将客观事物划分为不同类型或不同性质的组。
1.穷尽性原则 2.互斥性原则
一、统计分组的概念和作用
(二)数据分组的作用 数据分组的根本任务是区分复杂现象间存在着的质的差别。数据分组的过 程就是区别复杂现象性质的过程。
单项式数列的编制
(三)变量数列编制方法 是指以数量标志分组时,每组只用一个变量值代表。这种分组方法通常适合于离
散型变量,且变量值较少的情况。 例3-1 某车间30名工人某日加工的零件个数统计如下: 30 30 28 29 30 31 29 30 32 29 30 27 30 29 28 31 30 27 29
组距变量数列编制步骤:
1)将变量值按由小到大的顺序排列,确定最大值、最小值,计算全距。 本例中排列结果如下(单位:%): 82 85 87 93 98 99 102 102 103 104 105 106 106 107 107 108 108 109 111 112 113 114 115 116 116 117 119 123 125 129 最大值为129%,最小值为82%。全距=最大值-最小值=129-82=47%
编制变量数列应根据统计研究的目的和统计资料的分布情况来确定其形式。
1.将原始资料按变量值的大小顺序进行排列,使之形成序列 2.根据总体分布的特征,确定组距(d)与组数(k) 3.确定组限和组限的表示方法 4.汇总计算各组次数,并编制次数分布表。
组距式数列的编制
举例说明如下: 例3-2:某企业销售部30名推销员销售额的完成情况如下:(单 位:%) 98 102 82 106 108 112 109 108 87 125 113 105 116 99 107 115 104 126 85 119 102 106 117 93 111 107 123 114 116 103 要求:编制组距数列反映推销员销售额的完成情况分布。
一、统计表
(二)统计表的作用 1.能直观、明了地表现统计资料,便于阅读; 2.便于汇总、审核,是进行统计分析的有效工具; 3.便于读者对比,从而发现现象的变化规律;
4.是积累统计资料的必要手段。
一、统计表
(三)统计表构成 1.总标题 2.横行标题 3.纵栏标题
4.数据资料
(5. 附录 ) 从内容上看,统计表由主词和宾词两部分组成。
向上累计数的意义是:小于各组的该组上限的各组的频数或频率之和; 相反,由变量值大的组向变量值小的组累计各组的频数或频率,称为向下 累计频数或向下累计频数。 向下累计数的意义是:大于及等于该组下限的各组的频数或频数或频 率之和。
仍以例3-2为例,说明累计频数和累计频率的计算。如表3-7所示:
四、累计次数与累计频率
各组次数 频率 100% 总次数
各组累计次数 累计频率 100% 总次数
计算累计次数或累计频率。
有两种方法:向上累计和向下累计。
向上累计,是从最小变量值组开始,逐项累计各组次数或频率;表示总体 中本组上限以下的累计次数和累计频率。 向下累计,从变量值最大一组开始,逐项累计各组次数和频率,表示总体 中本组下限以上的累计次数和累计频率。
二、变量数列
(二)组距式变量数列 组距式变量数列是指按数值型变量分组后,用变量值变动的一定范围(即从 多少到多少,把一定范围内的所有变量值归为一组,范围内的距离就是组距)代 表一个组所形成的分配数列,简称组距数列。 1.组数(k) 2.组限 3.组距(d) 4.全距(R) 5.组中值(x)
三、变量数列的编制
(二)分配数列的种类 数据整理中根据分组标志特征的不同,分配数列可分为品质变量分配数列和 数值型变量分配数列。
原始数据 分组归类 数据汇总 编制次数分布表
品质数列举例
(品质数列的编制比较简单,但要注意分组时,应包括分组标志的
所有表现,不能有遗漏,各种表现相互独立,不得相融。)
例如 ,某系学生按专业分组统计如表3-4所示 。
按专业分组 学生人数(人) 比重(%)
会计学 物流 电子商务 交通安全与智能控制 计算机应用 合计
650 500 200 150 1000 2500
26 20 8 6 40 100
一、次数分布
(二)分配数列的种类 下面就如何按数值型变量进行分组并编制变量数列进行重点讨论
二、变量数列
(一)单项式变量数列 单项式变量数列是指现象按数值型变量分组后,用一个变量值代表一组而形 成的数列,简称单项数列。
统计整理
第一节 第二节 第三节 第四节 统计数据整理概述 数据分组 次数分布 统计数据的显示
第一节 统计数据整理概述
一、统计数据整理的概念和作用
按照数据采集方案的要求,运用一定的调查方式与方法实施调查,我们会得到大 量的统计数据,这些数据主要是反映个体单位特征的、且一般都是分散、零碎、杂乱 的原始资料,它难以系统地反映总体的综合数量特征,更不可能说明事物的本质和其 发展变化的规律性。
(三)对数据资料进行分组、编码和统计汇总 (1)统计分组 (2)编码 (3)统计汇总
二、数据整理的步骤
(四)编制统计表、绘制统计图 将汇总结果编制成统计表或绘制成统计图,以便直观、简明扼要地表达现 象的数量特征。该部分内容在本章统计数据显示中介绍。
二、数据整理的步骤
(五)系统积累资料 将汇总结果按需要整理成册或存入数据库,有条件的可将原始资料一并存 入数据库,以便进一步使用。
横行标题 纵栏标题 指标数值
42
从统计表的内容来看,由主词和宾词两个部分组成。主词是统计表所说明 的总体,总体的各组或各组的名称。宾词是用于说明主词的各种指标。
第三章 统计整 理
表3—9 某地区1999年工业总产值按轻重工业分组表
工业总产值
项目
横 行 标 题 轻工业 重工业 合计
产值(亿元) 比重(%) 3059.7 3105.7 6264.4 68.84 51.16 100.00
课堂练习 1.【资料】 分别为: 320 458 450 590 610 540 326 280 390 600 650 445 340 388 400 660 710 485 380 440 420 680 450 490 425 410 460 425 800 420 455 399 480 560 910 390 412 505 570 920 388 446 510 580 565 405 448 530 590 555 假定《当代大学生》调查50份问卷显示:“月生活费”
二、数据整理的步骤
(一)设计数据整理方案 1.根据研究目的正确选择分组标志,确定分组方法。 2.确定汇总的指标 3.确定数据汇总的具体方式。 4.确定数据审查的内容与方法。
二、数据整理的步骤
(二)对所采集的统计数据进行审核、检查、订正 1.对原始数据进行审核 2.对次级数据进行审核
二、数据整理的步骤
纵栏 标题 指标 数值
主词
宾词
43
一、统计表
(四)统计表的种类
第三章 统计整 理
1.统计表按其作用不同,可分为调查表、汇总表、分析表等。 2.统计表按主词分组情况可分为简单表、分组表和复合表
统计表的种类
简单表 分组表 复合表 主词未经过任何分组,反映出总体各单位的名称或 按时间顺序简单排列,或同时反映以上内容的统计 表。 主词按照一定标志分组的统计表,也称简单分组表。 主词按照两个或两个以上的标志层叠分组所形成的 统计表。
44
第三章 统计整 理
(五)统计表的设计规则
统计表应遵循科学、实用、简练、美观的原则进行设计。 1、统计表通常应设计成由纵横交叉线组成的长方形表格,长 宽之间应保持适当的比例。 2、统计表的总标题要用概括、简练的文字说明表的内容,并 在总标题内或在其下注明资料所属的时间、地点和单位。 3、统计表的主词各行和宾词各栏,一般应按先局部后整体的 原则排列,即先列各项目,再列总计。如果没有必要列出 所有项目时,可以先列总计,而后再列其中一部分重要的 项目。
二、统计数据分组的方法
(一)正确选择分组标志 分组标志是将总体划分为性质不同的组的依据和标准。 2. 正确划分各组的界限 (1)按品质标志分组 (2)按数量标志分组
三、分组类型
1.简单分组 简单分组是对总体只按一个标志进行的分组。
三、分组类型
2.复合分组 复合分组是对同一总体按两个或两个以上的标志重叠起来进行的分组.
故重叠分组适应所有变量。
本例中,我们可以做如下分组:80~90 120 120~130 90~100 100~110 110~
相关主题