当前位置:
文档之家› 长江大学统计学原理黎东升主编统计PPT
长江大学统计学原理黎东升主编统计PPT
斯特杰斯(Sturges)经验公式:
现象近似于正态分布,进行等距 分组,则可参考下面美国学者斯特杰 斯提出的分组数的经验公式:
K(组数)=1+3.322lgN
d
(
组距)
R K
( (
全距) 组数)
最大值 13.
最小值 322lgN
为计算方便:
组距通常取5或者10的整数倍
N 15-24 25-44 45-89 90-179 180-359
统计分组的作用
① 划分复杂现象的类型; ② 研究事物的内部结构; ③ 分析现象间的依存关系。
“九五”期间我国国内生产总值构成(%)
年 份 1996 1997 1998 1999 2000
第一产业 第二产业 第三产业 合计
20.4 19.1 18.6 17.6 15.9 49.5 50.0 49.3 49.4 50.9 30.1 30.9 32.1 33.0 33.2 100.0 100.0 100.0 100.0 100.0
组内的同质性,组间的差异性。
五、统计分组方法
1.按品质标志分组:选择反映事物质的差异的 品质标志作为分组标志,并在其变异内划定 各组界限,结果形成品质数列。
分组标志一经确定,组名称和组数也就确定, 不存在组与组之间界限区分的困难。
复杂的情况下,各组界限不易划分,从这一 组到另一组存在各种过度状态,边缘不清。 国家统计部门常印发有统一的分类目录。
电子计算机汇总:
常用统计软件包:
SAS (Statistical Analysis System) SPSS(Statistical Pakage for the Social
Science) SARP(Statistical Annual Report
Processing System)
电子计算机汇总步骤:
二、统计整理的程序(基本步骤)
1. 设计和编制统计整理方案; 2. 统计资料审核; 3. 统计分组和汇总; 4. 编制统计图表; 5. 积累和保管统计资料。
设计整理方案:
① 确定汇总的指标与综合表; ② 确定分组方法,规定各种指
标汇总时应如何进行分组; ③ 确定数据汇总的形式。
统计资料的审核与订正:
组数:指将全体变量值分成多少组
组距:指分组条件下每组变量值的变化范 围,即每组变量值区间的距离。
组距=上限-下限
(连续式分组)
或组距=上限-下限+1(间断式分组)
等距数列的组距
全距R 组数K
组数与组距:
组数与组距是相互制约成反比的,组 距小,组数多,就不易显示事物的规律性; 组距大,组数少,就会使分组的资料与实 际资料的出入愈大,客观事物的真实性就 愈差。分组应适当,组距与组数的确定应 该全面分析资料所反映的事物内容、变量 值的分散程度等因素,保证组内的同质性, 组间的差异性,不能强求一致。
某种农作物产量与耕作深度的关系
按耕作深度分组 (厘米) 10-12 12-14 14-16 16-18 18-20
耕种地 块数 7 10 16 12 5
平均亩产量 (公斤) 200 230 270 310 300
耕作深度与亩产量关系折线图
平
均 320
亩 300
产 280
( 公
260
斤 240
﹨
220
逐级汇总:按照一定的统计管理系 统,由各级统计机构自下而上地逐 级将调查资料汇总上报。
优点:能满足各地区、各部门对统计资
料的需要,同时便于就地审核和订正原 始资料。
缺点:费时较长,发生差错的几率大 。
集中汇总:把统计调查资料集中在 组织调查的最高机关或由它指定的 机构进行汇总。
优点:可缩短汇总时间,减少汇总差错。
齐备性(及时性与 完整性)审核是审 核的前提,
准确性审核是审 核的核心。
准确性审核的方法有:
逻辑检查:就是依据经验和现象之间的内
在联系,检查调查资料的内容是否合理, 检查各调查项目的资料是否存在着情理 上或逻辑上的矛盾。
计算检查:就是运用计算工具,对调查资
料重新进行核算、检查汇总的数据是否 正确,调查表中的有关数值是否平衡。
体的所有单位按组归并排列,形成总体 中各个单位在各组间的统计分布。又可 称次数分配,或频数分布。
统计分布的实质是把总体的全部单位按 某标志所分的组进行分配,所形成的数 列因此又称分配数列或分布数列。
有关的概念:
次 数:指分布在各组的总体单位数, 又称为频数 ,一般用f表示。
总次数:即全部总体单位数,一般用 f 表示
第三章 统计整理
任课教师:汤来香 tanglx2000@
学习要求:
明确统计整理在统计研究中承 前启后的地位;掌握分组的方法 和汇总技术;认识统计分布是统 计整理的重要表现形式;学会统 计表的编制并能熟练地运用。
主要内容:
§1 统计整理概述 §2 统计分组 §3 次数分布数列 §4 统计图与统计表
K5
6
7
8
9
等距数列与异距数列:
等距数列——组距相等的组距数列称。 异距数列——组距不等的组距数列。
等距分组一般适用于变量值比较均 匀的情况。要尽量应用等距分组,它便 于各组间单位数与标志值的直接对比, 也便于计算各项综合指标和进行对比分 析,还便于绘制统计图。
亩 200 )
(注:1亩为0.067公顷) 10 12 14 16 18 20 22
耕作深度(厘米)
二、分组标志选择的原则
1. 根据统计研究目的和任务选择 分组标志;
2. 选择最能反映现象本质特征的 标志作为分组标志;
3. 考虑现象所处的具体历史条件 或经济条件来选择分组标志。
三、统计分组的种类
编制条件: ① 变量是连续变量; ② 或者:总体单位数较多,变量不
同取值个数也较多的离散变量。
组距数列的编制步骤:
① 排序,计算全距 ② 确定组数、组距 ③ 确定组限及其表示法 ④ 计算频数、频率 ⑤ 制作组距数列统计表
1.对原始数据排序,计算全距(R) R=最大变量值-最小变量值
2.确定组数(K)和组距(d)
缺点:原始资料如有差错不能就地更正,
整理结果有时不能及时满足各地区、各 部门的需要。
结合使用:综合汇总与汇审汇编。
四、统计整理的技术
手工汇总:手工汇总是使用算盘和
小型计算器等手工方式进行汇总。 常用的方法有四种:
(1)点线法 (2)过录法 (3)折叠法 (4)卡片法
电子计算机汇总
点线法(划记法):
2000以上 合计
第一组工 人数(人)
15 10 45
30 100
第二组工人 数(人)
45 30 10
15 100
两个构成要素:
(1) 分组标志的具体表现; (将总体按某标志所分成的各个组)
(2) 与之相对应的各组次数或频率
(各组所包含的总体单位数)。
统计分布的意义:
统计分布是统计整理结果的 一种重要的表现形式,也是统计 分析的一种重要方法。
二、次数分布数列的种类
品质数列
单 项 变 量 数 列
变量数列
离
散
型组
距
变
量
数
列异 等
距 距
数 数
列 列
连
续
型异 等
距 距
数 数
列 列
例:某班学生的性别构成情况
按性别分组 绝对数人数 比重(%)
男 女 合计 组别
30 10 40 次数
75 25 100 频率
三、次数分布数列的编制
(一) 品质数列的编制 对一些复杂的现象分组时,一定
折叠法:
是将每一个调查表中所需 要汇总的项目和数值折在边上, 一张一张重叠起来,进行汇总 计算。这种方法避免了过录, 省时省力。
卡片法:
先要准备好摘录卡片,将每 个总体单位需要汇总的项目数值 摘录在一张卡片上,然后根据卡 片进行分组和汇总计算。在总体 单位多、复合分组多时,卡片法 是手工汇总中较好的方法。
① 分组的对象是总体:是在总体内部进行 的一种定性分类,它把总体划分为一个 个性质不同的、范围更小的部分;
② 兼有“分”与“合”双重含义:对总体 而言是“分”,对总体单位而言是 “合”,对分组标志而言是“分”,而 对其它标志而言,是“合”;要保持 “组内的同质性与组间的差异性”。
③ 分组要有分组标志:统计分组的关键是 正确选择分组标志和划分各组界限。
1. 简单分组:只按一个重要标志对总
体分组;
2. 复合分组:对总体按两个或两个以
上的标志进行的重叠式分组,即在按 某一个标志分组的基础上再按另一个 标志进行分组。
3. 分组体系:按一系列相互联系、相
互补充的标志对同一总体分别进行分 组而结合成的体系。
【例】
对全国的工业企业进行简单分组 全民所有制企业
① 编程序; ② 编码; ③ 数据输入; ④ 资料错误信息的检查和修正; ⑤ 运行程序; ⑥ 提供统计资料。
第二节 统计分组
一、概念与作用
统计分组——就是根据统计研究目的和 被研究总体的属性和数量特征,按 照某个或某几个重要标志,将总体 划分为若干性质不同而又有联系的 部分或组的一种统计方法。
理解“统计分组”时应注意:
频 率:各组单位数占总体单位数的比 重,即f/ f 。又称为比重。
注:
在变量数列中标志值构成的数列表示 标志值的变动幅度;
频数构成的数列则表明相应标志值的 作用程度,频数愈大则组的标志值对 于全体标志水平所起的作用也愈大, 反之,频数愈小则组的标志值所起的 作用也愈小。
例:某工厂工人月工资分组表
按企业规模大小分
大型企业 中型企业 小型企业
【例】
男工 干