当前位置:
文档之家› 数据整理统计数据的收集与整理
数据整理统计数据的收集与整理
2
5.00
60~70
7
17.50
70~80
12
30.00
80~90
15
37.50
90以上
4
10.00
合计
40
100.00
2021/3/11
15
(二)分布数列的编制
组数 即分得的组的数目,K。
组限 确定每组距离的数值,分下限和上限。
下限 毎组起点数值。
上限 毎组终点数值 。
组距 即毎组的距离,i,等于上限与下限之差。
组中值 即各组中点的数值 。
开口组 上、下限只有一个的组。
闭口组 上限和下限都齐全的组。
2021/3/11
16
组中值的计算
闭口组组中值=(上限+下限)/2 上限-邻组组距/2(只有上限)
开口组组中值= 下限+邻组组距/2(只有下限)
组距=上限-下限 全距=最大值-最小值
2021/3/11
17
变量数列的编制例题
3.案例中的数据特点:1)波动范围大,数 据多 组距数列;
2)变动均匀 等距数列
2021/3/11
20
3.确定组距和组数
对组距和组数,不能机械地规定先确定什 么。从原则上讲,都应力求符合实际,能 够反映总体分布的特点。 斯透奇斯规则”(Sturges' rule):
K= 1 + 3.322 lgn=1+3.322*lg45=6.49 组数与组距(i)的关系是:
第二章 统计数据的收 集与整理
第二节 统计数据整理
2021/3/11
1
数据整理的含义
数据整理又称统计整理是指根据统计 研究的任务与要求,对搜集来的各种原始 资料进行科学的分类和汇总,为统计分析 提供系统化、条理化的综合资料的工作过 程。
统计资料整理在统计工作中处于中间阶段, 它是统计调查的继续,是统计分析的前提, 起着承前启后的作用。
2021/3/11
2
数据整理的程序(课外)
(一)对调查资料的审核
审核的内容主要有资料的准确性、及 时性、完整性和适用性等几个方面。发现 问题,及时纠正。这是统计资料处理工作 中一个十分重要的问题,必须认真对待。
逻辑审查
计算审查
人机同审
2021/3/11
3
(二)统计分组与汇总(前提和基础)
按照资料整理的要求进行分组汇总, 计算各组单位数和总体单位数,计算各组 指标和综合指标。
2021/3/11
8
某校教师按性别、职称复合分组表
组别
人数(人)
比重(%)
男性
92
42.2
教授
4
1.8
副教授
18
8.3
讲师
40
18.3
助教
30
13.8
女性
126
57.8
教授
3
1.4
副教授
22
10.1
讲师
56
25.7
助教
45
20.6
合计
2021/3/11
218
100.0 9
二、分布数列
在统计分组基础上,将总体中所有单位按组归类 整理,形成总体中各个单位数在各组间的分布, 叫做次数分布,又称分布数列。
对总体是“分” 两层含义
对个体是“合”
2021/3/11
5
分组标志的选择
统计分组的关键在于正确选择分组标志, 这是统计分组的核心问题。 1.完备性——各组之和等于总体之和 2.互斥性——一个单位只能归到某一个组 3.分组标志的一致性
2021/3/11
6
统计分组的种类(课外)
(一)品质标志分组和数量标志分组
(三)编制统计表或绘制统计图
统计汇总的结果一般通过统计表或统 计图的形式表现出来,以简明扼要、生动 形象地表达社会经济现象的数量表现和数 量关系。
2021/3/11
4
一、统计分组的含义
统计分组是根据研究任务的需要和事物内 在的特点,将统计总体按照一定的标志划分为若 干组成部分的一种统计方法。
总体中的各单位在某一(些)方面是相同 的(即同质性),而在其他许多方面则是不同的 (即差异性),统计分组的目的是把不同性质的 单位分开,把性质相同的单位合在一起。因此, 统计分组同时具有两方面的含义:
课本64页
6.某班45名学生“统计学”考试成绩从低 分到高分排列~~
2021/3/11
18
1.将原始资料按其数值大小重新排列
找出最小值最大值计算全距 全距 R=99-50=49
2021/3/11
19
2.确定变量数列的形式
1.编制单项式数列还是组距数列,取决于 所研究变量的类型和变量变动的幅度;
2.编制等距数列还是异距数列,主要取决 于现象的特点和研究目的。
i=R/K=49/6.49≈7.55~~7或8 两者成反比变化 本例中采用组距为10,组数为5
2021/3/11
分配数列 将组别与次数按一定的顺序排列所 形成的数列。
次数 分布在各组的单位数叫次数,又称频数。
比率 率。
各组次数与总次数之比叫比率,又称频
2021/3/11
10
某车间工人按日产量分组表
日产量(件) 工人数(人) 人数比重(%)
20 21 22 23 24 25 合计
组别
2021/3/11
10 20 30 50 40 30 180
次数(频数) f i
5.56 11.11 16.67 27.77 22.22 16.67
100.00
比率(频率)∑
f
i
f
i
11
(一)分布数列的种类
一个变量值就代表一
组按。品在质变标量志值分不组多编且
品质数列
变制化的幅分度布不数大列的情况
分
下采用。
布 数
单项式数列 各组组距相等
列 变量数列
等距数列
组距数列
按数量标志 分组两编个制的变量值确定一组。 分布在数变列量值较多,变动范
围较大的情况下采用。
异距数列
各组组距不等
2021/3/11
12
某班学生按性别分组表
性别
人数
男
15
女
25
合计40Βιβλιοθήκη 人数比重(%)37.5 62.5
100.0
2021/3/11
13
某车间工人按日产量分组表
日产量(件) 工人数(人) 人数比重(%)
按照分组标志的性质不同可分为品质标志 分组和数量标志分组
1、品质标志分组就是按事物的质量属 性分组。
2、数量标志分组就是按照事物的数量 特征分组
2021/3/11
7
(二)简单分组与复合分组
统计分组按分组标志的多少可以分为 简单分组与符合分组
1、简单分组,就是对研究现象按一个 标志进行分组。
2、复合分组,就是按两个或两个以上 的标志对总体单位进行重叠分组。
20 21 22 23 24 25
合计
2021/3/11
组别
10 20 30 50 40 30
180
次数(频数)f i
5.56 11.11 16.67 27.77 22.22 16.67
100.00
比率(频率)∑
f
i
f
i
14
某班40名学生英语测验成绩分组表
成绩(分) 学生数(人)
比重(%)
60以下