当前位置:
文档之家› 数据整理统计数据的收集与整理讲义.
数据整理统计数据的收集与整理讲义.
18
1.将原始资料按其数值大小重新排列
找出最小值最大值计算全距
全距 R=99-50=49
19
2.确定变量数列的形式
1. 编制单项式数列还是组距数列,取决于 所研究变量的类型和变量变动的幅度;
2. 编制等距数列还是异距数列,主要取决 于现象的特点和研究目的。 3.案例中的数据特点:1)波动范围大,数 据多 组距数列; 2)变动均匀 等距数列
日产量(件)
20 21 22 23 24 25 合计 组别
工人数(人) 人数比重(%)
10 20 30 50 40 30 180 次数(频数) 5.56 11.11 16.67 27.77 22.22 16.67 100.00
fi 比率(频率) ∑f i
11
fi
(一)分布数列的种类
一个变量值就代表一 按品质标志分组编 组。在变量值不多且 制的分布数列 变化幅度不大的情况 下采用。 各组组距相等 单项式数列
人有了知识,就会具备各种分析能力, 明辨是非的能力。 所以我们要勤恳读书,广泛阅读, 古人说“书中自有黄金屋。 ”通过阅读科技书籍,我们能丰富知识, 培养逻辑思维能力; 通过阅读文学作品,我们能提高文学鉴赏水平, 培养文学情趣; 通过阅读报刊,我们能增长见识,扩大自己的知识面。 有许多书籍还能培养我们的道德情操, 给我们巨大的精神力量, 鼓舞我们前进。
22
5.计算各组单位数,编制变量数列
某班45名学生统计测验成绩分组表
成绩(分) 60以下 60~70 70~80 80~90 90以上
学生数(人) 6 9 16 9 5
比重(%) 13.33 20 35.56 20 11.11
合计
45
100.00
23
例题
50株树苗的高度的测量结果(单位:厘米)
154 133 116 128 85 100 105 146 118 97 110 131 119 103 93 108 100 111 130 104 135 113 122 115 103 90 108 114 127 87 127 108 112 100 117 121 105 136 123 108 89 94 139 82 113 110 109 118 115 126
学生数(人) 2 7 12 15 4 40
比重(%) 5.00 17.50 30.00 37.50 10.00 100.00
15
(二)分布数列的编制
组数 组限 即分得的组的数目,K。 确定每组距离的数值,分下限和上限。
下限
上限
毎组起点数值。
毎组终点数值 。
组距
组中值
即毎组的距离,i,等于上限与下限之差。
两层含义
对个体是“合”
5
分组标志的选择 统计分组的关键在于正确选择分组标志, 这是统计分组的核心问题。
1.完备性——各组之和等于总体之和 2.互斥性——一个单位只能归到某一个组 3.分组标志的一致性
6
统计分组的种类(课外) (一)品质标志分组和数量标志分组
按照分组标志的性质不同可分为品质标志 分组和数量标志分组 1、品质标志分组就是按事物的质量属 性分组。 2、数量标志分组就是按照事物的数量 特征分组
品质数列
分 布 数 列
变量数列
按数量标志 两个变量值确定一组。 分组编制的 分布数列 在变量值较多,变动范 围较大的情况下采用。
等距数列 组距数列 异距数列
各组组距不等
12
某班学生按性别分组表
性别
人数
人数比重(%)
男 女
15 25
37.5 62.5
合计
40
100.0
13
某车间工人按日产量分组表
日产量(件) 20 21 22 23 24 25 合计 组别
即各组中点的数值 。
开口组
闭口组
上、下限只有一个的组。
上限和下限都齐全的组。
16
组中值的计算
闭口组组中值=(上限+下限)/2
上限-邻组组距/2(只有上限) 开口组组中值= 下限+邻组组距/2(只有下限) 组距=上限-下限 全距=最大值-最小值
17
变量数列的编制例题 课本64页
6. 某班 45 名学生“统计学”考试成绩从低 分到高分排列~~
9
二、分布数列
在统计分组基础上,将总体中所有单位按组归类 整理,形成总体中各个单位数在各组间的分布, 叫做次数分布,又称分布数列。 分配数列 将组别与次数按一定的顺序排列所 形成的数列。 次数
比率 率。
分布在各组的单位数叫次数,又称频数。
各组次数与总次数之比叫比率,又称频
10
某车间工人按日产量分组表
第二章 统计数据的收 集与整理
第二节 统计数据整理
1
数据整理的含义 数据整理又称统计整理 是指根据统计 研究的任务与要求,对搜集来的各种原始 资料进行科学的分类和汇总,为统计分析 提供系统化、条理化的综合资料的工作过 程。 统计资料整理在统计工作中处于中间阶段, 它是统计调查的继续,是统计分析的前提, 起着承前启后的作用。
24
用Excel演示频数(Frequency)汇总
25
向上累计与向下累计(补充)
向上累计 :是指从变量值小的组向变量值 大的组累计,又称为较小制累计;
向下累计 :是指从变量值大的组向变量值 小的组累计,又称为较大制累计。
26
表 某班40名学生按成绩分组表
成绩 (分) 60以下 60~70
次数
学生数 (人) 比率(%)
20
3.确定组距和组数
对组距和组数,不能机械地规定先确定什 么。从原则上讲,都应力求符合实际,能 够反映总体分布的特点。
斯透奇斯规则”(Sturges' rule): K= 1 + 3.322 lgn=1+3.322*lg45=6.49 组数与组距(i)的关系是: i=R/K=49/6.49≈7.55~~7或8 两者成反比变化 本例中采用组距为10,组数为5
工人数(人) 人数比重(%) 10 20 30 50 40 30 180 次数(频数)f i 5.56 11.11 16.67 27.77 22.22 16.67 100.00
fi 比率(频率) ∑f i
14
某班40名学生英语测验成绩分组表
成绩(分) 60以下 60~70 70~80 80~90 90以上 合计
向上累计
学生数 (人) 比率(%)
向下累计
学生数 (人) 比率(%)
2 8
5 20
2 10
5 25
40 38
100 95
70~80
80~90 90以上 合计
18
9ቤተ መጻሕፍቲ ባይዱ3 40
45
22.5 7.5 100
28
37 40 --
70
92.5 100 --
30
12 3 --
75
30 7.5 -27
谢
谢!
28
21
4.确定组限
1.组限最好用整数表示;
2. 应使第一组下限不大于资料中的最小变量值, 最末组上限不小于资料中的最大变量值; 3. 对于连续变量,应采用重叠组限,并且习惯上 按照“上限不在本组内”原则处理;而离散变量 变量两种方法都可以。
本 例 中 的 组 限 分 别 为 : 60 以 下 ,60~70 , 70~80,80~90,90以上.
2
数据整理的程序(课外) (一)对调查资料的审核
审核的内容主要有资料的 准确性、及 时性、完整性和适用性 等几个方面。发现 问题,及时纠正。这是统计资料处理工作 中一个十分重要的问题,必须认真对待。 逻辑审查 计算审查 人机同审
3
(二)统计分组与汇总(前提和基础)
按照资料整理的要求进行分组汇总, 计算各组单位数和总体单位数,计算各组 指标和综合指标。 (三)编制统计表或绘制统计图 统计汇总的结果一般通过统计表或统 计图的形式表现出来,以简明扼要、生动 形象地表达社会经济现象的数量表现和数 量关系。
4
一、统计分组的含义
统计分组是根据研究任务的需要和事物内 在的特点,将统计总体按照一定的标志划分为若 干组成部分的一种统计方法。
总体中的各单位在某一(些)方面是相同 的(即同质性),而在其他许多方面则是不同的 (即差异性),统计分组的目的是把不同性质的 单位分开,把性质相同的单位合在一起。因此, 统计分组同时具有两方面的含义: 对总体是“分”
7
(二)简单分组与复合分组
统计分组按分组标志的多少可以分为 简单分组与符合分组 1、简单分组,就是对研究现象按一个 标志进行分组。 2、复合分组,就是按两个或两个以上 的标志对总体单位进行重叠分组。
8
某校教师按性别、职称复合分组表 组别 男性 教授 副教授 讲师 助教 女性 教授 副教授 讲师 助教 合计 人数(人) 92 4 18 40 30 126 3 22 56 45 218 比重(%) 42.2 1.8 8.3 18.3 13.8 57.8 1.4 10.1 25.7 20.6 100.0