当前位置:文档之家› 第三章 统计资料的收集与整理

第三章 统计资料的收集与整理


4. 重点调查
5. 典型调查
非全面调查
统计报表
统计报表(Statistical Report Forms) 是指依照国家统计局或国家各行政管理部 门的规定,自上而下地统一布置,以一定 的原始记录为依据,按照统一的表式,统 一的指标项目,统一的报送时间与报送程 序,自下而上地逐级定期提供基本统计资 料的一种调查方式。
3. 次数分布
统计表
统计表是把通过整理的由统计调查所 得来的原始资料,使其成为得以说明社会现 象及其发展过程的数据,并按一定顺序排列 在表格中而形成的。
1. 统计表的结构
2. 统计表的分类(分组结果)
简单表 简单分组表 复合分组表
3. 统计表设计规则(书P56 七条)
统计图
统计图是统计资料的一种表达方式,它可 以简洁直观地表示数据,可以帮助我们从众多 的数据中发现规律,可以更迅速、更有效地传 递信息,给人以明确而深刻的印象。
lg( n) K 1 lg( 2)
2. 确定各组的组距:组距(Class Width)是一个组的上限 与下限之差,可根据全部数据的最大值和最小值及 所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数 3. 根据分组整理成频数分布表
等距分组表
(使用开口组)
表3-2 某车间50名工人日加工零件数分组表 按零件数分组
普查
普查(Census)是对调查对象的全 部调查单位逐一进行的调查。其特点: 是一次性调查,是专门组织的全面调查, 即普查主要用来调查属于一定时点上的 现象总量。 关键词:全面调查、一次性、时点资料
美国普查局
/
美国普查局
抽样调查
抽样调查(Sampling Survey)是 一种非全面调查,它是在全部调查单 位中抽取一部分单位作为样本进行调 查,再根据调查结果推断总体的一种 调查方法。广义的抽样调查包括随机 抽样与非随机抽样。
抽样误差是指在遵循了随机原则的条件下, 不包括登记误差和系统性误差在内的,用 样本指标代表总体指标而产生的不可避免 的误差 。
调查表
调查表一般有两种:一种是一览表,另一种是单一表。
• 单一表是每张调查表式只登记一个调查 单位的资料,常在调查项目较多时使用。 • 它的优点是便于分组整理,缺点是每张 表都注有调查地点、时间及其他共同事 项,造成人力、物力和时间的耗费较大。 一览表是一张调查表式可登记多个单位的 调查资料。
105~109 110~114 115~119 120~124 125~129 130~134 135~139
频数(人)
3 5 8 14 10 6 4 50
频率(%)
6 10 16 28 20 12 8 100
合计
等距分组表
(一般情况:上组限不在内)
表3-3 某车间50名工人日加工零件数分组表 按零件数分组
服务广告 25.5%
图3-4
商品广告 56.0%
某城市居民关注不同类型广告的人数构成
甲乙两城市家庭对住房状况的评价 (环形图)
13% 10% 15% 21% 7% 8%
非常不满意 36%
33% 不满意 一般
31%
满意
非常满意
26% 图3-5 甲乙两城市家庭对住房状况的评价
散点图
人均GDP 8000 7000 6000 5000 4000 3000 2000 1000 0 1985 1990 1995 2000 2005 人均GDP
122 118 118 127 124
125 108 112 135 121
分组方法
• 分组方法
单变量值分组
组距分组
等距分组
异距分组
单变量值分组
(要点)
• 1. 将一个变量值作为一组 • 2. 适合于离散变量 • 3. 适合于变量值较少的情况

单变量值分组表
(实例)
表3-1
零件数 (个 )
105~110 110~115 115~119 120~125 125~130 130~135 135以上
频数(人)
3 5 8 14 10 6 4 50
频率(%)
6 10 16 28 20 12 8 100
合计
茎叶图
(茎叶图的制作)
1. 2.
用于显示未分组的原始数据的分布 由“茎”和“叶”两部分构成,其图形是由数字组 成的 以该组数据的高位数值作树茎,低位数字作树叶 对于n(20≤n≤300)个数据,茎叶图最大行数不超过 L = [ 10 × log 10 n ] 5. 茎叶图类似于横置的直方图,但又有区别
关键词:典型单位,是指那些能充分、集中地 体现调查对象总体某些方面共性特征的最有代 表性的单位。
资料审定
调查资料的审定目的,就是要 保证资料的准确性,尽可能地缩小 调查误差。即对对调查资料的准确 性、完整性和及时性进行检查 。
统计分组是根据统计研究的目的,选择某 一标志作为分组的依据,将总体分成若干个不 同的组。经统计分组后,各组组内的个体的性 质是相同的,不同组的个体的性质是不同的。
举例1:绘制直方图、散点图、折线图 举例2:绘制条形图、饼图、环形图
举例3: 茎叶图
原始资料
原始资料也称为第一手资料, 是反映被调查对象原始状况的资料。 如原始记录、统计台帐、调查问卷 答案、实验结果等。
举例:数据集03、数据集04
次级资料
次级资料也称为第二手资料, 是已经存在的经他人整理分析过 的资料。如期刊、报纸、广播、 电视以及因特网上的资料,各级 政府机构公布的资料,企业内部 记录和报告等。
128 129 130 131 133 134 135 137 139
频数 (人 )
2 1 1 1 2 2 1 1 2
组距分组
(要点)
1. 2. 3. 4. 5. 将变量值的一个区间作为一组 适合于连续变量 适合于变量值较多的情况 必须遵循“不重不漏”的原则 可采用等距分组,也可采用不 等距分组
~ ~ ~ ~ ~

3. 4.
直方图可大体上看出一组数据的分布状况,但没有给出 具体的数值 茎叶图既能给出数据的分布状况,又能给出每一个原始 数值,保留了原始数据的信息

茎叶图
(茎叶图的制作)
树茎 树叶 数据个数
3
10 788
11 022347778889
12 0012222333344466777889 13 0133445799


117 108 110 112 137
122 131 118 134 114
124 125 123 127 120
129 117 126 123 128
139 122 133 119 124
107 133 134 113 115
117 126 127 120 139
130 122 123 123 128
数据中华
统计调查方案
调查必然产生误差
调查时都会使用调查表
统计误差
登记误差是由于调查过程中各有关环节工作的失 误而造成的。
代表性误差是由于非全面调查只观察总体一部分 单位,这部分单位不能完全反映总体的性质而产 生的误差。 (系统误差 抽样误差)
• 不遵循随机原则,有意识多选好的单位或 较差的单位进行调查而造成的系统性误差 。
107 108 110 112 113 114 115 117 118
某车间50名工人日加工零件数分组表
频数 (人 )
1 2 1 2 1 1 1 3 3
零件数 (个 )
119 120 121 122 123 124 125 126 127
频数 (人 )
1 2 1 4 4 3 2 2 3
零件数 (个 )
组距分组
(几个概念)


1. 2. 3. 4.
下 限:一个组的最小值 上 限:一个组的最大值 组 距:上限与下限之差 组中值:下限与上限之间的中点值
组中值=
下限值+上限值
2
组距分组
(步骤)
1.
确定组数:组数的确定应以能够显示数据的分布特 征和规律为目的。在实际分组时,可以按 Sturges 提出的经验公式来确定组数K
链接
(1)统计调查方案 (2)统计调查方法
(3)统计调查的组织方式
统计资料的整理
统计资料的整理,是根据统计研究的目 的,对所收集到的大量、零星分散的原始资料 进行科学加工与综合,使之系统化、条理化、 科学化,为统计分析提供反映事物总体综合特 征资料的工作过程。
1. 统计资料的审定
2. 统计资料的分组
它的优点是当调查项目不多时,应用一览 表能使人一目了然,还可将调查表中各有 关单位的资料相互核对,其缺点是对每个 调查单位不能登记更多的项目。
统计调查方 法 1. 现场观察法 2. 报告法 3. 问卷法
4. 访谈法 5. 实验采集法
统计调查 1. 统计报表 组织方式
2. 普查 3. 抽样调查
全面调查
•简单随机抽样:随机性原则 •分层抽样:将总体按标志分为若干个类型组。
•系统抽样:又叫等距抽样或机械抽样。将总体 按某一标志排队,每隔相等的间隔和距离抽样。
• 整群抽样:将总体划分为若干个群(组), 然后以群(组)为单位从中抽取部分群 (组)。对抽中的群(组)进行全面调查。
重点调查
重点调查(Key-point Survey)是指在 调查对象中,选择一部分重点调查单位收 集统计资料的一种非全面调查。
条形图
(由 Excel 绘制的条形图)
其他广告 2 招生招聘广告
10
广 房地产广告 告 金融广告 类 型 服务广告
商品广告
16 9
51 112
0
40
80
人数(人) 120
相关主题