当前位置:文档之家› 经济应用统计学-第四章统计整理

经济应用统计学-第四章统计整理


编码意义
1
职务
1
1.正高
2.副高
3.中级
4.其他
2
年龄
2-3
答卷人回答年龄
3
从事专业
4-6
专业编码见附表
4
工作评价
7
1.已充分发挥积极性
2.基本发挥了积极性
3.积极性有所发挥
4.完全没有发挥积极性
5
是否打算离
8
1.是
开学校
2.否
6
按投入精力
9-11
1.校内工作
排列
2.校外兼职
3.生活琐事
若某份问卷的 回答信息在答 录卡上的前11 为数字为:
分布数列的种类
考分
组距
次数
次数密度= 次数/组距
50-60
4
2
0.5
60-66
6
5
0.833
66-82
16
14
0.875
82-92
10
11
1.1
92-100 8
8
1.0
三、累计分布数列
将变量数列各组的频数(或频率)逐组累计相加而
形成的数列 什么以下 的有多少
向上累计
从变量值低的组开始,将各组次数(频率) 逐次向变量值高的组累计,说明某一组上限 以下各组的累计次数(频率)。
工人数(人) f
3 5 6 4 3 2 1
24
分布数列的种类
组距式分布数列 每个组的变量值用一个区间来表现的变量数列
编制条件:
或者
变量是连续变量
总体单位数较多,变量不同取值个数也较多的 离散变量
分布数列的种类
组距式分布数列—相关概念
组限 组距
指每组两端表示各组界限的变量值,各组的最小 值为下限,最大值为上限
利用计算机进行统计汇总主要包括: 审核、编码、录入、数据净化、 逻辑检查运算以及编制和打印汇总 表、统计图等。
一、编 码
编码 将调查表或调查问卷中的各个项目转化为数字符号的过程。
事前编码 事后编码
适用封闭性问题 适用开放性问题
(一)编码的常用方法
1、顺序编码法
又称系列编码法。只用一个标准对数据进行分类,并按 照一定的顺序用连续数字或字母进行编码的方式。
对某随机现象的重复观察,频率分布可以渐近反映其 统计规律。
2、分布数列
分布数列:将各组组别的名称与相应的频数和频率,依 次排列起来形成的数列称为次数分布数列,简称分布 数列。也称分配数列或次数分配数列。
作用:反映总体中所有单位在各组的分布状态和分布特征。
分布数列的意义:分布数列是统计整理结果的一种表现 形式,也是统计分析的一种方法。不仅可以表明总体单 位的分布特征和结构状况,而且可用以进一步研究总体 单位某一标志的构成、平均水平及其变异程度。
(二)编码手册的编制
也称编码表,是用来进行数据编码的工作手册,包括 四个项目:问题顺序号,每个调查项目的预置代码位置, 项目名称,内容说明.
案例:对某高等学校教师的工作,生活状况的调查,一共有32个 问题,我们摘录6个问题,来说明编码手册的编制.
1.您的职务? (1)正高级 (2)副高级 (3)中级 (4)其他 2.您的年龄_____________________ 3.您从事的专业__________________________ 4.您对自己工作情况的评价?
51.37 48.63
30048224
100.00
f
f/∑f
学生的成绩分布
f 按成绩
次数
分组
学生数 比重(%)
(人)
60以下
2
4
60-70
8
16
70-80
20
40
80-90
15
30
90以上
5
10
合计
50
100
二、分布数列的种类
按由品于质分标组志是分次组数形分成布的的分基布础数,列因称此为有品怎质样分的布分数组列就,形 简称品质数列。 成怎样的次数分布。
03
……

1000-1100
10
若某个被调查者为女性,居住于中等城市,家中有三口人,月收入为1000-1100则其 回答信息为22310
(一)编码的常用方法
3、信息组码编码法 把调查数据分成不同的组,给以一定的组码(数 字区间)来进行编码的方法.
例如:对某地市场上99种商品的价格变动进行调查,在运用信息组码编码法 对调查的信息进行编码时,首先对99种商品分组,再给每个组分配一个组码:
等距分组与不等距分组的差异
等距分组 各组频数的分布不受组距大小的影响 可直接根据绝对频数来观察频数分布的特征和规律
不等距分组 各组频数的分布受组距大小不同的影响 各组绝对频数的多少不能反映频数分布的实际状况 需要用频数密度(频数密度=频数/组距)反映频数分布的实际状况, 以解决各组频率由于组距不同而不可比的问题。
23300112132 则表示 为??????
二、录入
数据录入就是将问卷或编码表中的每一个项目对应的 代码读到磁盘中,或通过键盘直接敲入计算机中的工作 过程。
方式:
程序录入 光电扫描录入
三、数据净化
数据净化指通过计算机处理错误的或不合理的数据以 及进行一致性检验。
方式:
统计软件:SPSS、SAS
分布数列的种类
单项式分布数列—案例
【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23, 20,24,23,21,22,25,26,20,21,21,22,22,23,22,22, 24,25,21,22,21,24,23.要求根据以上资料编制变量数列。
日产量(件)X
20 21 22 23 24 25 26 合计
变量类型的转化 数学意义上的变量代换
第四节 分布数列的编制
第四节 分布数列的编制
一、次数分布与分布数列的概念 二、分布数列的种类 三、累计分布数列 四、次数分布图 五、次数分布的类型
一、次数分布与分布数列的概念
1、次数分布:在统计分组的基础上,将总体的所有单位按组归类整理,
并按一定顺序排列,形成总体中各单位在各组间的分布,就叫做次数
综按数合量上标述志各种分分组组形类成型的,分次布数数分列布称的为类变型量,分可布归数纳列为,: 简称变量数列。
品质分布数列
次数
分布
单项式分布数列
变量分布数列
组距式分布数列
等距分布数列 异距分布数列
某地人口的性别分布
按性别 分组
男 女 合计
次数 人数(人) 比重(%)
15434927 14613297
51.37 48.63
30048224
100.00
品质 数列
学生的成绩分布
变量 数列
按成绩 分组
次数
学生数 (人)
比重(%)
60以下
2
4
60-70
8
16
70-80
20
40
80-90
15
30
90以上
5
10
合计
50
100
分布数列的种类
单项式分布数列 每个组值只用一个具体的变量值表现的数列
编制条件:
同时 变量是离散变量 具备 变量的不同取值个数较少
分布数列的构成要素
总体所分各组的 分组标志的具体 体现
各组名称(常用x 表示)
两个构成要素 各组次数
绝对数,称频数,用 f 表示。
相对数,称频率,用f/∑f表示。
各组对应的 总体单位数 或频率。
f/∑f
某地人口的性别分布
按性别 分组
男 女 合计
次数 人数(人) 比重(%)
15434927 14613297
优点:满足各 层次的需要; 便于审核更正
优点:速度快 层次少
缺点: 有错不易查 找; 不能及 时满足中间 层次需要
三、统计整理的程序
1、设计和编制统计资料的汇总方案 2、对原始资料进行审核 3、对调查数据进行编码及录入 4、分组汇总原始资料 5、编制统计表和绘制统计图
第二节 统计汇总技术
第二节 统计汇总技术
第三节 统计汇总的质量控制
一、资料审核
汇总前对统计资料进行审核是统计汇总质量控制的关键。
全面性审核 审核调查单位的全面性、审核调查项目的全面性 准确性审核 逻辑审核、计算技术审核
二、编码和录入的质量控制
编码工作的质量控制 录入工作的质量控制
三、统计预处理
缺省数据的处理 加权处理 原始数据或变量的转换
累计次数
向上 商店数 频率(﹪) 累计
向下 累计
累计频率(﹪)
向上 累计
向下 累计
5以下
4
8
4
50
8
100
5~10
10
第四章 统计整理
学习目标
明确统计资料整理的涵义和作用 了解统计整理的内容和程序 掌握分布数列的编制方法
本章主要内容
第一节 第二节 第三节 第四节
统计整理的一般问题 统计汇总技术 统计汇总的质量控制 分布数列的编制
第一节 统计整理的一般问题
第一节 统计整理的一般问题
一、统计整理的概念 二、统计整理的内容 三、统计整理的程序
每组变量值变动区间的长度,为上下限之差
组中值 每组变量取值范围的中点数值
组中值 上限 下限 2
分布数列的种类
组距式分布数列
上组限U
某地区100个百货商店
月销售额与流通费用情况
组距d=U-L
=100-50=50(万元)
销售额(万元)
商店数 (个)
每百元商品销售额中 支付的流通费(元)
相关主题