第三章统计数据的整理及显示
17
在Excel中建立数据透视表
18
形成的数据透视表
19
第二节 统计数据的整理 一、分类型数据的整理 二、顺序型数据的整理 三、数值型数据的整理
20
一、分类数据整理—频数分布表
【例1】一家市场调查公司为研究不同品牌饮 料的市场占有率,对随机抽取的一家超市进 行了调查。调查员在某天对50名顾客购买饮 料的品牌和顾客性别进行了记录。下页表格 就是记录的原始数据
汇源果汁
顾客性别
女 女 男 女 女 女 女 男 女 女 男 男 男 女 女 女
饮料类型
露露 可口可乐 旭日升冰茶 百事可乐 露露 汇源果汁 可口可乐 百事可乐 露露 旭日升冰茶 可口可乐 旭日升冰茶 可口可乐 汇源果汁 百事可乐 可口可乐
22
分类数据的整理
1.基本过程
▪ 列出各类别 ▪ 计算各类别的频数 ▪ 制作频数分布表
30
分组方法
分组方法
单变量值分组
组距分组 等距分组 异距分组
31
单变量值分组 (要点) 单变量值分组
——将一个变量值作为一组 1.适合于离散变量 2.适合于变量值较少的情况
32
零件数 (个) 107 108 110 112 113 114 115 117 118
单变量值分组表
某车间50名工人日加工零件数分组表
1. 频 数:落在各类别中的数据个数 2. 比 例:某一类别数据占全部数据的比值 3. 百分比:将对比的基数作为100而计算的比值 4. 比 率:不同类别数值的比值
23
分类数据的整理与显示
2.频数分布表(通过数据透视表在Excel中得到)
24
利用SPSS的频数分析得到
25
通过SPSS 的交叉列联表获得
用Excel制作频数分布表
21
顾客性别 饮料类型 顾客性别
女
旭日升冰茶
女
男
露露
男
男
旭日升冰茶
男
女
可口可乐
女
男
百事可乐
男
男
可口可乐
女
女
汇源果汁
男
女
可口可乐
女
男
露露
女
男
可口可乐
女
女
可口可乐
男
女
旭日升冰茶
男
男
可口可乐
女
男
百事可乐茶
女
男
旭日升冰茶
女
饮料类型
旭日升冰茶 可口可乐 可口可乐 旭日升冰茶 露露 旭日升冰茶 可口可乐 露露 百事可乐 百事可乐 汇源果汁 露露 百事可乐 可口可乐 百事可乐 汇源果汁
10
三、数据的排序
1. 按一定顺序将数据排列,以发现一些明显
的特征或趋势,找到解决问题的线索
2. 排序有助于对数据检查纠错,以及为重新
归类或分组等提供依据
3. 在某些场合,排序本身就是分析的目的之
一
4. 排序可借助于计算机完成
11
数据排序(方法) 1. 分类数据的排序
▪ 字母型数据,排序有升序降序
户数 (户)
百分 比
(%)
向上累积 户数 百分比 (户) (%)
非常不满意 24 8
24
8.0
不满意
108 36
一般
93 31
满意
45 15
非常满意 30 10
132
44.0
225
75.0
270
90.0
300
100.0
合计
300 100.0 —
—
28
顺序数据的频数分布表 (例题分析)
乙城市家庭对住房状况评价的频数分布
13
数据排序(方法)
在Excel中进行排序(以8名学生的考试成 绩为例)
14
数据排序(方法)
按统计学成绩排序后的学生成绩排名
15
四、建立数据透视表
➢ 从复杂的数据中提取有用的信息 ➢ 可以对数据表的重要信息按使用者的习惯或
分析要求进行汇总和作图,形成交叉表
➢ 数据源表中的首行必须有列标题
16
数据透视表
4
二、数据的筛选
1)当数据中的错误不能予以纠正, 或者有些数据不符合调查的要求而又无 法弥补时,需要对数据进行筛选
2)根据某种需要进行筛选
5
数据筛选(data filter)
▪ 用Excel进行数据筛选
▪ 8名学生的考试成绩数据
6
数据筛选(data filter)
7
自动筛选
8
高级筛选
9
高级筛选
频数 (人)
零件数 (个)
频数 (人)
零件数 (个)
频数 (人)
1
119
1
128
2
2
120
2
129
1
1
121
1
130
1
2
122
4
131
1
1
123
4
133
2
1
124
3
134
2
1
125
2
135
1
3
126
2
137
1
3
127
3
139
2
33
组距分组 (要点) 组距分组
——将变量值的一个区间作为一组
1. 适合于连续变量 2. 适合于变量值较多的离散型变量情况 3. 需要遵循“不重不漏”的原则 4. 可采用等距分组,也可采用不等距分组
27
顺序数据的频数分布表 (例题分析)
【例2】在一项城 市住房问题的研 究中,研究人员 在甲乙两个城市 各抽样调查300户 ,其中的一个问 题是:“您对您 家庭目前的住房 状况是否满意?
1.非常不满意; 2.不满意;3. 一般;4.满意; 5.非常满意。
甲城市家庭对住房状况评价的频数分布
甲城市
回答类别
乙城市
回答类别
非常不满意
不满意 一般 满意 非常满意
合计
户数 (户)
21 99 78 64 38 300
百分比 (%)
7.0 33.0 26.0 21.3 12.7 100.0
向下累积
户数
百分比
(户)
(%)
300
100.0
279
93.0
180
60.0
102
34.0
38
12.7
—
—
29
三、数值型数据的整理 【例】某生产车间50名工人日加工零件数 如下(单位:个)。试对数据进行分组。
第三章 统计数据的整理与显示
目录
第一节 数据的预处理 第二节 统计数据的整理 第三节 统计数据的显示
2
第一节 数据的预处理
一、数据的审核 二、数据的筛选 三、数据的排序 四、建立数据透视表
3
一、数据的审核
数据的审核即对调查资料进行审核 ➢ 审核资料的完整性和及时性 ➢ 审核资料的正确性 ➢ 历史资料的审核
26
二、顺序型数据的整理
1累积频数(cumulative frequencies): 各类别频数的逐级累加
2累积频率(cumulative percentages): 各类别频率(百分比)的逐级累加
方向: 向上累积:自类别顺序的开始一方向
最后一方累加 向下累积:自类别顺序的最后一方向
开始一方累加
之分,但习惯上用升序
▪ 汉字型数据,可按汉字的首位
拼音字母排列,也可按笔画排 序,其中也有笔画多少的升序 降序之分
12
数据排序(方法)
2.数值型数据的排序 ❖递增排序:设一组数据为 x1,x2,…,xn, 递增排序后可表示为: x(1)<x(2)<…<x(n) ❖递减排序:可表示为 x(1)>x(2)>…>x(n)