当前位置:文档之家› 统计学课件:数据的描述

统计学课件:数据的描述


5
10
115~120
8
16
120~125
14
28
125~130
10
20
130~135
6
12
135以上
4
8
合计
50
100
15
3.1.2 列联表(Contingency table )
❖ 同时根据两个变量分组,汇总得到的结果称为列 联表。列联表反映的是两个变量的联合分布,可 以用来分析两关变量之间的关系。也称为交叉分 组表(Cross tabulation)。
8
19.05%
❖通过频数分布表可以发 70-80
12
28.57%
现数据分布的特征。 80-90
15
35.71%
90以上
4
9.52%
合计
42 100.00%
❖频数(frequency) :每个组中的数据个数,也称次 数。
❖频率(relative frequency) :频数/总数据个数。
7
分组方法
分组方法
12
等距分组表:上下组限间断
某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
频率(%)
105~109
3
6
110~114
5
10
115~119
8
16
120~124
14
28
125~129
10
20
130~134
6
12
135~139
4
8
合计
50
100
13
(上下组限重叠,上组限不在内)
某车间50名工人日加工零件数分组表
17
3.1.3 常用统计图
数据类型
定性数据
定量数据


线

直箱 茎
形 图



方线 叶 图图 图
18
圆形图 (Pie Chart)
❖ 也叫饼图,它是用圆形及圆内扇形的面积 来表示数值大小的图形。主要用于总体内 部的结构,各组成部分所占比例等。
其他 马来-印
讲世界各种语言的人数
中国北方
印地语
西班牙语
的统计方法。 ▪ 关键:选择分组变量和划分各组界限 ▪ 例如按照考试成绩把学生分为优、良、中、及
格、不及格。 ❖ 统计分组的结果是形成频数分布(分布数列,
Frequency Distribution)。
6
统计分组
❖ 两个构成要素:
成绩
人数
频率
▪ 各组的分组界限
60以下
3
7.14%
▪ 每组中的次数或频率 60-70
按品质变量分组
按数量变量分组
单变量值分组
组距分组
等距分组
不等距分组
8
单变量值分组
❖ 将一个变量值作为一 组,适合于离散变量 ,适合于变量值较少 的情况。
▪ 例如某学院2012年 毕业研究生毕业时 发表论文篇数的频 数分布表(右表) 。
发表论 文篇数
2 3 4 5 6 合计
人数
6 8 5 3 2 24
按零件数分组
频数(人)
频率(%)
105~110
3
6
110~115
5
10
115~120
8
16
120~125
14
28
125~130
10
20
130~135
6
12
135~140
4
8
合计
50
100
14
等距分组表:(使用开口组)
某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
频率(%)
110以下
3
6
110~115
4
§ 3.1 统计图与统计表 ❖ 变量分为定性变量和定量变量:
▪ 定性变量主要反映现象的分类情况, ▪ 定量变量主要反映现象的数值大小;
❖ 因此对不同的变量采用的图形表示也不相同 ❖ 绘制统计图一般都需要先对数据进行统计分组,
在得到的频数分布表的基础上制图。
5
§ 3.1.1 统计分组与频数分布 ❖ 统计分组:就是按照研究目的将数据分成若干组
9
组距分组
❖ 将变量值的一个区间作为一组,适合于连续变 量,适合于变量值较多的情况。
❖ 分组必须遵循“不重不漏”的原则。 ❖ 分为等距与不等距分组。
▪ 各组组距都相等时为等距分组。 ▪ 为了避免有些组中的频数很少甚至是空白的
情况,有时也可以采用不等距(异距)分组 。 ❖ 应用中可能需要把第一组和/或最后一组设为开 口组。
英语 阿拉伯语 孟加拉语 葡萄牙语
俄语 日语 德语 法语
左图给出了说世界各种主 要语言人数的比例(SPSS数 据:language.sav)。 该图看不出具体说各种语 言的具体人数,但可以看 出比例,而且如果知道世 界总人口,也可以大致推 算出说各种语言的人数。
19
条形图(Bar Chart)
❖ 用宽度相同的条形高度或长短来表示数据 变动的图形,条形的排列可以横排,也可 以纵排。条形图有单式、复式等形式。
❖ 有些特征大略了解一下就可以得到: ▪ 这些数据的大致范围 ▪ 是定性还是定量 ▪ 有多少变量 ▪ 收集该数据的目的等等
3
数据的描述 ❖ 数据的描述就像给人画像一样,使数据能反映出
其关键特征。 ❖ 本章的教学目的,给数据画像。
❖ 本章要回答的问题 ▪ 常用的统计图表有哪些?如何绘制和解释其含 义? ▪ 通常使用哪些数值指标描述数据的特征?如何 计算?
❖ 列联表一般根据两个定性变量进行编制,如果是 定量变量则需要先对单个变量进行分组。
❖ 列联表中的数字为交叉单元格中的频数或频率。 ❖ 以列联表为基础可以对两个变量之间的关系进行
多种统计检验。
16
列联表举例
市场营销专业 统计学专业
男生
10
20
女生
30
15
合计
40
35
合计
30 45 75
市场营销专业的男生有10人。
❖ 1、 下 限:一个组的最小可能值 ❖ 2、 上 限:一个组的最大可能值 ❖ 3、 组 距:上限与下限之差 ❖ 4、 组中值:下限与上限之间的中点值,(下限
+上限)/2。
开口组的组中值可以按以下方法计算: 缺下限:上限-邻组组距/2 缺上限:下限+邻组组距/2
但许多作者认 为无法计算开 口组的上限或 下限。
数据的描述
❖统计图与统计表 ❖数据集中趋势的数值描述 ❖数据离散程度的数值描述 ❖数据分布的形态
数据的描述 ❖ 数据的描述----概括数据的特征



如同给人画像一样





2
数据的描述
❖当我们面对一大堆数据时,往往眼花缭乱。没有 人能够记住那些巨大的数据中的所有数值, 但仍可以对数据形成一些印象。
讲世界各种语言的人数4000来自30002000
1000
0 中国北印方地语西班牙英语语 阿拉伯孟语加拉葡语萄牙俄语语 日语 德语 法语 马来-其印他
10
组距分组的步骤
1、确定组数:通常为5到15 (20)组。 Sturges 提出的经验公式:分组组数K应满足
2 K n, K 1 lg( n) lg( 2)
2、确定组距和各组界限,建议为5,10…的倍数。 组距≈( 最大值 - 最小值)÷ 组数 3、根据分组整理成频数分布表
11
组距分组中的基本概念
相关主题