当前位置:
文档之家› 第三章:统计数据分布特征的描述
第三章:统计数据分布特征的描述
3、用途:用于计算时间数列的平均 发展速度(率)
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
二、位置平均数 (一)、中数 1、定义:指位于一组数据中较大的一半与
较小的一半中间位置的那个数值。
2、性质:
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
3、计算 (1)原始数据:
3
246.49
112.5
5
114.49
117.5
8
32.49
122.5
14
0.49
127.5
10
18.49
132.5
6
86.49
137.5
4
204.49
—
50
—
(Xi- X )2Fi
739.47 572.45 259.92
6.86 184.90 518.94 817.96 3100.5
K
( X i X )2 Fi
1689.25 0.956 1766.7339
结论:偏态系数为正值,而且数值较大,说明农村居民家庭纯 收入的分布为右偏分布,即收入较少的家庭占据多数,而收入 较高的家庭则占少数,而且偏斜的程度较大
黔南民族师范学院管理科学系
管理类专业基础课程
《管理统计学》
二、峰度系数
(一) 原始数据
K
X
i
X
4
4 i1 N x 4
1. 众数的值与相邻两组频数的分布有关
2. 相邻两组的频数相等时,众数组的组中值
即为众数
Mo
3. 相邻两组的频数不相等时,众数采用下 列近似公式计算
M0
L
(
f
f f1 f1) ( f
f 1 )
i
Mo
4. 该公式假定众数组的频数在众数组内均匀分布 Mo
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
(一)原始数据: (二)分组数据:
K
Xi X
3 i
3 i1 N x3
K X i X 3 Fi
3 i1 N x3
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
解释: 1.偏态系数=0为对称分布 2.偏态系数> 0为右偏分布 3.偏态系数< 0为左偏分布
黔南民族师范学院管理科学系
五、标准差 (一)概念:为离差平方的算术平均数的平
方根。
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
(二)标准差的计算
1、未分组数据:
x
N
(Xi X )2
i 1
N
2、分组数据:
x
K
( X i X )2 Fi
i 1
K
Fi
i 1
黔南民族师范学院管理科学系
管理类专业基础课程
《管理统计学》
标准差计算例
【例】根据第三章表中的数据,计算工人日加工零件数的标准差
按零件数分组
105~110 110~115 115~120 120~125 125~130 130~135 135~140
合计
某车间50名工人日加工零件标准差计算表
组中值(Xi)
频数(Fi)
(Xi- X )2
107.5
管理类专业基础课程 《管理统计学》
(二)、几种差异量数的比较 1、极差 2、四分位差 3、平均差 4、标准差
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
第3节:数据分布的偏度和峰度的描述
偏态
峰度
左偏分布 右偏分布
扁平分布
与标准正态 分布比较!
尖峰分布
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
管理类专业基础课程 《管理统计学》
第三章:统计数据分布特征的描述
第1节:分布集中趋势的测度:集中量 第2节:分布离散程度的测度:差异量 第3节:分布偏度和峰度的测度:偏态量与
峰态量 第4节:数据地位的测度:标准化值
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
数据分布的特征
集中趋势 (位置)
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
(二)加权算术平均数 1、计算公式:
K
X
X1F1 X 2 F2 X N FN F1 F2 FN
X i Fi
i1 K
Fi
i1
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
2、用途: (1)分组数据求平均数。 (2)需要权重的现象求平均数。
一个众数:
659855 多于一个众数:
25 28 28 36 42 42
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
(2)分组数据: 方法一:观察法 方法二:皮尔逊经验法(当频数分布为正态
或近似正态分布时)
黔南民族师范学院管理科学系
管理类专业基础课程
《管理统计学》
方法二:金氏插补法
户数比重(%) Fi
2.28 12.45 20.35 19.52 14.93 10.35 6.56 4.13 2.68 1.81 4.94
(Xi- X ) Fi3
-154.64 -336.46 -144.87 -11.84
0.18 23.16 89.02 171.43 250.72 320.74 1481.81
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
众数、中位数和均值的关系
均值 = 中位数 = 众数
众数 中位数 均值
均值 中位数 众数
对称分布
正偏分布
负偏分布
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
(二)几种平均数的比较 优良统计量应具备的六个条件: ①感应灵敏。 ②确定严密。 ③意义简单明确。 ④计算简易。 ⑤易于代数处理。 ⑥受抽样影响小。
x i1 K
Fi
i 1
3100.5 7.8( 7 个) 50
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
(三)标准差的用途 ◆广泛用于表明数据的离散程度或离中趋势。 ◆标准差是进行相关分析和统计推断的必须
量数。
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
(四)离散系数
(二)计算 1、原始数据:
Q1: 1 N 4
Q3: 3 N 4
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
2、分组数据:
Q1 L
N 4
n1 i
fm
Q3
L
3N 4
n1
fm
i
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
(三)四分位差的用途: 与中数配合使用,描述一组数据分布中中间
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
二、四分位差
(一)概念:分位:百分位、四分位,即数 据所处的位置。一组按大小顺序排列的数 据中,中间50%的数据的极差的一半。或 第一四分位与第三四分位数之差的一半。
QD =( Q3 – Q1)/2
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
(三)几何平均数 1、有关发展速度的几个概念 (1)、发展速度 (2)、增长速度
2、几何平均数的计算公式:
N
G N a1 a2 aN N ai iห้องสมุดไป่ตู้1
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
简化公式:
G N xn x1
据不清楚时。
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
(二)众数 1、定义:指一组数据中出现次数最多的那
一个数值。 2、众数的求法: (1)未分组数据:出现次数最多者。
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
众数的不唯一性
无众数: 10 5 9 12 6 8
管理类专业基础课程 《管理统计学》
根据上表数据计算得
K
X X i • i1
Fi
K
21.42(9 百元)
Fi
K
Xi •
i 1
Fi
K
Fi
12.08(9 百元)
i 1
i 1
将计算结果代入公式得
K
11
3
i 1
Xi X
N 3
3 Fi
X i 21.4293 Fi
i 1
1 12.0893
3、众数的用途: (1)用于分类数据集中趋势的度量。 (2)用于数值型数据中需要快速而粗略地
寻找代表值时。 (3)用于粗略地估计频数分布的形态。
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
三、几种平均数的比较 (一)算术平均数、中数、众数的关系 1、正态分布时: 2、正偏态分布时: 3、负偏态分布时:
公式:
原始数据:
分组数据:
N
(Xi X )2
x 2 i1
N
K
( X i X )2 Fi
x 2 i1 K
Fi
i 1
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
(二)方差应用:主要用于推断统计中多个 平均数差异的比较。
黔南民族师范学院管理科学系
管理类专业基础课程 《管理统计学》
AD i1 K
Fi
i 1