当前位置:文档之家› 第4章数据分布特征的测度(二)学习资料

第4章数据分布特征的测度(二)学习资料

定义:方差是各变量值与其均值离差平方的算术平均数 标准差是方差的平方根
作用:反映一组数据的绝对变异程度 说明平均数的代表性的强弱
特点:能够准确描述出数据的离散程度
方差和标准差的计算方法
总体的方差和标准差
N
(Xi )2
2 i1 N
K
( X i )2 Fi
2 i1 K
Fi
i1
K
2 (Xi )2Pi i1
Mk
i1
n
偏度的测度
偏度的概念:是指一组数据分布的偏斜方向和程度
偏度的测度:偏度系数α
从两组的离散系数可以看出,甲组相对的变异程度 大于乙组,因而乙组平均工资的代表性要大。
返回
三、偏度与峰度的测度
矩 偏度的测度 峰度的测度
偏度系数的意义
=0 对称分布
<0 左偏分布
0 右偏分布
数据分布的偏度特征及测度示意图

K阶中心矩
n
( xi x )k
mk i1 n
K阶原点矩
n
xik
离散程度的计算方法
常用的离散系数是标准差系数
总体离散系数 样本离散系数
V
100%
Vs
s x
100%
[例] 甲乙两组工人的平均工资分别为138.14元、176元, 标准差分别为21.32元、24.67元。计算两组工人工资水平 离散系数。 解 V甲12318..3124100%15.43% V乙21 47 .6 67100%14.02%
平均数的比较
算术平均数、调和平均数和几何平均数的比较
1.它们都是数值平均数,都易受极端值的影响
2.它们都是数值型数据集中趋势的代表值 算术平均数适用于各变量值之间存在相加关系的场合 调和平均数通常是作为算术平均数的变形形式使用 几何平均数适用于各变量值之间存在连乘积关系的场合
众数、中位数与算术平均数的比较
134
127
123 118 112
112 134
127 123 119
113
120
123 127 135
137 114
120 128 124
115
139
128 124 121
求总体方差和标准差、样本方差和样本标准差。
某地区农民家庭年人均收入资料
按年人均收入 分组(元)
x
1000~1200 1200~1400 1400~1600 1600~1800 1800~2000 2000~2200 2200~2400 2400~2600
[例] 某地区GDP 1991~1995年平均发展速度为107.2%, 1996~1998年平均发展速度为108.7%,1999~2000年 平均发展速度为110%,求该地区1991~2000年间的平均 发展速度。
3
解:
fi Gi1
3
xfi i
101.07251.08731.12108.2%
i1
合计
农民家庭数 (户)
f
240 480 1050 600 270 210 120 30
3000
求总体方差和标准差、样本方差和样本标准差。
❖ 某车间两组工人生产产品日产量
甲组 62 65 70 73 80 82 乙组 8 13 17 19 22 24
甲组均值72, 标准差σ=7.97
乙组均值17.17,标准差σ=5.91
离散程度:是指一组数据远离其中心值的程度,也
称为“离中趋势”, 反映了数据之间的变异程度。
离散程度的测度:——极差、方差、标准差和离散
系数
二、离散程度的测度
标志变异指标
极差 方差
标准差 离散系数
极差(Range)
定义:是指一组数据的最大值与最小值之差, 用R表示。 作用:反映一组数据的绝对变异程度 特点:不能准确描述出数据的离散程度
( fi) 1
i1
k
(xi x )2 fi
S
i1 k
( fi) 1
i1
(已分组整理)
某生产车间50名工人日加工零件数原始资料(单位:个)
117 122
124 129 139
107
117
130 122 125
108 131
125 117 122
133
126
122 118 108
110 118

123 126 133
极差的计算方法
1.未分组整理或单项式分组整理的数据
Rm ax(xi)m in(xi)
2.组距式分组整理的数据
R 最高组上限值-最低组下限值
某生产车间50名工人日加工零件数原始资料(单位:个)
117 122
124 129 139
107
117
130 122 125
108 131
125 117 122
甲组V
100%9.79100%13.6%
x
72
乙组V
100% 5.91100%34.4%
x
17.17
离散系数
(coefficient of variation) 定义:是各变异指标与其算术平均数的比值,用V表示。
作用:反映一组数据的相对变异程度 用于比较多组数据的平均值的代表性的强弱
特点:能够准确描述出数据的离散程度
N
(Xi )2
i1 N
K
( X i )2 Fi
i1 K
Fi
i1
K
(Xi )2Pi i1
(未分组整理) (已分组整理)
样本的方差和标准差
n
(xi x )2
S 2 i1 n 1
n
(xi x )2
S i1 n 1
(未分组整理)
k
(xi x )2 fi
S 2 i1 k
第4章数据分布特征的测度(二)
4.由组距数列确定众数时,如果众 数组的相邻两组的次数相等,则
❖ A. 众数在众数组内靠近上限 ❖ B. ❖ C. 众数组的组中值就是众数 ❖ D.
[例] 某产品需经三个车间连续加工,已知 三个车间制品的合格率分别95%、90%、98%, 求三个车间平均合格率。
3
解: G3 Xi 395% 90% 98%94.28% i1
133
126
122 118 108
110 118
123 126 133
134
127
123 118 112
112 134
127 123 119
113
120
123 127 135
137 114
120 128 124
115
139
128 124 121
极差:32
方差(Variance) 标准差(Standard deviation)
1.众数和中位数都是位置平均数,不受极端值的影响 2.众数、中位数与算术平均数之间存在以下关系
M0 Me x 对称分布
x Me M0 左偏分布
M0 Me x 右偏分布
第四章 数据分布特征的测度(二)
离中趋势的测度
——变异指标
主要内容和学习目标
集中趋势的测度(掌握) 离散程度的测度(掌握) 偏度与峰度的测度(了解)
相关主题