第4章离散趋势测度
变异系数(离散系数): 数列的离散水平指标与数列均
V 值的比值。
VR
R x
VAD
AD x
V
x
离散程度的度量
(一)全距和四分位差 (二)平均差 (三)方差和标准差
(四)变异系数 (五)偏度
4.3 统计分佈的形态
相对于正态分佈而言,总体的分佈是否对称? 集中趋势是高是低?分别用偏度和峰度指标 来反映。
20 18
集中趋势弱、
16 14
离散趋势强
12
10
8
6
4
2
0
x 164cm 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175
140 120
集中趋势强、
(x x)2 N 1
方差及标准差的计算
一般的计算过程:列表
第一步 第二步 第三步 第四步 计算均值 计算离差 离差平方 乘以权数
x x x (x x)2 (x x)2 f
简捷计算方法:不计算离差
2 x2 x2 x2 f x2 f
方差及标准差的作用
5
165 166
165 166
165 167
165 167
值
2 167 168 168 168 168 168 168 168 169
0
170 172
170 174
170 185
11Q79001 117900Q2127001Q1371
172
172
152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175
SK
m3
3
对称分布 左偏分布 右偏分布
0
数据向左边 延伸得更多
偏态系数的含义
左偏分布(也称负偏分布):
偏态系数 SK< 0;偏态系数的 绝对值越大,偏斜越严重
数据向右边 延伸得更多
对称分布:偏态系数=0。
右偏分布(也称正偏分布) : 偏态系数SK> 0;偏态系数的 绝对值越大,偏斜越严重。
三阶中心矩、四阶中心矩可用来描述 偏度和峰度两个指标可检验数据集的分佈是
否接近正态分佈(Skew=0,Kurt=0)。统计实 务中常用来进行质量管理(如产品、过程等的 一致性、稳定性)
一、矩(动差 )
矩(动差 )—— 一系列刻画数据分布 特征的指标的统称。
• 变量值与数值 a 之离差的 K 次方的平均数 称为变量 x 关于 a 的K 阶矩,即:
全距=127040-152=2428(cm)
四分位差=1678-160=78(cm)
离散程度的度量
(一)全距和四分位差 (二)方差和标准差
(三)变异系数 (四)偏度
方差及标准差的概念
Var 2 S2
方差(variance):各变量值与其 算术平均数离差平方的算术平均数。
标准差(mean square deviation Standard deviation ):是方差的 算术平方根。也称均方差、均方根
zi
xi
x
若数据落在控制 线外,则认为生产过 程失去控制,判断错 误的概率小于0.5%。
控制上限 中心线
3 x
3 x
控制下限
质量控制统计中控制图的原理
国外一项研究表明,IQ 值呈 正态分布,其平均数为100,标准 差为15。问:凡 IQ 值高于145的 人都被视为天才,经验法则是否 支持这一论断?
N0 f0 Q
N f
是非标志的均值及标准差
是非标志的均值:
x
x
f
f
1 P 0Q P
是非标志的标准差:
(x x)2 f Q2P P2Q
PQ
f
PQ
某厂某月份生产了1000件产品, 其中合格品900件,不合格品100件。 求产品质量分布的集中趋势与离散 趋势。
离散程度的度量
(一)全距和四分位差 (二)平均差 (三)方差和标准差
(四)变异系数 (五)偏度
变异现象举例
如果某家人每天的食谱都是一样的,穷还是 富?南美安第斯山,穷人老是吃土豆和玉米
• 变异太小是“单调”、“斋”
宁欺山莫欺水
• 水裏的危险更多更隐蔽,猝不及防
什么是“戏剧性变化”
• 现实中的变化小,但无巧不成书,要把许多小概 率事件汇集一处,“浓缩”人生
《统计学》第二章 统计数据 STAT
大象 500 kg
免子 0.5kg
可比
x大象 3500 kg
x免子 2.5kg
《统计学》第二章 统计数据 STAT
身高
x身高
可 比
体重
x体重
身高的差异水平:cm 用变异系数可以相互比较
体重的差异水平:kg
《统计学》第二章 统计数据 STAT
说应明当该进学一生步两加科以考检试查成、绩鉴的别。
Z分数 相于zi一于以对平般-被位均3X的认或置成i建为大是绩议是于相0.是异+5同z个3:常i的的标值凡,数准x。Z即i据差s分都均。x数高可小
标准化的数值,标明 Xi 距 离其平均数的标准差个数。
异常值的诊断
Z分数法 异常值:
zi 3
n
(xi
a)k
fi
i1
n
fi
i 1
K 阶原点矩(当a = 0 时)是数据的K次方的平均数.
• 一阶原点矩即算术平均数;
• 二阶原点矩即平方平均数。 Nhomakorabea K 阶中心矩矩(当a =均值 时)是以均值为中心计 算的离差 K 次方的平均数
• k=1时,称为一阶中心矩,它恒等于0,即 m1=0; • k=2时,称为二阶中心矩,也就是方差,即m2=σ2。
0
极右偏态
+3
(二)由三个四分位数之间的关系求 偏态系数
Sk
Q3
Q1 2M e Q3 Q1
值域:-1 Sk 1
极左偏态
-1
对称分布
0
极右偏态
+1
偏度系数
(三)利用 3 阶中心矩来计算偏度系数。
• 测定偏度最常用的方法 • 原理:若分布不对称,则 3 阶中心矩不为0。
不对此程度愈严重, 3 阶中心矩的绝对值愈大。 为消除量纲的影响,可除以σ3。
z 4.63 167 168 168 168 18768 168 168 168 169 7.6627 170 170 170 170 170 171 171 172 172
172 174 185 190 190 200
异常值
练习:
前NBA 巨星Michael Jordan 身高78英寸, 而WNBA运动员 R.lobo身高76英寸。很明 显,Jordan高出2英寸,但谁相对来说更高 一些?Jordan在男性中的身高是否超过了 lobo在女性中的身高?(男性身高的平均数 为69.0英寸,标准差为2.8英寸;女性身高 平均数为63.6英寸,标准差为2.5英寸。)
男性笨还是女性笨?
在平均智力水平方面,男女并无明显差别。 但在被测为最聪明的2%人群和最傻的2%人 群中,男子人数均为女子的两倍。
参与这项研究的英国爱丁堡大学教授蒂莫 西·贝茨说:“男性更容易处在顶点和底部。”
《泰晤士报》提到一種理论,男子为在女性 面前更具魅力,会儘量提陞自己的智力。
10
方差及标准差的作用
99.73% 95.45% 68.27%
3 2 2 3
方差及标准差的作用某学《统生计学期》第末二考章 统试计时数据,数STAT 学成绩一为个85数分据,集据中此某计个算或的某
标准Z差几分可个数以数为用据0.来反5;常度英地量语大相成或对绩小为,一 位置和异7常0般分值称,的其Z检为分测极数端。也值是或0异.5常。值则,
显然,只了解变量的集中趋势是
不够的!
一、测定离散程度的指标及其作 用
1.说明数据的分散程度,反映变量的稳定性、 均衡性。
• 数据之间差异越大,变量的稳定性或均衡性越差。
2.衡量平均数的代表性。
• 离散程度越大,平均数的代表性就越小。
3. 统计推断的重要依据
• 判别统计推断前提条件是否成立, • 衡量推断效果好坏的重要尺度。
是非标志的均值及标准差
其值仅表现为具有某种特征 或不具有某种特征两种情况的标 志称为是非标志,也称交替标志。
性别:男、女(非男)
10
产品质量:合格、不合格
1
0
是非标志的均值及标准差
具有某种标志 总体单 的总体单位数 位总数
不具有某种标志 的总体单位数
N N1 N0
N1 f1 P
N f PQ 1
二、偏度(Skewness)
偏度——指数据分布的不对称程度或偏斜程 度。
• 以 对称分布 为标准来区分 • 偏态分布又分左偏(负偏)和右偏(正偏).
左偏分布 (负偏)
右偏分布 (正偏)
偏态的测度方法
(一)由均值与众数(中位数)之间的关系 求偏态系数:
一般有:
极左偏态
-3
Sk
x Mo
对称分布
16 160 160 160 160 160 160 160 160 161
14 12
极161
161