变异系数
第二小节 全距、分位差和平均差
三、平均差
250 208 950 20 1045900 解: X 522 .95元 2000 2000
X X A D f
i 1 i
m
f
250 522.95 208 950 522.95 20 2000
f i
概
3.方差 (σ2) 和 标准差 (σ)
念
计
算
特
点
各标志值与均 简单: 2 X i X 2 n 值离差平方的 平均。 X X 2 f 加权: 2 方差的平方根 f (取正根) 2 标准差与均值 之商,是无量 纲的系数
优点:反映全部 数据分布状况, 数字上合理。 缺点:受计量单 位和平均水平影 响,不便于比较 优点:适宜不同 数据集的比较 缺点:对数据结 构变化反应不灵 敏
第二小节 全距、分位差和平均差
二、分位差 从变量数列中,剔除了一部分极端值后 计算的类似于极差的指标。 四分位差 十六分位差 八分位差 三十二分位差 十分位差 百分位差
Q.D Q3 Q 1
上四 分位 数
下四 分位 数
了解四分位差
四分位差是上四分位数与下四分位数之差,也称为内距或四分间距。它主要用 于测度顺序数据的离散程度。当然对于数值型数据也可以计算四分位差,但它不适 合于分类数据。 假设有数组:0,10,20,30,40,50,60,70,80,90,100,110. 元素共12个, 由小到大排列。 则第一四分位为第三位和第四位的中位数,即:Q1=(20+30)/2=25; 同理,第三四分位为第九位和第十位的中位数,即:Q3=(80+90)/2=85。 四分位差Q=Q3-Q1=(85-25)=60 如果上面的数组表示12个学生的成绩,Q表示学生得分的分散情形,若Q值越 大,表示学生得分越参差不齐。 例1: 1,2,3,4,5, 6,7,8,9,10 10个数从中间切开,右边中央数8=Q3,左边中间数3=Q1 例2: 1,2,3,4,5,6 ,7,8,9,10,11 11个数从中间6切开,右边中间数9=Q3,左边中间数3=Q1 例3: 1,2,3,4,5,6, 7,8,9,10,11,12 12个数从中间(空白部份)切开,右边中间两数9,10平
4.标准 差系 数 (Vσ)
V
X
第四节 变异指标
本节小结:
(1)平均指标描述的是总体的集中趋势,而标志变 异指标描述的是总体的离散趋势。它们从两方面来 反映总体的分布特征。其作用首先是衡量平均指标 代表性大小的一种尺度,其次还可以反映社会经济 活动过程的均衡性与协调性。 (2)全距、四分位差、平均差与标准差在反映标志 变异程度方面各有优缺点。方差和标准差是应用最 广的标志变异指标。标准差与标准差系数是反映标 志差异程度的主要指标。它比前面介绍的其它指标 都科学。标准差就是标志值与其算术平均数离差的 平方的算术平均数的平方根。
R X max X min 750 440 310元
第二小节 全距、分位差和平均差
一、全距
计划完成程度 (﹪) 90以下 90~100 100~110 110以上 合计 组中值 (﹪) 85 95 105 115 — 企业数 (个) 2 3 10 3 18 计划产值 (万元) 800 2 500 17 200 4 400 24 900
第三小节 标准差和标准差系数
【例】某年级一、二两班某门课的平均成绩分别为82 分和76分,其成绩的标准差分别为15.6分和14.8分,比 较两班平均成绩代表性的大小。 解: V 1 100 15.6 100 19.02 ﹪ ﹪ ﹪ 1 82 X1 二班成绩的标准差系数为: 2 14.8 V 2 100 ﹪ 100 19.47 ﹪ ﹪ 76 X2 因为 V 1 V 2,所以一班平均成绩的代表性比二班大。
合计
—
2 000
第三小节 标准差和标准差系数
解: 250 208 950 20 1045900 522 .95元 X
2000 2000
250 522.95
2
208 950 522.95 20 2000
2
56386595 .01 167.9元 2000
第i 组变量值 出现的次数
总体算术 平均数
第三小节 标准差和标准差系数
【例B】计算下表中某公司职工月工资的标准差。
月工资(元) 300以下 300~400 400~500 500~600 600~700 700~800 800~900 900以上 组中值(元) 250 350 450 550 650 750 850 950 职工人数(人) 208 314 382 456 305 237 78 20
均9.5=Q3,左边中间两数3,4平均3.5=Q1
例4: 1,2,3,4,5,6, 7 ,8,9,10,11,12,13 13个数从中间7切开,右边中间两数10,11平均 10.5=Q3,左边中间两数3,4平均3.5=Q1
第四节 变异指标
第二小节 全距、分位差和平均差
三、平均差 是各个数据与其算术平均数的离差绝对 值的算术平均数,用 A.D 表示。
第一小节 变异指标的基本理论
一、离散趋势的涵义 指总体中各单位标志值背离 离散趋势 分布中心的规模或程度,用 标志变异指标来反映。
反映统计数据差异程度的综 合指标,也称为标志变动度
变异指标值越大,平均指标的代表性越小; 反之,平均指标的代表性越大
第一小节 变异指标的基本理论
二、变异指标的作用
衡量和比较平均数代表性的大小;
解:
X
N
440 480 520 600 750 2790 558 元 5 5
i
A D
X
i 1
X
440 558 750 558 5
N
468 93.6元 5 即该售货小组5个人销售额的平均差为93.6元。
第二小节 全距、分位差和平均差
X
N i 1
i
X
2
N
440 5582 750 5582
5
60080 109.62元 5
第三小节 标准差和标准差系数
标准差 ⑵ 加权标准差——适用于分组资料
X
m i 1
i m
X fi
2
fi
i 1
第i 组的变量 值或组中值
2778936 . 138.95元 2000
即该公司职工月工资的平均差为138.95元。
第二小节 全距、分位差和平均差 三、平均差 平均差的特点
优点:不易受极端数值的影响,能综合反映
全部单位标志值的实际差异程度;
缺点:用绝对值的形式消除各标志值与算术
平均数离差的正负值问题,不便于作数学处理 和参与统计分析运算。
1月
32 20
2月
34 30
3月
34 50
钢 厂
第一小节 变异指标的基本理论
二、变异指标的种类
以标志值之间相互比较说明变异情况
全距
分位差
以平均数为比较标准来说明标志的变异情况 平均差 平均差系数 方差 标准差 标准差系数 峰度 以正态分布为标准说明分配数列偏离情况的指标
偏度
第二小节 全距、分位差和平均差
即该公司职工月工资的标准差为167.9元。
第三小节 标准差和标准差系数
标准差的特点
不易受极端数值的影响,能综合反映全部单
位标志值的实际差异程度; 用平方的方法消除各标志值与算术平均数离 差的正负值问题,可方便地用于数学处理和统 计分析运算.
第三小节 标准差和标准差系数
标准差的简捷计算 目的: 避免离差平方和计算过程的出现 变量值平方 的平均数
概
1.极差 (R)
念
计
算
特
点
优点:容易理解, 数列中最大值 R=最大值-最小值 计算方便 与最小值之差 缺点:不能反映全 部数据分布状况 优点:反映全部 A 简单: D 数据分布状况 n 缺点:取绝对值 , X i X fi 加权: D A 数字上 不尽合理
Xi X
各标志值与 2.平均差 均值离差绝 (A.D) 对值的算术 平均
【例B】计算下表中某公司职工月工资的平均差。 月工资 (元) 300以下 300~400 400~500 500~600 600~700 700~800 800~900 900以上 合计 组中值(元) 职工人数(人)
X
250 350 450 550 650 750 850 950 —
f
208 314 382 456 305 237 78 20 2 000
是进行质量控制的基础;
是衡量风险程度的尺度。
第一小节 变异指标的基本理论
例如:某车间有两个生产小组,各有7名 工人,各人日产量如下: 甲组:20,40,60,70,80,100,120 乙组:67,68,69,70,71,72,73
X 甲 X乙 70件
第一小节 变异指标的基本理论
供货计划完成百分比(%) 季度总供 货计划执 行结果 甲 厂 乙 厂 100 100
三、平均差 ⑵ 加权平均差——适用于分组资料
X 1 X f1 X m X f m f1 f m
A D
X
i 1
m
i
X fi
i
f
i 1
m
第 i 组的变量 第 i 组变量值 总体算术 出现的次数 值或组中值 平均数
第二小节 全距、分位差和平均差 三、平均差
第四节 变异指标
第二小节 全距、分位差和平均差 三、平均差 平均差系数