第六章-变异指标
6
8 12 14
11
14 7 6 2
15 16
90
32 476
合 计 40
第四章 综合指标
1、计算工人平均日产量:
340 = 8.5(件) xf x 40 f 乙班: x 476 = 11.9(件) 40 2、计算日产量的标准差:
甲班: x
x f f
2
xf f
3 3
标准差的简捷计算
目的: 避免离差平方和计算过程的出现 变量值平方 的平均数
X X
2
N
2
变量值平均 数的平方
2
简单标准差 加权标准差
X
2
X N
2
X f f
Xf f
2
大象 500kg
1
二班成绩的标准差系数为:
2
表性比二班大。
例:
已知甲乙两个班组工人日产资料如下:
甲 班 日产量 工人数 (件) (人) 5 6 7 10 9 12 10 8 13 4 合计 40 乙 班 日产量 工人数 (件) (人) 8 11 12 14 14 7 15 6 16 2 合计 40
要求:比较一下哪个班组工人的平均日 产量的代表性高?
P Q N1 N0 N
具有某种标志表现的 单位数所占的成数
不具有某种标志表现 的单位数所占的成数
N
N 且有 P Q 1
N
N0
N1 N 0 N 1 N N N
是非标志总体的指标
均 值
XP
Xf f
1 N1 0 N 0 N1 P N N
2 2 2
解:
250 208 950 20 1045900 X 522 .95元 2000 2000
m i 1 i
X X A D f 950 522.95 20 2000
277893 .6 138.95元 2000
全距 分位差
以平均数为比较标准来说明标志的变异情况
平均差
平均差系数
方差
标准差
标准差系数 峰度 偏度
以正态分布为标准说明分配数 列偏离情况的指标
《统计学》第六章
变异指标
第二节
一、全距
全距、分位差和平均差
指所研究的数据中,最大值与最小值之差, 又称极差。
R X max X min
最大变量值或最 最小变量值或最 高组上限或开口 低组下限或开口 组假定上限 组假定下限
即该公司职工月工资的平均差为138.95元。
平均差的特点
优点:不易受极端数值的影响,能综合
反映全部单位标志值的实际差异程度;
缺点:用绝对值的形式消除各标志值与
算术平均数离差的正负值问题,不便于 作数学处理和参与统计分析运算。 一般情况下都是通过计算另一种标志 变异指标——标准差,来反映总体内 部各单位标志值的差异状况
解题过程如下:
甲 日产 量 班 工人 数 xf 乙 班
x
5
f
x2 f
日产 工人 量 数
x
f
xf
88
98 168
x2 f
704 1372
2016 1350 512 5954
7 9
10 13
合计
30 150 10 70 490 12 108 972 8 80 800 4 52 676 40 340 3088
是非标志总体
是非标志 指总体中全部单位只具有“是” 或“否”、“有”或“无”两种 表现形式的标志,又叫交替标志
为研究是非标志总体的数量特征,令
分组 具有某一属性 不具有某一属性 合计 单位数 N1 N0
N
变量值 1 0 —
成数
指是非标志总体中具有某种表现或 不具有某种表现的单位数占全部总 体单位总数的比重
某班三名同学三门课程的成绩如下:
单位:分
课程 语文 数学 英语 总成绩 平均成绩 学生 甲 乙 丙 60 65 55 65 65 65 70 65 75 195 195 195 65 65 65
请比较三名同学学习成绩的差异。
《统计学》第六章
变异指标
第一节 离中趋势
变异指标的基本理论 指总体中各单位标志值背离 分布中心的规模或程度,用 标志变异指标来反映。
《统计学》第六章
变异指标
平均差系数
V AD A D 100﹪ X
《统计学》第六章
变异指标
第三节
一、标准差
标准差和标准差系数
计算公式:
是各个数据与其算术平均数的离差平方 的算术平均数的开平方根,用 来表示; 2 标准差的平方又叫作方差,用 来表示。
⑴ 简单标准差——适用于未分组资料
解:
250 208 950 20 1045900 X 522 .95元 2000 2000
250 522.952 208 950 522.952 20
2000 56386595 .01 167.9元 2000
即该公司职工月工资的标准差为167.9元。
《统计学》第六章
变异指标
【学习目标】通过本章的学习和习题演算,掌握 变异指标的意义和作用;标准差和标准差系数的计算 和应用。了解变异指标的分布特性;极差、平均差和 四分位差的概念、计算公式和特点;分布的偏度与峰 度。 第一节 第二节 第三节 第四节 第五节 变异指标的基本理论 全距、分位差和平均差 标准差和标准差系数 偏度和峰度 变异指标的应用
解:R X max X min 110 10 90 10
计算该公司该季度计划完成程度的全距。 120 80 40 ﹪
全距的特点
优点:计算方法简单、易懂;
缺点: ①易受极端数值的影响,不能全
面反映所有标志值差异大小及分布状况, 准确程度差; ②受个别极端值的影响过于显著, 不 符合稳健性和耐抗性的要求 往往应用于生产过程的质量控制中
A D X1 X X N X N
X
i 1
N
i
X
N
第 i 个单位 的变量值
总体单 位总数
总体算术 平均数
【例A】某售货小组5个人,某天的销售额 分别为440元、480元、520元、600元、750 元,求该售货小组销售额的平均差。
解:
440 480 520 600 750 2790 X 558 元 5 5 N Xi X 440 558 750 558 i 1 A D N 5 468 93.6元 5
即该售货小组5个人销售额的平均差为93.6元。
⑵ 加权平均差——适用于分组资料
A D X 1 X f1 X m X f m f1 f m
X
i 1
m
i
X fi
i
f
i 1
m
第 i 组的变量 值或组中值
平均差系数
V AD
第 i 组变量值 总体算术 平均数 出现的次数
2
甲班: σ = 2.22(件) 乙班: σ = 2.69(件)
3、计算变异系数:
x
2.22 100 % 26.12% 甲班: 8.5 2.69 100 % 22.61% 乙班: 11.9
∵乙班变异系数小于甲班 ∴乙班工人的平均日产量代表性高。
【例】某年级一、二两班某门课的平均成绩分 别为82分和76分,其成绩的标准差分别为15.6 分和14.8分,比较两班平均成绩代表性的大小。
解: 一班成绩的标准差系数为:
15.6 V 1 100 ﹪ 100 ﹪ 19.02 ﹪ 82 X1 14.8 V 2 100 ﹪ 100 ﹪ 19.47 ﹪ 76 X2 因为 V 1 V 2 ,所以一班平均成绩的代
5 5
X
N i 1
i
X
2
N
440 5582 750 5582
5
60080 109.62元 5
即该售货小组销售额的标准差为109.62元。 (比较:其销售额的平均差为93.6元)
⑵ 加权标准差——适用于分组资料
X
m i 1
i m
X fi
2
fi
i 1
第 i 组的变量 第 i 组变量值 总体算术 值或组中值 出现的次数 平均数
【例B】计算下表中某公司职工月工资的标准差。
X 职工人数(人)f 月工资(元) 组中值(元) 250 208 300以下 350 314 300~400 450 382 400~500 550 456 500~600 650 305 600~700 750 237 700~800 850 78 800~900 950 20 900以上 — 2000 合计
一、离中趋势的涵义
反映统计数据差异程度的综 合指标,也称为标志变动度
变异指标值越大,平均指标的代表性越小; 反之,平均指标的代表性越大
测定离中趋势的意义
用来衡量和比较平均数代表性的大小;
用来反映社会经济活动过程的均衡性和
节奏性;
用来衡量风险程度。
例如:某车间有两个生产小组,各有7名 工人,各人日产量如下:
甲组:20,40,60,70,80,100,120
乙组:67,68,69,70,71,72,73
X 甲 X乙 70件
供货计划完成百分比(%) 季度总供 货计划执 行结果 甲 厂 乙 厂 100 100
1月
32 20
2月
34 30