统计学变异指标
平均指标是说明总体各单位某一数量标志一般水平的综合指 标。但是,平均指标将总体各单位标志值的差异抽象化了,是 总体各单位标志值的代表水平,它不能反映总体各单位标志值 的差异情况。例如,
工人姓名 甲 奖金额(元) 460 数量标志
乙 丙 丁戊 520 600 700 850 平均奖金
标志值(变量值) = 626(元)
注意:这时需消除平均水平不同或计量单位不 同的影响,计算标志变异系数。
变异系数(V): 是总体中变异指标与其算术平均 数之比,以反映标志值差异的相对水平。
变异 系 变数 异(指 σ或标 DA 或 R)
算术平 ( x均 )数
离散系数指标的种类
VR
R X
100%
VADAX D10﹪ 0
标准差系数
V
X
10﹪ 0
平均指标说明总体各单位变量值分布的集中趋势; 变异指标说明总体各单位变量值分布的离中趋势或分散程度。
离中趋势的概念: 指总体中各单位标志值背离分布中心(平均数)的
程度,也就是总体各单位标志值之间差异程度,用标志 变异指标反映其大小。
平均数
表 学生 序号
甲 乙 丙 丁 戊
各课程考分(分)
xA
xB
xC
根据表: 试问A、C 课程平均考分哪个更有代表性?
学生 考分(分) 平均数离差 离差来自方 平均数离差 离差平方序号
xA xC xA xA (xA xA)2 xC xC (xC xC)2
全距
全距 R (range) : 测定标志变异程度的最
简单的指标,它是标志的最大值和最小值之差,反 映总体标志值的变动范围。 公式:全距=最大标志值-最小标志值
R=Xmax-Xmin
评价: 从计算可知,全距仅取决于两个极端 数值,不能全面反映总体各单位标志值变异的程度, 也不能拿来评价平均指标的代表性。
计划完成程度 组中值 企业数 计划产值
(﹪) 90以下
(﹪)X (个) (万元) f
85
2
800
90~100
95
3
2500
100~110
105
10
17200
110以上
115
3
4400
合计
—
18
24900
解 R : X m ax X m in 11 10 0 9 0 10 12 80 0 4﹪ 0
全距的特点
全距是测定标志变动度的一种粗略方法。 优点:计算简单,含义明确,对于测定对称分 布的数列具有特殊优点。 缺点:它主要取决于极端数值,带有较大的偶 然性,往往不能充分反映现象的实际离散程度。
全距的作用
1、经常应用于生产过程的质量控制;
2、用于比较不同总体数值的均衡性或 平均数的代表性;
在两个总体或两组数据平均数相等时,要比较其平 均数代表性大小,这时: 全距较大的总体,其标志变异程度也较大,平均数的 代表性较小,或社会经济活动过程的均衡性或稳定性 较差;反之,则相反。
xA
xB
xA xA (xA xA)2 xB xB (xB xB)2
甲 65 68
-10
100
-7
49
乙 70 70
-5
25
-5
25
丙 75 76
0
0
1
1
丁 80 80
5
81
5
25
戊 85 81
10
100
6
36
合计 375 375
—
306
—
136
75 问A、B 那一门课程的平均考分更有代表性? xA xB
解:xA xB A.DA
xA xA
n
30 6( 分 / 人 )
5
A.DBxBxB
n
24 4.8(分/人)∵ A.DA>A.DB 5
故,学生B 课程平均考分比A 课程平均考分更有代表性。
例、某纺织厂工人日产棉纱资料计算表
单位:公斤
按日产 量分组
工人数 f (人)
组中值 X
Xf
X X | X X |f
按日产量
分组(公斤)
60 以下 60—70 70—80 80—90 90—100 100—110 110 以上 合计
工人数 (人) f
10 19 50 36 27 14 8
164
组中 值X
55 65 75 85 95 105 115
—
X 85
10 -3 -2 -1 0 1 2 3
—
X 85 f 10
在实际工作中运用最为广泛的是标准差系数指标。
注意:标准差与标准差系数的不同应用条件:
在比较两个不同数列(总体)标志变异程度大小 (或说明其平均数代表性大小)时,当其平均水平相 同时,可直接计算标准差进行比较;当其平均水平不 相同(或其计量单位不同)时,需消除平均水平不同 或计量单位不同的影响,计算标准差系数进行比较。
全距
计算: R=Xmax–Xmin
例、甲同学成绩全距R=93 – 70=22(分) 乙同学成绩全距R=98 – 51=47(分)
特点:计算方便,易于理解; 易受极端数值的影响。
对于组距数列,全距计算公式为: R≈最高组的上限值—最低组的下限值
【例2】某季度某工业公司18个工业企业产值计划完成情 况如下,计算全距。 表
B课程考分: 68 70 76 80 81
A组
65
75
●
●
●
●
B组
●●
●
●●
xA 7( 5 分)
xB 7( 5分 )
85
●
变异大
变异小
二、标志变异指标的作用
1.它是衡量平均数代表性的尺度。
标志变异指标与平均数的代表性成反比,表明总体各单位 标志值的分散程度。即标志变异指标数值越大,平均数的代 表性越小。例
未分组 σ资 X 料 nA2: X nA 2
分组σ 资 料 X fA : 2f X fA f 2
组距σ 数 列 Xd A: 2f
2
Xd Af d
f f
【例2】根据未经分组的资料 表
学生 课程(分) 平均数离差 离差平方 平均数离差 离差平方
序号
3.平均差的特点
优点:不易受极端数值的影响,能较好地反映全
部单位标志值的实际差异程度;平均差弥补了全距 之不足,它考虑了所有的标志值。
缺点:用绝对值的形式消除各标志值与算术平均数离
差的正负值问题,不便于数学处理和参与统计分析运算。
( x x ) 0 或 ( x x ) f 0
评价:平均差意义明确,计算容易, 反应灵敏。但计算时要用绝对值,不适合 代数运算,因此在进一步统计分析中应用 较少。
40~50
20
50~60
40
60~70
80
-
70~80
50
80~90
10
合计
200
标准差计算表
按零件数分 组(个)
40~50 50~60 60~70 70~80 80~90
合计
职工人数 (人)f
20 40 80 50 10
200
组中 值x
45 55 65 75 85
—
将表中计算结果代入公式,得到:
数据1: 1、 2、 3、 4、 5 数据2: 10、20、 30、40、50
显然,这两组数据的差别程度相同,而它们水平不同或平 均数不同,这时就不能用绝对指标(标准差)比 较它们的差异程度大小。
这时就要计算离散系数指标来比较它们之间的差别程度 大小。
变异系数
如果两个数列平均水平不同,或两个数列标志值 的计量单位不同时,要比较其数列的变动度(即比较 其数列平均数的代表性大小),怎么办?
65 68 79 70 70 85 75 76 90 80 80 95 85 81 100
(1)试计算A、B、C三门课程 的平均考分。
(2)试问A、B两门课程平均 考分哪个更有代表性?
(3)试问A、C 两门课程平均 考分更有代表性?
合 计 375 375 449
例如,
A课程考分: 65 70 75 80 85
甲、乙两组工人的平均产量都为70件。 通过观察可以看出,甲组数据的变异程度较大, 乙组数据的变异程度较小。 也可以用图示的方法观察产量的变异情况:
甲组
产量差异 程度较大
70
结论: 标志变异程度和平均数的代表性呈反比关系。
乙组
产量差异
70
程度较小
举例:反映社会经济活动过程的均衡性
表
钢厂
供货计划完成百分比(%)
2、用于比较不同总体数值的均衡性或平均数的 代表性;
在两个总体或两组数据平均数相等时,要比较其平均 数代表性大小,这时:
标准差较大的总体,其标志变异程度也较大, 平均数的代表性较小,或社会经济活动过程的 均衡性或稳定性较差;反之,则相反。
评价:标准差是表示一组数据离散程度的最好指 标,是统计分析中最常用的差异量。 标准差具备一个良好的差异量应具备的条件,如: 反应灵敏,有公式严密确定,简明易懂,适合代数运 算等等。 标准差表示一组数据的离散程度,须注意必须是 同一类数据(即同一种测量工具的测量结果),而且 被比较样本的水平比较接近。
季度总供货计 划执行结果
一月 二月 三月
甲厂 100
32 34 34
乙厂 100
20 30 50
观察:哪个厂供货比较均衡?
三、变异指标的计算方法
(一)变异指标的种类(数值) 绝对指标(与原变量值名数相同)
全距 平均差 标准差
相对指标(表现为无名数)
全距 系数
平均差 系数
标准差 系数
分类:全距 平均差 标准差 变异系数