统计学变异指标
全距是测定标志变动度的一种粗略方法。
优点:计算简单,含义明确,对于测定对称分
布的数列具有特殊优点。
缺点:它主要取决于极端数值,带有较大的偶 然性,往往不能充分反映现象的实际离散程度。
全距的作用
1、经常应用于生产过程的质ቤተ መጻሕፍቲ ባይዱ控制;
2、用于比较不同总体数值的均衡性或 平均数的代表性;
在两个总体或两组数据平均数相等时,要比较其平 均数代表性大小,这时: 全距较大的总体,其标志变异程度也较大,平均数的 代表性较小,或社会经济活动过程的均衡性或稳定性 较差;反之,则相反。
的平均考分。 (2)试问A、B两门课程平均
xA
65 70 75 80 85
375
xB
68 70 76 80 81
375 70 70
●
xC
79 85 90 95 100
449 75 76
●
甲 乙 丙 丁 戊
合 计
考分哪个更有代表性?
(3)试问A、C 两门课程平均 考分更有代表性? 例如, 80 80 85 81
平均指标说明总体各单位变量值分布的集中趋势; 变异指标说明总体各单位变量值分布的离中趋势或分散程度。
离中趋势的概念: 指总体中各单位标志值背离分布中心(平均数)的 程度,也就是总体各单位标志值之间差异程度,用标志 变异指标反映其大小。
平均数
表 学生
序号
各课程考分(分)
(1)试计算A、B、C三门课程
2
【例2】根据未经分组的资料
xA xB
xA x A
-10
-5 0 5 10 —
表
学生 课程(分) 平均数离差 离差平方 平均数离差 离差平方 序号 2 2
( xA x A)
100
25 0 81 100 306
xB x B ( xB x B)
-7
-5 1 5 6 —
甲 乙 丙 丁 戊
单位标志值对其算术平均数的离差的平方的 算术平均数的平方根,反映的是各标志值对 其平均数的平均差异程度。标准差是描述数 据离散程度的最常用的差异量。
分类:简单标准差 加权标准差
公式:
简单平均差:σ=
加权平均差:σ=
简捷计算:标志值数值较大、平均值未知,以 A为假定平均数(一般取靠近中间的标志值或组 中值)
因为B课程标准差较小,所以B课程平均分比A课程平均分代表性大。
根据变量数列资料计算
【例】根据某车间200名工人加工零件的资料,计算工 人的生产零件标准差。 表 按零件数 分组(个) 职工人 数(人)f
40~50 50~60 60~70 70~80 80~90 合 计
20 40 80 50 10 200
2
f
380.25 90.25 0.25 110.25 420.25 —
7605 3610 20 5512.5 4202.5 20950
将表中计算结果代入公式,得到:
σ
( x x )2 f f
20950 10.23(个) 200
例、某企业工人日产量的标准差计算表(A=85,d=10)
90以下 90~100 100~110 110以上 合计
85 95 105 115 —
2 3 10 3 18
800 2500 17200 4400 24900
解:R X max X min 110 10 90 10 120 80 40 ﹪
全距的特点
缺点:用绝对值的形式消除各标志值与算术平均数离 差的正负值问题,不便于数学处理和参与统计分析运算。
( x x) 0 或 x x)f (
0
评价:平均差意义明确,计算容易,
反应灵敏。但计算时要用绝对值,不适合
代数运算,因此在进一步统计分析中应用
较少。
标准差
标准差 (standard deviation):各
乙组:67
68
69
70
71
72
73
甲、乙两组工人的平均产量都为70件。
通过观察可以看出,甲组数据的变异程度较大, 乙组数据的变异程度较小。 也可以用图示的方法观察产量的变异情况:
甲组
产量差异 程度较大
70
结论: 标志变异程度和平均数的代表性呈反比关系。
乙组
产量差异 程度较小
70
举例:反映社会经济活动过程的均衡性
375
试问A、B 两课程的平均考分更有代表性?
解:x A
x
B
x x 30 6( 分/ 人) A.DA
A A
x x 24 4.8( 分/ 人) ∵ A.DA>A.DB A.DB
B B
n
5
n
5
故,学生B 课程平均考分比A 课程平均考分更有代表性。
例、某纺织厂工人日产棉纱资料计算表 按日产 工人数 f Xf 组中值 X 量分组 (人) 50—60 55 275 5 65 2275 60—70 35 75 45 3375 70—80 15 85 1275 80—90 100 合 计 — 7200
合计
65 70 75 80 85
375
68 70 76 80 81
375
49
25 1 25 36 136
问A、B 那一门课程的平均考分更有代表性? 解: 2
( x x) σ
A
xA xB 75
n
306 61.2 7.82分 5
σB
2 (x x) 136 27.2 5.07分 5 n
同的影响,计算标志变异系数。
变异系数(V): 是总体中变异指标与其算术平均 数之比,以反映标志值差异的相对水平。
按日产量 工人数 分组(公斤) (人) f 60 以下 10 60—70 19 70—80 50 36 80—90 27 90—100 14 100—110 8 110 以上 164 合 计 组中 值X
2 2 X 85 X 85 X 85 X 85 f f 10 10 10 10 -3 90 -30 9 -2 76 -38 4 -1 50 -50 1 0 0 0 0 1 27 27 1 2 56 28 4 3 72 24 9 — 371 -39 —
四、变异指标
一、变异指标的概念
概念:综合反映总体各单位标志值的差异程度
或离散程度。变异指标越大,表明数据越分散、
不集中;变异指标越小,表明数据越集中, 变动范围越小。变异指标反映现象总体总单位变
量分布的离中趋势。
一、变异指标的概念
变异指标(标志变动度), 它是反映总体中各单位标
志值差异程度的综合指标。
55 65 75 85 95 105 115 —
σ
f
X A 2 d
f
f f
X A d 2
d
2
371 39 d 14.85(公斤) 165 164
3.标准差的作用
1、反映某总体各单位某种标志值的离散程度;
● ●
A课程考分: 65 B课程考分: 68 A组 65
● ●
x A 7 5( 分 )
xB
85
7 5( 分 )
变异大 变异小
75
● ● ●●
B组
二、标志变异指标的作用
1.它是衡量平均数代表性的尺度。
标志变异指标与平均数的代表性成反比,表明总体各单位
标志值的分散程度。即标志变异指标数值越大,平均数的代 表性越小。例
2、用于比较不同总体数值的均衡性或平均数的 代表性;
在两个总体或两组数据平均数相等时,要比较其平均 数代表性大小,这时:
标准差较大的总体,其标志变异程度也较大, 平均数的代表性较小,或社会经济活动过程的 均衡性或稳定性较差;反之,则相反。
评价:标准差是表示一组数据离散程度的最好指
标,是统计分析中最常用的差异量。
也不能拿来评价平均指标的代表性。
全距
计算: R=Xmax–Xmin
例、甲同学成绩全距R=93 – 70=22(分) 乙同学成绩全距R=98 – 51=47(分) 特点:计算方便,易于理解; 易受极端数值的影响。
对于组距数列,全距计算公式为: R≈最高组的上限值—最低组的下限值
【例2】某季度某工业公司18个工业企业产值计划完成情 况如下,计算全距。 表 计划完成程度 (﹪) 组中值 (﹪)X 企业数 (个) 计划产值 (万元) f
平均差
平均差A.D (average deviation):是总体
各单位标志对其算术平均数的离差绝对值的算术
平均数。它综合反映了总体各单位标志值的变动
程度。平均差越大,则表示标志变动度越大,反
之则表示标志变动度越小。
简单平均差:A.D=
xx
N
加权平均差A.D=
xx f f
根据未分组资料计算
均数不同,这时就不能用绝对指标(标准差)比
较它们的差异程度大小。 这时就要计算离散系数指标来比较它们之间的差别程度 大小。
变异系数
如果两个数列平均水平不同,或两个数列标志值 的计量单位不同时,要比较其数列的变动度(即比较 其数列平均数的代表性大小),怎么办?
注意:这时需消除平均水平不同或计量单位不
平均指标是说明总体各单位某一数量标志一般水平的综合指 标。但是,平均指标将总体各单位标志值的差异抽象化了,是
总体各单位标志值的代表水平,它不能反映总体各单位标志值
的差异情况。例如,
工人姓名 甲 乙 丙 丁 戊
奖金额(元) 460
数量标志
520