统计学的分布特征
2.作用: (1)衡量平均指标的代表性。
年份 1 2 3 A销售额 A销售额 1100 1300 1200 B销售额 B销售额 200 3000 400 C销售额 C销售额 1600 1200 800
A情况销售额比较稳定,更代表性最大。
(2)反映现象变动的均衡性
企 业 计 划 数 实 际 数 第一季度 绝 对 数 140 300 比 重 % 14.0 25.0 第二季度 绝 对 数 100 280 比 重 % 10.0 23.3 第三季度 绝 对 数 460 310 比 重 % 46.0 25.8 第四季度 绝 对 数 300 310 比 重 % 30.0 25.8
∑
(分组)
fi
i=1
k= 1时,即1阶的原点动差就是算术平均数。 k= 2时,即2阶的原点动差就是平方平均数。
3、中心动差:
变量x关于分布中心(平均数)的k阶距。一般 形式:
νk =
( xi − x )k ∑
i =1 n
n
n
( 为分组 )
νk =
∑
i =1
( xi − x ) k f i
n
( 分组 ) fi
三、平均差(A.D)
1、定义:平均绝对偏差,总体所有单位的标志值与其 平均数的离差绝对值的算术平均数。 2、计算公式:
n
A.D =
∑x
i =1
i
−x , A.D =
n
∑x
i =1
i
− x fi
i
n
n
∑f
i =1
3、特点:概括地反映了所有单位标志值的变异程度, 但因取绝对值,数学性质不理想,实际中较少用。
第三章
统计分布 的数值特征
第二节 分布的离散趋势
数据的变 异程度
产品质量检查的结果 测量的结果 说明生产 是否稳定 学 生 的 成 绩 成绩是 否集中 而不是高低) (而不是高低)
说明测量方法或 仪器是精密还是粗糙
第二节 分布的离散趋势
一、变异指标的含义与作用 1.定义:变异指标反映总体内部的离散趋 势或变异状况。 变异指标值越大,表明总体各单位标志的 变异程度越大。 常用描述变异的指标有:极差、四分位差、 平均差、方差、标准差等。
极差为0 极差为20 极差为257
所以:甲组的平均数的代表性要比乙组和丙组的平均数的代 表性大;甲组内部的稳定性要比乙组和丙组内部的稳定性要 好。
2、四分位差 1)计算公式:数列的3/4位次与1/4位次的 标志值之差除以2。 2)特点:四分位差避免了数列中极端值的 影响,但去头弃尾,丢失大量的原始数据。 。 例:课本P73 例3-15 课本
ν4 =
∑ (x − x)
i =1 i
n
4
(未分组)
ν4 =
∑ (x − x)
i =1 i n
n
4
fi
(分组)
n
∑f
i =1
i
二、偏度
1、偏度:衡量频数分配不对称程度,或偏 斜程度的指标。 2、计算公式:(用距法测定)
ν3 ν3 α= 3= 3 σ (ν 2 ) 2
当 α =0时,左右完全对称,为正态分布; 当 α >0时为正偏斜;当 α <0时为负偏斜。
n
σ2 =
∑ (x
i =1
i
− x ) fi
i
n
∑f
i =1
(是非标志的平均数为p)
(1 − p ) 2 N 1 + ( 0 − p ) 2 N 0 = N = q 2 p + p 2q
= pq = p (1 − p )
σ =
p (1 − p )
四、变异系数
1、变异系数:变异系数也称离散系数,是 各变异指标与其算术平均数的比值。 极差系数:极差与其平均数的比值。 标准差系数:标准差与其平均数的比值。
甲 乙
1000 1000 1200 1200
甲、乙企业均完成了销售计划,但甲企业前松后紧,变动程度大,乙企 业变动程度较小,说明乙企业销售情况比甲企业好。
(3)研究总体标志值分布偏离正态的情况。 (4 )进行抽样推断等统计分析的一个基 本指标。
二、极差与四分位差
1、极差: 1)极差也称全距,它是统计总体中两个极端标志 值之差,表明总体中标志值变动的范围。 2)计算公式: R = x max − x min (未分组) R = U max − L min (分 组) 式中:Umax代表最高组的上限;
n
意常数)时,
∑ (x
i =1
i
− x)
2
≤
∑
i =1
( xi − x0 )2
。
n 3) n 个同性质独立变量和的方差等于各个变量方差的和。 设:
n
则:
x = x1 + x 2 + L + x+σ
2 x2
+σ
2 x3
+L +σ
2 xn
4)n个同性质独立变量平均数的方差等于各 变量方差平均数的1/n。
∑
i =1
当k=0时,即零阶中心动差 当k=1时,即一阶中心动差 当k=2时,即二阶中心动差
ν1 = 0 ν2 =σ 2
ν
0
= 1
当K=3时,即三阶中心动差
ν3 =
∑ ( xi − x )
i =1
n
3
(未分组)
ν3 =
∑ (x − x)
i =1 i n
n
3
fi
(分组)
i
n
∑f
i =1
当K=4时,即四阶中心动差
在资料分组的条件下,总体各标志值对平均数的 方差可以分解为组内方差和组间方差。其关系 式:
σ = δ +σ
2 2
2 i
式中:
σ δ
2
σ i2
2
代表总体方差; 代表组内方差的平均数; 代表组间方差。
3、经验相关比指数
利用总方差与组间方差的关系,可以分析总体变 异中,有多少是由于分组变量的变化引起的变 异(用 δ 2 表示);有多少是其他因素引起的变异 (用 σ i2 表示)。
Lmin代表最低组的下限。
3)特点:
1. 2. 3. 4. 一组数据的最大值与最小值之差 离散程度的最简单测度值 易受极端值影响 未考虑数据的分布 7 8 9 10 7 8 9 10
求:各组的极差 甲组: 80 80 乙组: 70 75 丙组: 2 18
80 80 25
80 85 96
80 90 259
设: 则:
x1 + x 2 + x3 + L + x n x= n
σ =
2 x 2 2 σ 12 + σ 2 + σ 32 + L + σ n
n2
1 2 = σi n
5)变量线性变换的方差等于变量的方差乘以变量 系数的平方。 设: y = a + bx 则:
2 σ y = b 2σ x2
(二)是非标志的方差与标准差
fi
σ =
∑
i =1
( xi − x ) 2 f i
n
∑
i =1
fi
例:
按成绩分 组
60以下 60~70 70~80 80~90 90~100
学生数
fi
组中值 xi
55 65 75 85 95
( xi − x ) 2 ( xi − x ) 2 fi
400 100 0 100 400 2800 2100 0 1900 3200
四、方差与标准差 (一)数量标志的方差与标准差
1、数量标志方差与标准差的计算。其计算公式 为: 未分组的资料:方差: 标准差 :
n
σ2 =
( xi − x ) 2 ∑
i =1
n
n
σ =
∑
i =1
( xi − x ) 2 n
n
方差:
σ
标准差:
2
=
∑
i =1
( xi − x ) 2 fi
n
∑
n
i =1
Ⅰ(α=0)
II(α>0)
Ⅲ(α< 0)
三、峰度
1、峰度:用以衡量频数分配的集中程度,即分 布曲线的尖峭程度的指标。 2、计算公式:(用距法测定)
ν4 ν4 β = 4 −3= −3 2 σ (ν 2 )
峰度指标β=0,分布为正态峰度,当峰度指标 β>0时,表示频数分布比正态分布更集中,分 布呈尖峰状态,β<0时表示频数分布比正态分 布更分散,分布呈平坦峰。如图所示:
Ⅱ(β>0)
Ⅰ(β=0)
Ⅲ (β<0)
η =
δ2 σ2
经验相关比指数的取值范围在0~1之间。
4、方差与标准差的数学性质:
1)变量的方差等于变量平方的平均数减去 变量平均数的平方。即:
σ = x − (x )
2 2
2
2)变量对其算术平均数的方差小于对 任意常数的方差。
n
因为
∑ (x
i =1
i
− x ) 2 = min ,所以,当
n
x ≠ x0 (x0为任
x 2、作用: 消除现象由于不同计量单位、不同平均 水平所产生的影响。 V =
σ
× 100 %
第三节 分布的偏度和峰度
一、统计动差 1、统计动差:也称为距,反映分布偏斜或离散程度 的指标。 2、原点动差:变量x关于原点的k阶距,一般形式:
n
n
µ k=
∑
x n
k
i=1
(未分组)
µk
∑
=