当前位置:文档之家› 关于标准差计算的参考资料

关于标准差计算的参考资料

关于标准差(Standard deviation)计算的参考资料
标准差是用来反映各个数据值与数据均值的偏离程度的。

在脆弱性分析中,标准差可以用来评价同一指标的各数据与这一指标据平均值的偏离程度,即数据是否集中。

标准差的值越大,就说明各个数据偏离均值的程度越大,那么均值对所有数据的代表程度越小。

反之,标准差的值越小,就说明各个数据偏离均值的程度越小,那么均值对所有数据的代表程度越大。

例如:在一个县中,各个乡的农户人均纯收入偏离该县农户人均纯收入的程度,就可以用标准差来衡量。

标准差的计算
假设标准差为S 。

对于未分组的原始数据,其标准差的计算公式为:
n )
X X (S 2
n 1i i ∑-==(n>=30)
1
n )X X (S 2i -∑-=(n<30) 为数据个数。

为所有数据的平均值;
个数据值;为数据中的第为标准差;
其中:n X i X S i 对于分组数据,其标准差的计算公式为:
∑∑-==k 1
i i i
2
k 1i i F F )X X (S =(∑=k
1i i F >=30) 1F F )X X (S k 1
i i i
2
k 1i i -=∑∑-==(∑=k
1i i F <30)
为总频数。

为数据分组的组数;
为所有数据的均值;
个分组数据的组中值;
为第为标准差;
其中:∑=k 1i i i F K X i X S
变异系数(Coefficient of Variation )
变异系数,又被称为离散系数,也被称为标准差系数,是一组数据的标准差与其相应的均值的比值。

在脆弱性分析中,变异系数是非常重要的分析指标,如人均粮食产量的年际变异系数等,可以作为辅助指标反映某一地区粮食占有量的波动情况和受到自然灾害等冲击后的恢复能力。

变异系数的计算公式为:
X S
V S =
变异系数大的,说明数据的离散程度大;变异系数小的,说明数据的离散程度小。

对于时间序列数据,变异系数大,说明年际间波动大,反之则较稳定,波动小。

标准化值(Standard score )
在统计分析中,经常涉及到必须对具有不同量纲的指标数据进行处理,例如,有的数据是以公斤作为量纲的,有的数据是以亩或公顷作为量纲的,等等。

为了能够对这些不同量纲的数据进行统计分析,必须进行统计标准化处理。

利用前面介绍的均值和标准差,我们可以计算一组数据中的各个数值的标准化值。

常用的统计标准化公式为Z 评分方法。

其计算公式为:
S
X X Z i i -= 为标准差。

为均值;
个数据值;
为数据中的第S X i X i
上面的两个统计标准化公式,经过变形可以转变为:
S Z X X i i ∙+=
经过变形的公式,可以显示出一组数据中各个数值的相对位置。

例如,一组数据中的某个数值的统计标准化值为1.3,我们就可以知道该数据高于均值1.3倍的标准差。

对于正态分布的一组数据,大约有68%的数据在均值加减一个标准差的范围之内,有95%的数据在均值加减2个标准差的范围之内,有99%的数据在均值加减3个标准差的范围之内。

而高于或低于均值3个标准差的数据是很少的,如果有,这样的数据被称为离群点。

相关主题