当前位置:
文档之家› 3第三章 集中趋势和离散趋势
3第三章 集中趋势和离散趋势
f
2
Sm1 i
fm
式中: U ——中位数所在组的上限
Sm1 ——大于中位数组的各组次数之和
中位数最大的特点是:它是序列中间1项或2项的平均数,不受极 端值的影响,所以在当一个变量数列中含有特大值与特小值的情 况下,采用中位数较为适宜。正式由于中位数的这一特点,在统 计研究中,当遇到掌握统计资料不多而且各标志值之间差异程度 较大或频数分布有偏态时,为避免计算标志值所得的算术平均数 偏大或偏小,就可利用中位数来表示现象的一般水平。
返回本章
返回总目录
4. 中位数
中位数是一种按其在数列中的特殊位置而决定的平均数。把总 体各单位标志值按大小顺序排列后,处在中点位次的标志值就 是中位数,它将全部标志值分成两个部分,一半标志值比它大, 一半标志值比它小,而且比它大的标志值个数和比它小的标志 值个数相等。
要求得中位数,首先要确定中位数的位次。
返回本章
返回总目录
用偏度系数准确地测定分布的偏斜程度和进行比较分析。
※ Pearson偏度系数,用SK 表示。
SK X MO
SK 为无量纲的系数,通常取值在-3~+3之间。绝对值越大,
说明分布的倾斜程度越大。
SK =0 SK > 0 SK < 0
对称分布 右偏分布 左偏分布
返回本章
返回总目录
过给定的范围,就说明有不正常情况产伤。但极差受到极端是的影响,测
定结果往往不能反映数据的实际离散程度。
返回本章
返回总目录
2. 四分位差
四分位差是根据四分位数计算的。首先把变量各单位标志值从 小到大排序,再将数列四等分,处于四分位点位次的标志值就 是四分位数,记作 M1,M2,M3 ,M1 为第一四分位数(也称为下 四分位数),M2 为第二四分位数,就是中位数 Me ,M3 为第三 四分位数。 四分位差的计算公式为: 四分位差 M3 M1
1. 极差
极差是指一个数列中两个极端值即最大值与最小值之间的差异。 根据极差的大小能说明标志值变动范围的大小。其计算公式为:
极差=最大标志值-最小标志值
根据组距数列求极差的计算公式为:
极差=最高组上限-最低组下限
在实际工作中,极差可以用于检查产品质量的稳定性和进行质量控制。
在正常生产的条件下,产品质量稳定,极差在一定范围内波动,若极差超
n
n 1
用于估计总体标准差 。
在小样本的情况下,
S X X 2 较 S X X 2 为总体标准差 的更优
n 1
n
良的估计量 。
返回本章
返回总目录
5. 离散系数
上述的各种标志变异度指标,都是对总体中各单位指标 值变异测定的绝对量指标。而离散系数是测定总体中各 单位标志值变异的相对量指标,以消除不同总体之间在 计量单位、平均水平方面的不录
利用平均数、中位数、众数的位置关系大致判断分布是否 对称:
f
f
f
X
Mo Me X
X Me Mo
对称分布
X
X Me Mo
X Me Mo
左偏分布
X
Mo Me X
X Me Mo
右偏分布
偏态分布情况下平均数、中位数、众数有近似的关系:
M e M o 2( X M e )
在用几何平均数法计算平均数时,如果 N 大于2, 可采用对数法计算。计算公式为:
ln
XG
1 N
ln
X1
ln
X2
ln
X3
ln
Xn
1 N
ln X
返回本章
返回总目录
需要指出的是,当把几何平均数应用于经济现象时,必须注 意经济现象本身的特点。只有当标志总量表现为各个标志值 的连乘积时,才适合采用几何平均数方法来计算平均标志值。 一般来说,计算社会经济现象在各个时期的平均发展速度时, 要采用几何平均数。例如,工农业总产值年平均发展速度、 全国人口年平均发展速度等。
4
n 1 不是整数,则用 插值法 计算四分位数。
4
相邻位次上的标志值的加 权算术平均数
返回本章
返回总目录
(2)由分组资料计算四分位数。
第 i 四分位数的计算公式为:
i
M i Li
f
4
Smi1
f mi
di
(i 1, 2, 3)
式中:
Li ——第 i 四分位数所在组的下限; fmi ——第 i 四分位数所在组的次数;
i ——众数组的组距
返回本章
返回总目录
计算众数的上限公式为:
M0
U
d1
d1 d2
i
式中: U ——众数组的上限
众数的计算只适用于单位数较多,且存在明显的集中趋势的 情况,否则,计算众数时没有意义的。
返回本章
返回总目录
离散趋势的测度
离散趋势的测度,在统计学中也称为指标变异指标,是用来描述数 列中指标值的离散趋势与离散程度的。常用的标志变异指标有极差、 平均差和标准差等。
返回本章
返回总目录
5. 众数
众数是一种位置平均数。众数是总体单位中,标志值出现次 数最多的那个数值。 为了确定众数的具体数值,可以利用 下限公式或上限公式加以计算。
计算众数的下限公式为:
M0
L d1 i d1 d2
式中: M0 ——众数
L ——众数组的下限
d1 ——众数组次数与上一组次数之差 d2 ——众数组次数与下一组次数之差
f ——总次数,即各组次数总和;
Smi1 ——小于第 i 四分位数所在组的各组次数之和;
di ——第i 四分位数所在组的组距。
返回本章
返回总目录
四分位差与极差相比较: 四分位差是对极差的一种改进。与极差相比,四分位差因不受 极值的影响,在反映数据的离散程度方面比极差准确,具有较 高的稳定性;同时,对于存在开口的组距数列,不能计算极差, 但可以计算四分位差。 四分位差和极差一样,不能充分利用数据的全部信息,也无法 反映标志值的一般变动。
※ 动差法(或称矩法)计算偏度系数,用 表示。
定义变量X关于A的K阶矩(对未分组资料): M=∑(X-A)K/n
• 当 A=0,即以原点为中心,M 称为K 阶原点矩,用MK表示。 K=1,2,3时,有: 一阶原点矩M1=∑(X-0)1/n=∑X/n 二阶原点矩M2=∑(X-0)2/n=∑X2/n 三阶原点矩M3=∑(X-0)3/n=∑X3/n
•当 A= X ,即以 X 为中心,M 称为K 阶原点矩,用mK表示。
K=1,2,3时,有: 一阶中心矩 二阶中心矩 三阶中心矩
m1 ( X X )1 / n 0 m2 ( X X )2 / n
m3 ( X X )3 / n
返回本章
返回总目录
偏度系数 的计算公式:
i1
返回本章
返回总目录
2. 调和平均数
调和平均数又称“倒数平均数”,它是根据各标志值的倒数 来计算的平均数,即各个标志值倒数的算术平均数的倒数。 调和平均数也分简单调和平均数和加权调和平均数。
简单调和平均数的计算公式为:
1
1 X1
1 X2
1 X3
1 Xn
即
XH
N
X H
1
XX f A.D. f
返回本章
返回总目录
4. 方差和标准差
未分组资料时,方差的公式为:
2
2
X X
N
标准差的公式为:
X X 2
N
分组资料时,方差的公式为:
2
2
XX f
f
标准差的公式为:
X X 2 f
f
式中: X
X N
1
N 1
1
N 1
X1 X2 X3
Xn
X
设m为权数,则加权调和平均数的计算公式为:
1
m1 m2 m3 mn
X1 X2 X3
Xn
则
XH
m1 m2 m3 mn
n
X H
m1 m2 m3 mn m1 m2 m3 mn
返回本章
返回总目录
(1)简单算术平均数
将总体的各个单位标志值简单相加,然后除以单位个数,求出
的平均标志值,叫做简单算术平均数。简单算术平均数的计算
公式为:
n
X X1 X 2 X3 X n i1 Xi
N
N
式中:
X ——算术平均数
X i ——第i个单位的标志值,i=1,2,3,…,n
mi
i1
n mi
X1 X 2 X 3
X n X i1 i
返回本章
返回总目录
3. 几何平均数
几何平均数是计算平均比率和平均速度最适用的一种方法。 几何平均数有简单几何平均数和加权几何平均数之分。 简单几何平均数是 N 个标志值连乘积的 n 次方根。
其计算公式为: X G n X1 X 2 X 3 X n N X
数主要有平均差离散系数 VA.D. 和标准差离散系数 V
其公式分别为:
V
A.D.
A.D. 100% X
V X 100%
返回本章
返回总目录
6. 偏度和峰度
(1)偏度
偏度是用来反映变量数列分布偏斜程度的
指标。
对称分布
右偏分布
变量数列的
(或称正偏分布)
单峰钟形分布
非对称分布
(或称偏态分布) 左偏分布