当前位置：文档之家› 第三讲平均数、标准差和变异系数

第三讲平均数、标准差和变异系数

)
1 n
1 x
（4.6）
对于同一资料：算术平均数>几何平均数>调和平均数
上述五种平均数，最常用的是算术平均数。
二、算术平均数的计算方法
算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。
(一)直接法主要用于未经分组资料平均数的计算。
设某一资料包含n个观测值： x1、x2、…、xn，
(x x)2
S n 1
由于 (x x)2 (x2 2xx x2)
x2 2x x nx2
x2 2 (
x)2 n(
x)2
n
n
x2
( x)2
n
所以（ 4.9 ）式可改写为：
S
x2
( x)2
n
n 1
（4.10）
相应的总体参数叫总体标准差，记为σ。对于有限总体而言，σ的计算公式为：
14
平均数 = 6
2、中位数
中位数: 将资料内所有观察值从大到小排序，居中间位置的观察值称为中数(median)，计作Md。当观测值的个数是偶数时，则以中间两个观测值的平均数作为中位数。当所获得的数据资料呈偏态分布时，中位数的代表性优于算术平均数。
中位数的计算方法因资料是否分组而有所不同。对于未分组资料，先将各观测值由小到大依次排列，找到中间的1个数（n为奇数）或2个数（ n为偶数），之后求平均即可。
CV S 100% x
变异系数是无量纲的量，可以用于不同单位、不同尺度下各样本变异程度的比较。
【例7】已知某甲品种猪平均体重为 190kg，标准差为10.5kg，而乙品种猪平均体重为196kg，标准差为8.5kg，试问两个品种的猪，那一个体重变异程度大。
由于，甲品种猪体重的变异系数：
(x )2 / N （4.11）
在统计学中，常用样本标准差S估计总体标准差σ。
四、变异系数
标准差和观察值的单位相同，表示一个样本的变异度。若比较两个样本的变异度，则因单位不同或均数不同，不能用标准差进行直接比较。这时可计算样本的标准差对均数的百分数，称为变异系数 (coefficient of variation)。
我们还可以采用将离均差平方的办法来解决离均差有正、有负，且离均差之和为零的问题。
先将各个离均差平方，即 ( x x )2 ，再求
离均差平方和，即 (x x)2 ，简称平方和，记
为SS；由于离差平方和常随样本大小而改变，为了消除样本大小的影响，用平
1. 指出数据资料的中心位置，标志着资料所代表性状的数量水平和质量水平。
2. 可以作为样本或资料的代表数据与其他资料进行比较。
五、总体平均数
对于总体而言，通常用μ表示总体平均数，有限总体的平均
数为：
N
xi N i 1
（4.3）
式中，N 表示总体所包含的个体数。当一个统计量的数学期望等于所估计的总体参数时，则称此统计量为该总体参数的无偏估计量。
n
(xi x) 0
i1
或简写成
(x x) 0
4、样本各观测值与平均数之差的平方和为最小，即离均差平方和为最小。
（常数
）
或简写为：
5、若A为任意常数，
6、平均数是有单位的数值，与原资料单位相同。
x 注意：必须性状同质时，才有代表性。
山地丘陵平地
Σ
x
S AY S·AY
100 100 10000
则样本平均数可通过下式计算：
n
x
x1 x2
xn
xi
i 1
n
n
（4.1）
简写：
x x
n
【例1】某植保站测得10只某类害虫的体重分别为500、 520、535、560、585、600、480、510、505、490 （mg），求其平均数。
由于 Σx = 500 + 520 + 535 + 560 + 585 + 600 + 480 + 510 + 505 + 490 = 5285，
统计学中常用样本平均数（ x ）作为总体平均数（μ）的估
计量，并已证明样本平均数是总体平均数μ的无偏估计量。
第二节变异数
平均数作为样本的代表，其代表性的强弱受样本资料中各观测值变异程度的影响。每个样本有一批观察值，除以平均数作为样本的集中性表现外，还应该考虑样本内各个观察值的变异情况，才能通过样本的观察数据更好地描述样本，乃至描述样本所代表的总体，为此必须有度量变异的统计数。常用的描述变异程度指标有： 1、极差（range） 2、方差（variance） 3、标准差（standard deviation） 4、变异系数（variation coefficient）
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
众数 = 9
没有众数
4、几何平均数
几何平均数: 如有n个观察值，其相乘积开n次方，即为几何平均数(geometric mean)，用G代表。其计算公式如下：
1
G n x1 x2 x3 xn (x1 x2 x3 xn )n
i 1 k
fi xi fi
fx f
（4.2）
i 1

式中： xi -第i 组的组中值； fi -第i组的次数；k -分组数
第i组的次数 fi 是权衡第i组组中值 xi 在资料中所占比重大小的数量，因此将 fi 称为是 xi 的“权”，加权法也由此而得名。
【例2】从A、B两小区分别抽取4个和5个小麦麦穗，测得其样本如下，用两种方法计算其平均值，并比较计算结果。
为了解决离均差有正、有负，离均差之和为零的问题，可先求离均差的绝对值并将各离均差绝对值之和除以观测值个数n 求得平均绝对离差，即Σ|x – x |/n。虽然平均绝对离差可以表示资料中各观测值的变异程度，但由于平均绝对离差包含绝对值符号，使用很不方便，在统计学中未被采用。
500 400 200000
400 500 200000
1000
410000
410000/1000=410
S AY S·AY
900 160 144000
600 500 300000
500 600 300000
2000
744000
744000/2000=372
四、算术平均数的作用
算术平均数是描述观测资料的重要特征数，它的作用主要有以下两点：
一、极差
极差(range)，又称全距，记作R，是资料中最大观察值与最小观察值的差数。
极差虽可以对资料的变异有所说明，但它只是两个极端数据决定的，没有充分利用资料的全部信息，而且易于受到资料中不正常的极端值的影响。所以用它来代表整个样本的变异度是有缺陷的。
二、方差
为了正确反映资料的变异度，较合理的方法是根据样本全部观察值来度量资料的变异度。这时要选定一个数值作为共同比较的标准。平均数既作为样本的代表值，则以平均数作为比较的标准较为合理，但同时应该考虑各样本观察值偏离平均数的情况，为此这里给出一个各观察值偏离平均数的度量方法。
一、平均数的意义和种类
平均数(average)是数据的代表值，表示资料中观察值的中心位置，并且可作为资料的代表而与另一组资料相比较，借以明确二者之间相差的情况。
平均数是统计学中最常用的统计量，用来表明资料中各观测值相对集中较多的中心位置。平均数主要包括有： 1. 算术平均数（arithmetic mean） 2. 中位数（median） 3. 众数（mode） 4. 几何平均数（geometric mean） 5. 调和平均数（harmonic mean）
0 1 2 3 4 5 6 7 8 9 10
中位数= 5
0 1 2 3 4 5 6 7 8 9 10 12 14
中位数= 5
3、众数
众数: 资料中最常见的一数，或次数最多一组的中点值，称
为众数(mode)，记为M0。如棉花纤维检验时所用的主体长度即为众数。
众数可能不存在可能有多个众数多用于属性数据
为了计算方便，可将各观测值取对数后相加
除以n，得lgG，再求lgG的反对数，即得G值，
即：
G
lg
1[
1 n
(lg
x1
lg
x2
lg xn )]
5、调和平均数
调和平均数:（harmonic mean）各观测值倒数的算术平均数的倒数，称为调和平均数，记为H。即
H
1
1
1
n
(
1 x1
1 x2
1 xn
为了准确地表示样本内各个观测值的变异程度，人们首先会考虑到以平均数为标准，求出各个观测
值与平均数的离差，( x)，x称为离均差。
虽然离均差能表示一个观测值偏离平均数的性质和程度，但因为离均差有正、有负，离均差之和为
零，即Σ( x x) = 0 ，因而不能用离均差之和Σ ( x x)来表示资料中所有观测值的总偏离程度。
1、算术平均数
算术平均数: 一个数量资料中各个观察值的总和除以观察值个数所得的商数，称为算术平均数 (arithmetic mean)，记作。因其应用广泛，常简称平均数或均数(mean)。均数的大小决定于样本的各观察值。
0 1 2 3 4 5 6 7 8 9 10
平均数 = 5
1234567
C V 10.5 100% 5.53% 190
乙品种猪体重的变异系数：
C V 8.5 100% 4.34% 196

e商务文档

第三讲平均数、标准差和变异系数

相关文档推荐：

e商务文档

第三讲 平均数、标准差和变异系数

相关文档推荐：

第三讲平均数、标准差和变异系数