当前位置：文档之家› 少量数据的统计处理

少量数据的统计处理

少量数据的统计处理 Revised by Jack on December 14,2020
少量数据的统计处理
t 分布曲线
正态分布是无限次测量数据的分布规律。

当测量数据不多时，其分布服从t 分布规律。

对于有限次测量，用s 代替，用t 代替u ，t 的定义是：
t 分布图如右。

由图可知，t 分布曲线与正态分布曲线相似，纵坐标仍为概率密度，但横
坐标为统计量t 。

t 分布曲线随自由度改变f 而改变，当f 趋近∞时，t 分布趋近正态分布。

置信度（P ）表示测定值在x tS μ±范围内的概率，当f ，t 即为u 。

显着性水平（）=1-P ：表示测定值在x tS μ±范围之外的概率。

t 值与置信度及自由度有关，一般表示为,f t α。

例如：,10 表示置信度为 95%，自由度为 10 时的 t 值。

平均值的置信区间
实际工作中，往往是由样本平均值来估计总体平均值可能存在的区间，根据t 分布可知，
x t
n μ=±
此式表示在一定的置信度下，以平均值x 为中心，包括总体平均值的范围。

此范围称为平均值的置信区间。

选定置信度P ，根据P （或）与f 即可查出t ，f 值，从样本的平均值和标准偏差，即可求出相应的置信区间。

例2：分析某尾矿中铁含量得如下结果：x =%，s=%，n=4，求（1）置信度为95%时平均值的置信区间；（2）置信度为99%时平均值的置信区间。

解：置信度为95%，查表得，3=，那么
15.78 3.1815.780.05%
4
x t
n
μ=±=±⨯
=±
置信度为99%，查表得，3=，那么15.78 5.8415.780.09%
4
x t
n
μ=±=±⨯
=±
对此例可知，置信度越高，置信区间越大。

例3：下列有关置信区间的定义中，正确的是：
a.以真值为中心的某一区间包括测定结果的平均值的几率；
b.在一定置信度时，以测量值的平均值为中心的包括总体平均值的范围；
c.真值落在某一可靠区间的几率；
d.在一定置信度时，以真值为中心的可靠范围。

解：答案为b 。

因为真值是客观存在的，是用有限次的测量的平均值来估计它所在的范围，不能说它落在某一区间的概率为多少，
显着性检验
判断两组分析结果是否存在系统误差，换句话来说，是否存在显着性差异，可用t 检验和F 检验法。

检验
（1）平均值与标准值的比较：为了检验分析方法或者分析人员的分析数据是否存在系统误差，可对标准试样进行若干次分析，然后用t 检验法判断是否存在显着性差异。

具体的做法是：首先按下式计算t 值，
t 然后查出统计值t ，f ；若
t > t 表，则有显着差异，否则无。

（2）两组平均值的比较：为了检验两组数据间是否存在显着性差异，也可使用t 检验法。

设两组数据的平均值分别为12x x 与，标准偏差分别为s 1与s 2，先用F 检验法检验两组数据的度是否有显着性差异，若无差异，则按下式计算。

然后在一定置信度时，查表得到t 表，t 表中的自由度f =n 1+n 2-2，若t > t 表，则两组数据的平均值有显着差异，否则无。

2．F 检验
F 检验是通过比较两组数据的方差s 2，以确定它们的精密度是否存在显着性差异的方法。

统计量F 的定义为两组数据的方差的比值，大方差为分子，小方
差为分母，即22
s F s =
大小。

若F 计算>F 表，有显着差异，否则无。

例4.用两种不同的方法测得合金中铝的含量，其结果如下:方法1：
11142.340.105x s n ===，，;方法2：22242.440.124x s n ===，，，试判断两种方法是否
存在显着性差异。

解：先用F 检验s 1与s 2有无显着差异：
()()
2
222
0.12 1.44
0.10s F s =
==大计算小
查表得F 表=，因F 计算< F 表，因此 s 1与s 2无显着差异。

再用t 检验法检验两种方法的平均值12x x 与是否存在显着性差异：查表，当f =5+4-2=7，P=95%，得：t 表=，则 t < t 表，因此，无显着差异。

异常值的取舍
一组分析测量数据中的异常值的取舍，可按统计学方法进行处理。

1.d 4法
依据：随机误差超过3的测量值出现的概率小于%，故这些测量值通常可以舍去。

又因为＝，34，即偏差超过4的个别测定值可以舍去。

对于少量实验数据，用s 代替σ。

用d 代替，所以可以粗略地认为，偏差大于d 4的个别测量值可以舍去。

方法特点：简便，不需查表，但不够准确，当此法与其他检验方法结论有悖时，应以其他方法为准。

步骤：（1）剔除异常可疑值后，计算其余数据的平均值x 与平均偏差d ；（2）考察异常可疑值与x 的差是否大于d 4，若d
x x 4>-，则测定值x 应该
舍去，否则保留。

2.格鲁布斯（Grubbs ）法
步骤：（1）将数据由小到大排列， x 1，x 2……x n-1,x n 。

求出平均值x 与标准偏差s ；（2）按下式计算统计量T ，
s x x T 1-=
(x 1为可疑值)或s x
x T n
-= （xn
为可疑值）；(3)将T 与表值T ,n 比较，若T >T a ,n ，则可疑值舍去，否则保留。

方法特点：可靠性高，计算略为麻烦。

3．Q 检验法
步骤：（1）数据由小到大排列。

x 1，x 2……x n-1,x n ，设x n 或x 1为可疑值；（2）
计算统计量
11Q x x x x n n n --=
-（x n 为可疑值时）或
11
2Q x x x
x n --=（x n 为可疑值时）；（3）比较Q 和Q 表的大小，若Q >Q 表，则对应的疑值舍去，否则保留。

例5. 某药物中钴的分析结果为：，，，μg/g,用d 4法和Grubbs 法判断，在显着性水准为时，数据是否应保留
解：按d 4法判断，先除去，计算平均值和平均偏差得： = 5>4，所以此数据应舍去。

按Grubbs 法，先求全组数据的平均值和标准偏差:
T <T,n ,所以不应舍去。

e商务文档