当前位置:文档之家› 少量数据的统计处理

少量数据的统计处理

少量数据的统计处理 Revised by Jack on December 14,2020
少量数据的统计处理
t 分布曲线
正态分布是无限次测量数据的分布规律。

当测量数据不多时,其分布服从t 分布规律。

对于有限次测量,用s 代替,用t 代替u ,t 的定义是:
t 分布图如右。

由图可知,t 分布曲线与正态分布曲线相似,纵坐标仍为概率密度,但横
坐标为统计量t 。

t 分布曲线随自由度改变f 而改变,当f 趋近∞时,t 分布趋近正态分布。

置信度(P )表示测定值在x tS μ±范围内的概率,当f ,t 即为u 。

显着性水平()=1-P :表示测定值在x tS μ±范围之外的概率。

t 值与置信度及自由度有关,一般表示为,f t α。

例如:,10 表示置信度为 95%,自由度为 10 时的 t 值。

平均值的置信区间
实际工作中,往往是由样本平均值来估计总体平均值可能存在的区间,根据t 分布可知,
x t
n μ=±
此式表示在一定的置信度下,以平均值x 为中心,包括总体平均值的范围。

此范围称为平均值的置信区间。

选定置信度P ,根据P (或)与f 即可查出t ,f 值,从样本的平均值和标准偏差,即可求出相应的置信区间。

例2:分析某尾矿中铁含量得如下结果:x =%,s=%,n=4,求(1)置信度为95%时平均值的置信区间;(2)置信度为99%时平均值的置信区间。

解:置信度为95%,查表得,3=,那么
15.78 3.1815.780.05%
4
x t
n
μ=±=±⨯

置信度为99%,查表得,3=,那么15.78 5.8415.780.09%
4
x t
n
μ=±=±⨯

对此例可知,置信度越高,置信区间越大。

例3:下列有关置信区间的定义中,正确的是:
a.以真值为中心的某一区间包括测定结果的平均值的几率;
b.在一定置信度时,以测量值的平均值为中心的包括总体平均值的范围;
c.真值落在某一可靠区间的几率;
d.在一定置信度时,以真值为中心的可靠范围。

解:答案为b 。

因为真值是客观存在的,是用有限次的测量的平均值来估计它所在的范围,不能说它落在某一区间的概率为多少,
显着性检验
判断两组分析结果是否存在系统误差,换句话来说,是否存在显着性差异,可用t 检验和F 检验法。

检验
(1)平均值与标准值的比较:为了检验分析方法或者分析人员的分析数据是否存在系统误差,可对标准试样进行若干次分析,然后用t 检验法判断是否存在显着性差异。

具体的做法是:首先按下式计算t 值,
t 然后查出统计值t ,f ;若
t > t 表,则有显着差异,否则无。

(2)两组平均值的比较:为了检验两组数据间是否存在显着性差异,也可使用t 检验法。

设两组数据的平均值分别为12x x 与,标准偏差分别为s 1与s 2, 先用F 检验法检验两组数据的度是否有显着性差异,若无差异,则按下式计算。

然后在一定置信度时,查表得到t 表,t 表中的自由度f =n 1+n 2-2,若t > t 表,则两组数据的平均值有显着差异,否则无。

2.F 检验
F 检验是通过比较两组数据的方差s 2,以确定它们的精密度是否存在显着性差异的方法。

统计量F 的定义为两组数据的方差的比值,大方差为分子,小方
差为分母,即22
s F s =
大小。

若F 计算>F 表,有显着差异,否则无。

例4.用两种不同的方法测得合金中铝的含量,其结果如下:方法1:
11142.340.105x s n ===,,;方法2:22242.440.124x s n ===,,,试判断两种方法是否
存在显着性差异。

解:先用F 检验s 1与s 2有无显着差异:
()()
2
222
0.12 1.44
0.10s F s =
==大计算小
查表得F 表=,因F 计算< F 表,因此 s 1与s 2无显着差异。

再用t 检验法检验两种方法的平均值12x x 与是否存在显着性差异: 查表,当f =5+4-2=7,P=95%,得:t 表=,则 t < t 表,因此,无显着差异。

异常值的取舍
一组分析测量数据中的异常值的取舍,可按统计学方法进行处理。

1.d 4法
依据:随机误差超过3的测量值出现的概率小于%,故这些测量值通常可以舍去。

又因为=,34,即偏差超过4的个别测定值可以舍去。

对于少量实验数据,用s 代替σ。

用d 代替,所以可以粗略地认为,偏差大于d 4的个别测量值可以舍去。

方法特点:简便,不需查表,但不够准确,当此法与其他检验方法结论有悖时,应以其他方法为准。

步骤:(1)剔除异常可疑值后,计算其余数据的平均值x 与平均偏差d ;(2)考察异常可疑值与x 的差是否大于d 4,若d
x x 4>-,则测定值x 应该
舍去,否则保留。

2.格鲁布斯(Grubbs )法
步骤:(1)将数据由小到大排列, x 1,x 2……x n-1,x n 。

求出平均值x 与标准偏差s ;(2)按下式计算统计量T ,
s x x T 1-=
(x 1为可疑值)或s x
x T n
-= (xn
为可疑值);(3)将T 与表值T ,n 比较,若T >T a ,n ,则可疑值舍去,否则保留。

方法特点:可靠性高,计算略为麻烦。

3.Q 检验法
步骤:(1)数据由小到大排列。

x 1,x 2……x n-1,x n ,设x n 或x 1为可疑值;(2)
计算统计量
11Q x x x x n n n --=
-(x n 为可疑值时)或
11
2Q x x x
x n --=(x n 为可疑值时);(3)比较Q 和Q 表的大小,若Q >Q 表,则对应的疑值舍去,否则保留。

例5. 某药物中钴的分析结果为:,, ,μg/g,用d 4法和Grubbs 法判断,在显着性水准为时,数据是否应保留
解:按d 4法判断,先除去,计算平均值和平均偏差得: = 5>4, 所以此数据应舍去。

按Grubbs 法,先求全组数据的平均值和标准偏差:
T <T,n ,所以不应舍去。

相关主题