粗大误差
x9 10.0012 10.0007 x10 0.625 x2 10.0012 10.0004 x10 x x 10.0004 10.0003 2 1 r11 0.25 x1 10.0007 10.0003 x9 r11
' 计算出最小值和最大值的检验统计量,对 x1' 计算 rij' ,对 x n 计算 rij
,按从大到小顺序排列为 x1 , x2 ,..., xn
r10
xn 1 xn x1 xn
r10
与
r11
x1 x2 x1 xn
n 3~ 7
G1 x x1 S
xn x S
设 xn 是可疑的,则:
G n
式中: x
1 n xi , S n i 1
1 n Vi 2 n 1 i 1
⑶ 查表 5-2/p76 相应于 n 和 的 Gn, 的Байду номын сангаас; ⑷ 如 Gi Gn, ,则所怀疑的数据是异常值,应予舍弃.这样的判断出错的概 率为 ,如果 Gi Gn, ,则不应以显著性水平 舍弃. 【例 4-1】 在检定杠杆千分尺的示值极限误差时, 用五等标准量块重复测量了 20 次, 20.002, 20.000, 20.000, 20.001, 20.000, 19.998, 20.000, 20.001, 19.998, 20.002, 20.002, 20.000,20.004,20.000,20.002,19.992,19.998,20.002,19.998。其中 疑数据,判断是否该剔除? 【解】
计算 x 20.000 mm , s 2.5um ,查表 : 20) 2.88 G (0.01,
为可
v17 8 G(0.01, 20) s 2.28 2.5 7.2
故应剔除 .例 2-20/P49 4、狄克松准则 上面几种判断粗大误差的准则都需要先求出样本的标准差 S,为了避免计算 S 的 麻烦, 狄克逊根据顺序统计的原理, 利用极差比构成统计量,经严密推算和简化, 在 1953 年提出了狄克逊准则。即对 正态测量总体的一个样本 x1 , x2 ,..., xn 构造统计量
s( xi ) n
x x
n n 1
i
2
重复测量某电阻共 10 次,其数据如下 10.0003,10.0004,10.0004,10.0005,10.0005,10.0005,10.0006,10.0006,10.0007, 10.0012, 试分别用粗差准则和稳健算法处理测量结果。 (显著性水平α=0.05)
例 2-19/P48(费业泰书) 3、格拉布斯(Grubbs)准则 设 X 服从正态分布,X 的一个随机子样(即实验测定值)为:x1,x2,…xn.将子 样数据按其大小排成数据列,x1' ,x2' , . . .xn' ,如果怀疑最小或最大的数据为可疑数 据,其判断方法如下: ⑴ 选定显著性水平 (0.01,0.05,0.025), 即是否定假设的概率,亦即判定出 错的概率; ⑵ 计算 Gi 的值,设 x 1 是可疑的,则:
3、测量仪器内部的突然故障
若不能确定粗大误差是由上述两个原因产生时,其原因可认为是测量仪器内部的 突然故障。统计判断准则 一、统计方法的基本思想
给定一个显著性水平,按一定分布确定一个临界值,凡超过这个界限的误差,就 认为它不属于随机误差的范畴,而是粗大误差,该数据应予以剔除 测量数据含有随机误差和系统误差是正常现象,只要误差值不超过规定的允许 值,所得测量结果就应该接受。但是粗大误差超出了正常的误差分布范围,对测量结 果造成歪曲,含有粗大误差的测量结果称为异常值。二、粗大误差的防止与消除 对于粗大误差, 除了设法从测量结果中发现和鉴别而加以剔除外, 更重要的是要 加强测量者的工作责任心和以严格的科学态度对待测量工作;此外,还要保证测量条 件的稳定,或者避免在外界条件发生变化时进行测量。如能达到以上要求,一般情况 下是可以防止粗大误差的产生的。 在某些情况下,为了及时发现与防止测量值中含有粗大误差,可以采用不等精度 测量和互相之间进行校核的方法。 三、粗大误差的判别准则 1、莱以特准则( 3 准则) 对某个可疑数据 x d ,若
第一节
一、粗大误差对测量数据的影响
粗大误差问题概述
可疑数据 :在一列重复测量数据中,有个别数据 与其他数据有明显差异,他可能
是含有粗大误差(简称粗差)的数据。 异常值:确定混有粗大误差的数据 ⑴不恰当地剔除含大误差的正常数据,会造成测量重复性偏好的假象。 ⑵未加剔除,必然会造成测量重复性偏低的后果。粗大误差的数值比较大,它会 对测量结果产生的明显的歪曲,一旦发现含有粗大误差的测量值,应将其从测量结果 中剔除。 二 粗大误差产生的原因
s ( x0.1 )
i2
9
2 i
10 10 2 (0.1 10)
0.00003
n [ n ]
3.求 截尾均值。 x0.1 有可疑 无可疑 常取
0
n 2[ n]
[ n ]1
xi
0.1
不截尾,即常规的算术平均值
n [ n ] [ n ]1
4.标准差估计 有可疑
s ( x )
2 i
n(n 2[ n])
,无可疑
s( x )
1 x xn r11 n x2 xn xn 2 xn x2 xn
与 与
r21
x1 x2 1 x1 xn
n 8 ~ 10
r21
x1 x3 1 x1 xn
n 11~ 13
判断准则: 若:
少,因此 3 只是一个近似的准则) 例 2-18/P46(费业泰书) 2、罗曼诺夫斯基准则(t 检验准则) 特点——首先剔除一个可疑的测量值,然后按 t 分布检验被剔除的测量值是否含 有粗大误差。 设:对某量作多次等精度测量得: x1 , x 2 ,, x n ,若认为测量值 x j 为可疑的数据, 将其剔除后计算平均值为(计算时不包括 x j ) ①x
, r11 D(0.05,10) r11 r11 故数据中无异常值。
计算结果: 测量电阻的极限误差:
t0.05 9 10
s 0.14 0.2
故该电阻的测量结果为 : 101.3 0.2
总结:
(1)大样本情形(n>50) ,用 3σ 准则最简单方便;30<n<50 情形,用 Grubbs 准则 效果较好; 情形,用 Grubbs 准则适用于剔除单个异常值,用 Dixon 准则适 用于剔除多个异常值。 (2)在实际应用中,较为精密的场合可选用二三种准则同时判断,若一致认为应当剔 除时,则可以比较放心地剔除;当几种方法的判定结果有矛盾时,则应当慎重考虑, 通常选择,且在可剔与不可剔时,一般以不剔除为妥。 第三节 测量数据的稳健处理
d xd x 3s
xd
含有粗差,可剔除;否则予以保留
S--贝塞尔公式计算的标准差, 样本数 n 50 时适用.在 n≤10 的情形, 用 3σ准则剔除粗差注定失效
xd x
(x x )
i
2
n 1s
取 n≤10,
xd x 3s
恒成立前提—测量次数充分大(通常测量次数皆较
1、客观外界条件的原因:
机械冲击、外界震动、电网供电电压突变、电磁干扰等测量条件意外地改变 ,引 起仪器示值或被测对象位置的改变而产生粗大误差。 2、测量人员的主观原因 测量者工作责任性不强,工作过于疲劳,对仪器熟悉与掌握程度不够等原因,引 起操作不当,或在测量过程中不小心、不耐心、不仔细等,从而造成错误的读数或错 误的记录。
稳健处理的步骤:
一组测量数据 稳健处理的步骤如下: 1.计算数据的标准差 S 2.判别可疑数据
, x2 ,..., xn ,按从大到小顺序排列为 x1 x1 , x2 ,..., xn
i10, xi x n k0 k 0.6, k 3 0 k s n 10, k0 0.7, k n 1
x9 101.7 101.5 计算统计量: r x10 0.333 11 x2 101.7 101.1 x10 x x 101.1 101.0 2 1 r11 0.2 x1 101.5 101.0 x9
查表: D(0.05,10) 0.530
【解】: 计算统计量
查表:
D(0.05,10) 0.530
, r11 D(0.05,10) r11 r11
故根据狄克逊准则数据中 x10 10.0012 为异常值。
格拉布斯准则计算结果:
计算:
x 10.00057
G(0.05,10) 2.18
s 0.00025
v10 0.00063 G (0.05,10) s 2.18 0.00025 0.00055
rij rij , rij D( , n)
为异常值。
‘ 则判断 x n
否则,判断没有异常值。
若:
rij rij , rij D( , n)
’ 则判断 x1 为异常值。
【例 4-2】
重复测量某电阻共10次,101.0,101.1,101.2,101.2,101.3,101.3,101.3,101.4, 101.5,101.7。数据已按大小顺序排列,用狄克逊准则判断其中是否有粗差,并写出 测量结果。
1 n xj n 1 i 1
i j
②求测量列的标准偏差(计算时不包括 U j x j x )
v
i 1
n
2 i
n2
③根据测量次数 n 和选取的显著度 ,即可由表 2-12 查得 t 分布的检验系数