当前位置:文档之家› 2误差及数据处理

2误差及数据处理


不同人员对同一试样分析结果不同。 检验方法:1、4d 检验法
2、Q 检验法 3、T 检验法
2.2.3 离群值的检验-Q检验法
计算公式
Q计算
x离群 x邻近 xmax xmin
Q计 Q表 ,应该舍去离群值,否则应该保留。
请判断下列表达式是否正确:
(1)
x2 x1 Q xn x1
2.92 2.35 2.13 2.02
12.71
4.30 3.18 2.78 2.57
63.66
9.93 5.84 4.60 4.03
7
8 9
0.72
0.71 0.71 0.69 0.67
1.94
1.90 1.86 1.73 1.64
2.45
2.37 2.31 2.09 1.96
3.71
3.50 3.36 2.85 2.58
误差(error): 测定值xi与真值µ 之差。 绝对误差--E(absolute
error):
E = xi -
Er E
相对误差--Er (relative error):

100%
(Er表示误差占真值的百分率)
2
准确度(accuracy): 指测定平均值与真值的接近程度。
用相对误差的大小来表示。误差越小,准确度越高。
(47.60 0.13)%
(47.60 0.23)%
17
2.2.3 离群值的检验
现象:一组数据中,个别数据离群较远,称为异常值,又称 可疑值或极端值。 来源:1. 过失,如溶解时试样有溶液溅出,测定时加入的滴定 剂过多等,这一数据必须舍去。 2. 随机误差,就应该保留。如不同方法、不同实验室或
x
5
精密度(precision): 指在确定的条件下,将测试方法实施多 次,求出所得结果的一致程度。
精密度常用偏差来表示。用标准偏差更合理。有时候也用相 对标准偏差表示。
例:有两组测定值,甲:2.9 2.9 3.0 3.1 3.1 乙:2.8 3.0 3.0 3.0 3.2判断精密度的差异。
平均值:
(2)
xn xn-1 Q xn x1
例:测定某药物中钴的含量(µg/g),结果如
下:1.25,1.27,1.31,1.40 µg/g。1.40 这个数据是否应该保留?(臵信度90%)
Q计算
x离群 x邻近 xmax xmin
1.40 1.31 0.60 1.40 1.25
若 t计 t ( f ) ,则测定值与标准值之间的差异 可认为是偶尔误差引起的正常差异。
21
Q值表
测量 3 4 5 6 7 8 9 10 次数 (n) 90% (Q0.90) 0.94 0.76 0.64 0.56 0.51 0.47 0.44 0.41 95%

信 (Q0.95) 0.97 0.84 0.73 0.64 0.59 0.54 0.51 0.49 度
例:用分析天平称量两物体的质量分别为1.6380g和
0.1637g,假定两者真值分别为1.6381g和0.1638g, 两者的绝对误差和相对误差分别为多少?
绝对误差: E1 = 1.6380-1.6381 = -0.0001(g) E2 = 0.1637-0.1638 = -0.0001(g) 相对误差:
在排除系统误差的情况下,多次测定的随机误差服从标准正态分布。
0.4 0.3 0.2 0.1 0 -4 -3 -2 -1 0 1 2 3 4
定义 u x

-3 -2 - -3 -2 -
68.3% 95.5% 99.7%

0
2 3 + +2 +3
x- x
(Q0.96) 0.98 0.85 0.73 0.64 0.59 0.54 0.51 0.48 (Q0.99) 0.99 0.93 0.82 0.74 0.68 0.63 0.60 0.57 99% 96%

已知w(CaO)=30.43%, 测得结果为: n = 6, x = 30.51%, s = 0.05%。 问此测定有无系统误差?(α =0.05)
24
即说明两个平均值不属于同一总体,之间存在系统误差。
显著水平为0.05的F 分布值表
x t sx
sx s / n
f称为自由度,f=n-1 t分布曲线随自由度f而改变,当f趋近∞ 时,t分布就趋近正态分布。 t值与臵信度和测定的次数有关。
13
t 分布值表
tα,f
测定次数n
置信度 50% 90% 95% 99%
2
3 4 5 6
1.00
0.82 0.77 0.74 0.73
6.31
14
21

平均值的臵信区间(confidence interval)
在一定的臵信度下,以平均值为中心,包括总体平均值µ 在内 的可靠性范围。
对于少量测量数据,根据t分布进行处理,可得
ts x tsx x n
臵信区间的宽窄与臵信度、测定值的精密度和测定次数有关, 当测定值精密度愈高(s愈小),测定次数愈多(n愈大),臵信 区间愈窄,即平均值愈接近真值。
n
2
n 1
0.08%
臵信度选择越高,臵信区间越 宽,其区间包括真值的可能性越大。 一般臵信度定为95%或90%。
臵信度为90%时,t0.10,3=2.35 t , f s x (47.60% 0.09)% n 臵信度为95%时,t0.05,3=3.18 臵信度为99%时,t0.01,3=5.84
Q计 < Q0.90=0.76 故1.40这个数据应该保留。
20
2.2.4 显著性检验---t 检验法
1.测定值与标准值的比较 ——确定是否有较大系统误差
(1) 给定显著水平α
(2) 计算
t计 x 0 s n
(3) 查t表,得到t (f)的值 (4) 若 t计 t ( f ) ,则测定值与标准值有明显差别, 表明被检验方法存在系统误差;
特点: 重复性、单向性、可测性 校正: 对照实验、空白试验、校准仪器
9
随机误差 亦称偶然误差,它是由某些难以控制且无法避免的偶
然因素造成的,如:测定过程中环境温度、湿度、气 压等微小的变化,使分析结果在一定范围内波动而引 起误差。
特点:大小和方向都不确定,无法测量,也是不能加以校正的。
但当测量次数足够多时,出现的概率服从统计分布规律,
n
其中μ为总体平均值,校正系统误差的情况下,代表真值。 在一般的分析工作中,测定次数是有限的,这时的标准偏差称 为样本标准偏差。以s表示如下:
s
( xi x)2 i 1 n 1
r
n
s与平均值之比称为相对标准偏差(RSD),以sr表示。如 s 以百分数表示,又称为变异系数( coefficient of variation)。 s
16
例:对未知试样中Cl-的质量分数进行测定,4次结果为47.64%,
47.69%,47.52%,47.55%。计算臵信度为90%,95%和99% 时,总体平均值μ的臵信区间。
x
47.64% 47.69% 47.52% 47.55% 47.60% 4
s
( x x)
i 1 i
15
t值与置信度P及自由度f关系
t0· 05,10表示臵信度为95%,自由度为10时的t值。 t0· 01,5表示臵信度为99%,自由度为5时的t值。
置信区间概念的理解
即总体平均值在以测量平均值X为中心的包括真值在内的某个 范围内,该范围成为平均值的臵信区间。 µ =47.60 % ±0.13%(臵信度为95%) 应当理解为:在47.60 % ±0.13%的区间内包括总体平均值的概 率为95%。 µ 是客观存在的,不能说它落在某一区间的概率是多少。
第2章 误差及分析数据处理
2.1 定量分析中的误差 2.2 分析结果的数据处理 2.3 有效数字及其运算规则 2.4 标准曲线的回归分析
1
2.1 定量分析中的误差
2.1.1 误差与准确度
真值(true value): 某一物理量本身具有的客观存在的真实数值 。
a 理论真值;b 计量学约定真值;c 相对真值
1 n d xi x n i 1
为了说明分析结果的精密度,将各单次测定偏差的绝对值取 平均值。
相对平均偏差:
d d r 100% x
4
标准偏差(standard deviation):
均方根偏差。测定次数趋于无限多时,称为总体标准偏差,用σ表 示如下:
n

2 ( x ) i i 1
B 误差是可以测定的;
C 在同一条件下重重测定中,正负误差出现的机会相等 D 它对分析结果影响比较恒定 3. 分析测试数据的随机误差的特点之一是 A 数值服从一定的函数关系; B大小误差出现的概率相同; C数值误差出现的可能性大;
D正负误差出现的概率相同
11
2.2 分析结果的数据处理
2.2.1 随机误差的正态分布
解:
x 0 30.51% 30.43% t计 3.9 s 0.05% / 6 n
查t 表, t0.05(5) = 2.57, t计 > t表 结论:此测定存在系统误差。
23
2.2.4 显著性检验
2. 两组测量结果的比较
第一步: F 检验—比较两组的精密度。 计算 F计算 如果 F计算 <F ( f1 , f2 )
Er1
0.0001 100% 0.006% 1.6381
Er 2
0.0001 100% 0.06% 0.1638
3
2.1.2 偏差与精密度
相关主题