第二章 误差及分析数据的统计处理
本章教学目的:
(1) 了解误差是定量分析的中心问题,是建立各种分析方法的主要依据;
(2) 了解误差的分类、性质、来源、表示方法以及它们之间的关系;
(3) 熟悉分析数据的处理方法以及提高分析结果准确度的办法;
(4) 掌握有效数字的概念、意义、记录方法,合理使用有效数字进行记录和计算。
第一节 定量分析中的误差
一、误差与准确度
1. 定义:误差是指测定值x i 与真值μ之差。
2. 表示方法:绝对误差E= x i - μ
相对误差Er =%100⨯-μμ
i x
3. 衡量因素:准确度,准确度是指测定平均值与真值接近的程度,常用误差大小表示。
二、偏差与精密度
1. 定义:偏差是指个别测定结果x i 与几次测定结果的平均值x 之间的差别。
2. 表示方法:绝对偏差d i = x i –x
相对偏差d r =%100⨯-x x
x i
标准偏差又称均方根偏差,当测定次数趋于无限多时,称为总体标准偏差,用σ表示如下: ()n x n i i ∑=-=12
μσ
测定次数有限时的标准偏差称为样本标准差以s 表示: ()112
--=∑=n x x s n i i
相对标准偏差以s r 表示,也可简写为RSD :x s s r
s r 如以百分率表示又称为变异系数CV 。
2. 衡量因素:精密度是指在确定条件下,将测试方法实施多次,求出所得结果之间一致 程度。
精密度的大小用偏差表示。
精密度的高低还用重复性和再现性表示。
重复性:同一操作者,在相同条件下,获得一系列结果之间的一致程度。
再现性:不同的操作者,在不同条件下,用相同方法获得的单个结果之间的一致程度。
三、准确度与精密度的关系
准确度与精密度的关系如下图所示:
精密度 准确度
高 高
高 低
低 低
低 低
实验结果首先要求精密度高,才能保证有准确的结果,但高的精密度也不一定能保证有高的准确度(如无系统误差存在,则精密度高,准确度也高。
)
四、误差的分类及减免误差的方法
(一)系统误差
1. 产生原因:
(1) 方法误差:方法不完善造成的;
(2) 试剂误差:试剂或蒸馏水纯度不够,带入微量的待测组分,干扰测定等原因造
成的;
(3) 仪器误差:测量仪器本身缺陷造成的;
(4) 操作误差:操作人员操作不当或操作偏见造成的。
2. 性质:
(1)重复性 (2)单向性 (3)恒定性
3. 校正方法:
(1)对照试验:校正方法系统误差
选择标准方法、进行试剂的提纯和使用校正值等办法加以消除。
(2)校准仪器:校正仪器系统误差
(3)空白试验:校正试剂系统误差
除了不加试样外,其它试验步骤与试样试验步骤完全一样的实验,所得结果称为
空白值。
(4) 回收试验:在测定试样某组分含量(x 1)的基础上,加入已知量的该组分(x 2), 再次测定其组分含量(x 3)。
回收率= %100213⨯-x x x (二)随机误差
1.产生原因:随机误差是由一些无法控制的不确定因素所造成的,如环境温度、湿度、电压、污染情况等的变化引起试样质量、组成、仪器性能等的微小变化,操作人员实验过程中操作上的微小差别,以及其他不确定因素等所造成的误差。
2. 性质:(1)不确定性 (2)不可消除 (3)服从正态分布
五、随机误差的分布服从正态分布
随机误差的分布具有以下性质:
1. 对称性:大小相近的正负误差出现的概率相等
2.单峰性:小误差出现的概率大,大误差出现的概率小,很大误差出现的概率非常小
3. 有界性:仅仅由于偶然误差造成的误差不可能很大
4. 抵偿性:误差的算术平均值的极限为零。
测定值或误差出现的概率称为置信度或置信水平,其意义可理解为某一定范围的测定值或误差值出现的概率。
置信区间为真实值在指定概率下,分布在某一区间。
六、有限次测定中随机误差服从t 分布
有限次测定的随机误差服从类似于正态分布的t 分布
也可衍生出 n s
x t μ-= t =
由此式也可衍生出:n ts
x ±=μ
此式的意义为:在一定置信度下,真值(总体平均值)将在测定平均值x 附近的一个区间即在n ts x -
至 n ts x + 之间存在。
第二节 分析结果的数据处理
一、可疑数据的取舍
判断离群值是否仍在偶然误差范围内,常用的统计检验方法有Grubbs 检验法和Q 值检验法:
1. Grubbs 法
步骤是:将测定值由小到大排列,x 1 < x 2 < … < x n ,其中x 1或x n 可疑,需要进行判断,算出n 个测定值的平均值x 及标准偏差s 。
需要判断x 1 ,按
s
x x G 1-=计算计算; 需要判断x n ,按
s
x x G n -=计算计算。
得出的G 计算值若大于表2-3中临界值,G 计算 〉G 表 ,则x 1或x n 应弃去,反之应保留。
2. Q 值检验法
如果测定次数在10次以内,使用Q 值法比较简便。
步骤是:将测定值由小到大排列,x 1 < x 2 < … < x n ,其中x 1或x n 可疑,
当x 1可疑时,用1
12x x x x Q n --=计算 当x n 可疑时,用 11x x x x Q n n n ---=
计算 若Q 计算 〉Q 表 (表2-4中数据)则弃去可疑值,反之则保留。
二、平均值与标准值的比较(检查方法的准确度)
方法:用已知含量的标准试样进行试验,用t 检验法将测定的平均值与已知值(标样值)
比较,按n s
x t μ-=计算t 值。
若t 计算 〉t 表 ,则x 与已知值有显著差别,表明被检验的方法存在系统误差;
若t 计算〈 t 表 ,则x 与已知值之间的差异可认为是偶然误差引起的正常差异。
(例2:略)
三、两个平均值的比较
判断两个平均值是否有显著性差异,首先要求这两个平均值的精密度没有大的差别。
为此采用F 检验法(方差比检验)进行判断:
22小大
s s F =
若F 计算 〈 F 表 (表2-5中数据),再继续用t 检验法判断(1x )与(2x )是否有显著性差异;若F 计算 〉 F 表 ,不能用此法进行判断。
(例3:略)
第三节 有效数字及其运算规则
一、有效数字
1. 定义:
测量值或与测量值有关的计算值,它的位数多少,反映测量的精确程度,这类数字称 为有效数字,也可理解为最高数字不为零的实际能测量的数字。
有效数字通常保留的最后一位数字是不确定的,称为可疑数字。
2. 有效数字位数的确定规则:
运算中,首位数字≥8,有效数字可多记一位;
数字“0”若只起定位作用,它就不是有效数字;如0.0875为三位有效数字
数字“0”若作为普通数字就是有效数字;如30.20是四位有效数字。
pH 、pM 、lg K 等有效数字位数,按照对数的位数与真数的有效数字位数相等,对数的首数相当于真数的指数的原则来定,如[H +] = 6.3 ⨯ 10-12 mol •L -1, 两位有效数字,所以pH = 11.20。
二、修约规则
“四舍六入五留双”的规则:当多余尾数 ≤ 4时舍去尾数,≥ 6时进位。
尾数正好为5时分两种情况,若5后数字不为0,一律进位,5后无数或为0,采用5前是奇数则将5进位,
5前是偶数则把5舍弃,简称“奇进偶舍”。
例如:下列数字保留四位有效数字,修约如下:
14.2442→14.24
26.4863→26.49
15.0250→15.02
15.0150→15.02
15.0251→15.03
修约数字时要一次修约到所需要位数。
三、运算规则
1. 加减法
运算结果的有效数字位数决定于这些数据中绝对误差最大者。
如0.0121+25.64+1.05782
= 0.01+25.64+1.06
= 26.71
2. 乘除法
运算结果的有效数字位数决定于这些数据中相对误差最大者。
如
82
.
139
064 .
60
103
.5 0325
.0⨯
⨯
8. 139
06 . 60
103
.5
0325
.0⨯
⨯
=
=0.0713
在表示分析结果时,组分含量≥10%时,用四位有效数字;含量1% ~ 10% 时用三位有效数字,表示误差大小时有效数字常取一位,最多取二位。
布置作业:P28 2、3、7、8、11。