第二章定量分析中的误差及其处理分析结果必须达到一定的准确度,满足对分析结果准确度的要求。
因为不准确的分析结果会导致产品的报废和资源的浪费,甚至在科学上得出的错误的结论,给生产或科研造成很大的损失,人民生活造成巨大困难或灾难。
但是分析结果是由分析者对所取样品(供试品或样品)利用某种分析方法、分析仪器、分析试剂得到的,必然受到这些分析的限制,分析结果不可能和样品的真实组成或真实含量完全一致,在一定条件下分析结果只能接近于真实值而不能达到真实值。
测定值与客观存在的真实值的差异就是所谓的误差(error)。
因此分析误差是客观存在、不可避免的,我们只能得到一定误差范围内的真实含量的近似值,达到一定的准确度。
采用哪些措施可能减小误差,依赖于误差本身的性质。
所以,我们应当了解误差的有关理论,明确误差的性质和来源,根据分析目的对误差的要求,选择准确度合适的分析方法,合理安排分析实验,设法减小分析误差,使分析结果的准确度达到要求,避免追求过高的准确度。
同时,也应当了解对分析结果的评价方法,以判断分析结果的可靠程度,对分析结果做出正确的取舍和表示。
2.1 分析结果的误差一、真值、样本平均值和总体平均值1. 真值与相对真值真值(true value)是指某物理量本身具有的客观存在的真实数值,表示物质存在的数量特征,用T来表示。
由于分析误差是不可避免的,因此真值是不可能测得的,实际工作中往往将理论值、约定值和标准值当作真值来检验分析结果的准确度,分别称为理论真值、约定真值和标准真值。
理论真值是指由公认理论推导或证明的某物理量的数值。
如水的组成常数或组成分数即为理论真值:1 mol H2O含2mol H和1 mol O,再如H+与OH-的反应的化学计量关系即H+与OH-的反应量之比为1 mol H+ : 1 mol OH-,该比值也是理论真值。
约定真值是指计量组织、学会或管理部门等规定并得到公认的计量单位的数值。
如国际计量大会定义的长度、时间、质量和物质的量等物理量的基本单位:光在真空中传播(1/299 792 458)s所经过的路径长度为1 m,国际千克原器的质量为1 kg、铯-133原子基态的两个超精细能级之间跃迁所对应的辐射的9 192 631 770个周期的持续时间为1 s等。
标准真值又称相对真值,是指由公认的权威组织发售的标准样品的证书或标签上所给出的保证值,严格按照标准方法平行分析多次后用数理统计方法确定的相对准确的测定值,或者由公认的权威专家反复分析确定的相对准确的测定值。
如基准试剂标签所给保证值、标准方法对照分析结果、国际相对原子质量和相对分子质量等都是标准真值。
2. 样本平均值与总体平均值对样品重复测定可以发现,一组平行测定值有一种集中趋势,这种集中趋势常用样本平均值和总体平均值来表示。
样本平均值(sample mean)简称为平均值(mean value),是指对某一分析对象总体取n份样品进行平行测定或重复测定,所得分析结果(测定值)之和的1/n,用X来表示,即++=21(1X X nX …∑==+n i i n X n X 11) (2-1) 式中,X 1,X 2,…,X n 为某一样品的一组平行测定值或重复测定值。
总体平均值(mean of population)是指平行测定或重复测定无穷多次的分析结果的算术平均值,反映了无穷多次测定结果的集中趋势,用μ来表示,即∑=i X n1lim μ (2-2) 平均值虽然不是真值,但它反映了平行测定或重复测定结果的集中特征,比单次测定结果更接近真值,后面将证明平均值为最佳测定值。
因而在分析工作中,总是要平行测定或重复测定数次,然后求得平均值。
二、准确度和误差准确度(accuracy)是指测定值接近真值的程度。
分析结果与真值越接近或其差别越小,分析结果的准确度越高。
因此准确度的高低用误差来衡量。
误差(error)是指测定值与真值的差异。
由于通常用平均值表示分析结果,因此应当用平均值的误差来表示分析结果的误差。
平均值的误差就是平均值与真值的差异(它实际上就是个别测定值的误差的平均值),可用绝对误差和相对误差两种方法来表示。
绝对误差(absolute error ,AE 、E a 或E )表示平均值与真值之差: E = X - T (2-3)相对误差(relative error ,RE 或Er)表示绝对误差在真值中所占的分数:%100⨯=TE RE (2-4) 相对误差常用百分数或千分数表示。
这里需要指出如下几点: ① 绝对误差和相对误差都表示了分析结果偏离真值的程度,反映了分析结果的准确度。
平均值的误差越小,分析结果越接近真值,其准确度越高,反之平均值的误差越大,分析结果的准确度越差。
② 测定值大于真值时误差为正值,称为分析结果偏高,测定值小于真值时误差为负值,称为分析结果偏低。
③ 相对误差反映了绝对误差在真值中所占的分数,可用来比较不同情况下测定结果的准确度,更具有实用意义。
[例2-1] 砝码标称质量的误差往往将直接影响分析结果的准确度,砝码标称质量的误差可用准确度高一等级的砝码和分析天平称取其质量的相对真值来检定。
若称得某标称质量为0.5000 g 的砝码的质量的相对真值为0.499 8 g ,标称质量为0.2000 g 的砝码的质量的相对真值为0.199 8 g ,请计算这两只砝码标称质量的绝对误差和相对误差,它表明了什么问题?[解2-1] 绝对误差:E 1=X 1 - T 1 =0.500 0 g-0.499 8 g=0.000 2 gE 2=X 2 - T 2=0.200 0 g-0.199 8 g=0.000 2 g相对误差:%04.0%1004998.00002.0111=⨯==T E RE %1.0%1001998.00002.0222=⨯==T E RE 这表明虽然两砝码的标称质量均偏高0.000 2 g ,但标称质量较大的砝码的相对误差较小。
[例2-2] 测定BaCl 2·2H 2O 试剂中结晶水的含量时,三次测定结果分别为14.73%,14.68%和14.75%,求测定结果的绝对误差和相对误差。
[解2-2] BaCl 2·2H 2O 中结晶水含量的理论真值为%75.14%1003.24402.182%10021122222=⨯⋅⋅⨯=⨯=--⋅mol g mol g M M T O H BaCl OH 应该指出,必须用摩尔质量标准值(国际相对原子质量标准值或相对分子质量标准值)来计算理论真值,用摩尔质量近似值进行计算所得结果并非理论真值(分析化学中一般要求摩尔质量至少应有四位有效数字以保证其相对误差不超过0.1%)。
三次测定结果的平均值为%72.143%75.14%68.14%3.141=++==∑i X n X 绝对误差为 E =X -T = 14.72% - 14.75% = -0.03%相对误差为RE =T E ×100% = %75.14%03.0-×100% = -0.2% 三、精密度和偏差精密度(precision)是指一组平行测定结果之间相互接近的程度。
平行测定结果越接近或偏离越小,分析结果的精密度越高。
由于平均值反映了一组平行测定结果的集中特征,因此分析结果的精密度用平行测定结果与平均值的各种偏差(deviation)来表示。
1. 绝对偏差和相对偏差单次测定值与平均值之差称为绝对偏差,用D i 表示。
D i = X i - X (2-5)绝对偏差在平均值中所占的分数称为相对偏差,用RD 表示。
RD =XD i ×100% (2-6) 绝对偏差和相对偏差只能衡量个别测定值与平均值的偏离程度,反映了个别测定结果的精密度。
偏差越大,个别测定结果的精密度越差,偏差越小,个别测定结果的精密度越高。
2. 平均偏差和相对平均偏差一组平行测定结果的精密度,可用平均偏差和相对平均偏差来表示。
单次测定结果的偏差的绝对值的平均值称为平均偏差(average deviation), 用D 表示。
n Dn D D D D i n∑=+⋅⋅⋅++=21 (2-7)取绝对值是为了避免正负偏差相互抵消。
平均偏差占平均值的分数或单次测定结果的相对偏差的绝对值的平均值,称为相对平均偏差,用R D 或RD 表示。
XD D R =×100% (2-8) 3. 标准偏差和相对标准偏差 现在一般要求用统计方法处理分析结果,用标准偏差来衡量一组平行测定值的精密度。
个别测定结果与平均值的差方和均根称为一组测定结果的标准偏差或样本标准差(standard deviation),用SD 或S 表示。
1)(2--=∑n X X S i (2-9)式中n -1为能够独立取值的偏差数,称为自由度,用f 表示,即f = n – 1① (2-10)差方和均根的目的,一是避免各次分析结果的偏差相互抵消;二是突出大偏差更好地反映各次分析结果的分散程度;三是描述各次测定值的平均分散情况。
标准偏差较好地反映了一组平行测定结果的随机误差、分散程度和精密度。
标准偏差越小,表示平行测定结果的随机误差越小、分散度越小和精密度越高。
总体标准差为无穷多次测定结果的标准偏差,用σ表示,即n X X i ∑-=2)(σ (2-11)样本标准差的平方即S2称为样本方差,为总体方差σ2的估计值。
标准偏差在平均值中所占的分数称为相对标准偏差(relative standard deviation)或变异系数(coefficient Of variation),用RSD 或CV 表示。
RSD =XS ×100% (2-12)显然,相对标准偏差可用来比较不同情况下测定结果的精密度。
4. 平均值的标准偏差用统计方法处理数据时,还经常用到平均值的标准偏差。
平均值的标准偏差是指n 组平行测定结果的① 由∑=i X n X 1得∑(X i -X ),即有一偏差可由其余偏差导出,不能独立取值,因此f =n -1。
平均值(1X ,2X ,…,n X )的标准偏差,反映了平均值的精密度,用X S 表示。
可以证明,若一组平行测定n 次,则n 组测定结果的平均值的标准偏差与其中一组测定结果的标准偏差符合下列关系。
n S S X (2-13)这表明,平均值的标准偏差可由一组n 个测定结果的标准偏差求得,不必测定几组平均值,而且X S 与n 是开方倒数关系。
如图2-1所示,开始时X S 随n 增大很快减小,但当n > 5时变化就较慢了,因此平行测定次数无需过多,3~6次已足够,再多则事倍功半。
图2-1 X S 与n 的关系[例2-3] 某土壤样品中钙的含量,5次测定结果为10.48%,10.37%,10.47%,10.43%,10.40%,计算分析结果的平均值、标准偏差、相对标准偏差和平均值的标准偏差。