误差和分析数据处理1 数据的准确度和精度在任何一项分析工作中,我们都可以看到用同一个分析方法,测定同一个样品,虽然经过多少次测定,但是测定结果总不会是完全一样。
这说明在测定中有误差。
为此我们必须了解误差产生的原因及其表示方法,尽可能将误差减到最小,以提高分析结果的准确度。
1.1 真实值、平均值与中位数(一)真实值真值是指某物理量客观存在的确定值。
通常一个物理量的真值是不知道的,是我们努力要求测到的。
严格来讲,由于测量仪器,测定方法、环境、人的观察力、测量的程序等,都不可能是完善无缺的,故真值是无法测得的,是一个理想值。
科学实验中真值的定义是:设在测量中观察的次数为无限多,则根据误差分布定律正负误差出现的机率相等,故将各观察值相加,加以平均,在无系统误差情况下,可能获得极近于真值的数值。
故“真值”在现实中是指观察次数无限多时,所求得的平均值(或是写入文献手册中所谓的“公认值”)。
(二)平均值然而对我们工程实验而言,观察的次数都是有限的,故用有限观察次数求出的平均值,只能是近似真值,或称为最佳值。
一般我们称这一最佳值为平均值。
常用的平均值有下列几种:(1)算术平均值这种平均值最常用。
凡测量值的分布服从正态分布时,用最小二乘法原理可以证明:在一组等精度的测量中,算术平均值为最佳值或最可信赖值。
式中: n x x x 21、——各次观测值;n ――观察的次数。
(2)均方根平均值(3)加权平均值设对同一物理量用不同方法去测定,或对同一物理量由不同人去测定,计算平均值时,常对比较可靠的数值予以加重平均,称为加权平均。
式中;n x x x 21、——各次观测值;n w w w 21、——各测量值的对应权重。
各观测值的权数一般凭经验确定。
(4)几何平均值(5)对数平均值以上介绍的各种平均值,目的是要从一组测定值中找出最接近真值的那个值。
平均值的选择主要决定于一组观测值的分布类型,在化工原理实验研究中,数据分布较多属于正态分布,故通常采用算术平均值。
(三)中位数(xM )一组测量数据按大小顺序排列,中间一个数据即为中位数。
当测定次数为偶数时,中位数为中间相邻的两个数据的平均值。
它的优点是能简便地说明一组测量数据的结果,不受两端具有过大误差的数据的影响。
缺点是不能充分利用数据。
1.2 准确度与误差准确度与误差是指测定值与真实值之间相符合程度。
准确度的高低常以误差的大小来衡量。
即:误差越小,准确度越高;误差越大,准确度越低。
误差有两种表示方法:绝对误差和相对误差。
1、绝对误差(E)某物理量在一系列测量中,某测量值与其真值之差称绝对误差。
实际工作中常以最佳值代替真值,测量值与最佳值之差称残余误差,习惯上也称为绝对误差。
绝对误差(E)=测定值(x)-真实值(T)2、相对误差(RE)为了比较不同测量值的精确度,以绝对误差与真值(或近似地与平均值)之比作为相对误差。
由于测定值可能大于真实值,也可能小于真实值,所以绝对误差和相对误差都有正、负之分。
绝对误差相同,相对误差可能相差很大。
相对误差是指误差在真实值中所占的百分比率。
相对误差不同说明它们的误差在真实值众所站的百分比率,用相对误差来衡量测定的准确度更具有实际意义。
但应注意有时为了说明一些仪器测量的准确度,用绝对误差更清楚。
例如分析天平的称量误差是±0.0002g,常量滴定的读书误差是±0.01mL等。
这些都是用绝对误差来说明的。
1.3 精密度与偏差精密度是指在相同条件下n次重复测定结果彼此相符合的程度。
精密度的大小用偏差表示,偏差愈小说明精密度愈高。
(一)偏差偏差有绝对偏差和相对偏差。
绝对偏差(d)=xx-相对偏差是指单次测定值与平均值的偏差。
相对偏差=%100⨯-xxx相对偏差是指绝对偏差在平均值中所占的百分率。
绝对偏差和相对偏差都有正负之分,单次测定的偏差之和等于零。
对多次测定数据的精密度常用算术平均偏差表示。
(二)算术平均偏差算术平均偏差是指单次测定值与平均值的偏差(取绝对值)之和,除以测定次数。
即算数平均偏差n xx d i -∑=)( (n i ,2,1=)算术平均偏差和相对平均偏差不计正负。
例 计算下面这一组测量值的平均值,算术平均偏差和相对平均偏差。
解: 55.51, 55.50, 55.46, 55.49, 55.51平均值=n x i ∑=49.55551.5549.5546.5550.5551.55=++++算数平均偏差=n xx d i -∑=)(=016.0502.000.003.001.002.0=++++相对平均偏差=%028.0%10049.55016.0%100=⨯=⨯x d(三)标准偏差在数理统计中常用标准偏差来衡量精密度。
1、总体标准偏差总体标准偏差是用来表达测定数据的分散程度,其数学表达式为: 总体标准偏差n x i 2)()(μσ-∑=2、样本标准偏差 一般测定次数有限,μ值不知道,只能用样本标准偏差来表示精密度,其数学表达式为: 样本标准偏差1)()(2--∑=n x x S i 上式中(n-1)在统计学中成为自由度,意思是在n次测定中,只有(n-1)个独立可变的偏差,因为n个绝对偏差之和等于零,所以只要知道(n-1)个绝对偏差,就可以确定第n个的偏差。
3、相对标准偏差标准偏差在平均值中所占的百分率叫做相对标准偏差,也叫变异系数或变动系数(cv),其计算式为:cv=%100⨯xS用标准偏差表示精密度比用算术平均偏差表示要好。
因为单次测定值的偏差经平方后,较大的偏差就能显着地反应出来。
所以产生和科研的分析报告中常用cv表示精密度。
例如,现有两组测量结果,各次测量的偏差分别为:第一组 0.3 0.2 0.4 -0.2 -0.4 0.0 0.1 -0.3 0.2 -0.3第二组 0.0 0.1 -0.7 0.2 0.1 -0.2 0.6 0.1 -0.3 0.1两组的算术平均偏差分别为:第一组24.01=∑=ndd i第二组24.02=∑=ndd i从两组的算术平均偏差的数据看,都等于0.24,说明两组的算术平均偏差相同。
但很明显的可以看出第二组的数据较分散,其中有2个数据即-0.7和0.6偏差较大。
用算术平均值表示显示不出这两个差异,但用标准偏差表示时,就明显的显示第二组数据偏差较大。
各次的标准偏差分别为:第一组 28.01)()(21=--∑=n x x S i第二组34.01)()(22=--∑=n x x S i 由此说明第一组的精密度较好。
4、样本标准偏差的简化计算 按上述公式计算,得先求出平均值,再求出)(x x i -,然后计算出S 值,比较麻烦。
可以通过数学推导,简化为下列等效公式: S=1)(22-∑-∑n n x x i i利用这个公式,可直接从测定值来计算S 值,而且很多计算器上都有2x x ∑∑以及功能,有的计算器上还有S 及σ功能,所以计算S 值还是十分方便的。
(四)极差一般分析中,平行测定次数不多,常用极差(R )来说明偏差的范围,极差也称为“全距”。
R=测定最大值—测定最小值相对极差=%100⨯x R(五)公差公差也称允差。
是指分析方法所允许的平行测定的绝对偏差,公差的数值是将多次测定的分析数据经过数理统计方法处理而确定的,生产实践中用以判断分析结果是否合格的依据。
若2次平行测定的数值之间在规定允差绝对值的2倍以内,认为有效,如果测定结果超出允许的公差范围,成为“超差”,就应重做。
例如:重铬酸钾发测定铁矿石中含铁,2次平行测定结果为33.18%和32.78%,2次结果之差为33.18%-32.78%=-0.40%。
生产部门规定铁矿石含铁量在30%~40%之间,允差为±0.3%。
因为0.4%小于允差±0.3%的绝对值的2倍(即0.6%),所以测定结果有效。
可以用2次测定结果的平均值作为分析结果,即这里要指出的是,以上公差表示方法只是其中的一种,在各种标准分析方法总公差的规定不尽相同,除上述表示方法外,还有用相对误差表示,或用绝对误差表示。
要看公差的具体规定。
1.4 准确度与精密度的关系关于准确度与精密度的关系的定义及确定方法,在前面已有叙述。
准确度和精密度是两个不同的概念,它们相互之间有一定的关系。
现举例说明。
例如现有2组各分析结果的数据如下表所示,并绘制成如图所示的图表(标准值为0.31)。
第一组测定结果:精密度很高,但是平均值与标准值相差很大,说明准确度很低。
第二组测定的结果:精密度不高,测定数据分散,虽然平均值接近标准值,但这是凑巧的来的,如只取2次或3次来平均,结果与标准值相差较大。
第三组数据的结果:测定的数据较集中并接近标准数据,说明其精密度和准确度都较高。
由此可见欲使准确度高,首先必须要求精密度也要高。
但精密度高并不说明其准确度也高,因为可能在测定中存在系统误差,可以说精密度是保证准确度的先决条件。
2 误差的来源与消除方法我们进行样品分析的目的是为了获取准的分析结果,然而即使我们用最可靠的分析方法,最精密的仪器,熟悉细致的操作,所测得的数据也不可能和真实值完全一致。
这说明误差是可观存在的。
但是如果我们掌握了产生误差的基本规律,就可以将误差减小到允许的范围内。
为此必须了解误差产生的性质和产生的原因以及减免的方法。
根据误差产生的原因和性质,我们将误差分为系统误差和偶然误差两大类。
2.1 系统误差系统误差又可成为可测误差。
它是由分析操作过程中的某些经常原因造成的。
在重复测定时,它会重复表现出来,对分析结果的影响比较固定。
这种误差可以设法减小得到可忽略的程度。
化验分析中,将系统误差产生的原因归纳为一下几个方面。
1、仪器误差这种误差是由于使用仪器本身不够精密所造成的。
如使用未经过校正的容量瓶、移液管和砝码等。
2、方法误差这种误差是由于分析方法本身造成的。
如在滴定过程中,由于分应进行的不完全,化学计量点和滴定终点不相符合,以及由于条件没有控制好和发生其它副反应等等原因,都会引起系统的测定误差。
3、试剂误差这种误差是由于所用蒸馏水含有杂质或所使用的试剂不纯所引起的。
4、操作误差这种误差是由于分析操作者掌握分析操作的条件不熟练,个人观察器官不敏锐和固有的习惯所致。
如对滴定终点颜色的判断偏深或偏浅,对仪器刻度标线读数不准确等都会引起测定误差。
2.2 偶然误差(一)偶然误差的规律偶然误差又称随机误差,是指测定值受各种因素的随机波动而引起的误差。
例如,测量时的环境温度、湿度和气压的微小波动,仪器性能的微小变化等,都会使分析结果在一定范围内波动。
偶然误差的形成取决于测定过程中一系列随机因素,其大小和方向都是不固定的。
因此,无法测量,也不可能校正,所以偶然误差又成不可测误差,它是客观存在的,是不可避免的。
根据上述规律,为了减少偶然误差,应该多做几次平行实验并取其平均值。