分析化学第六版第二章
准确度与精密度的关系
高的精密度不一定保证高的准确度;但 精密度高是准确度高的前提。
例2 p10
误差的分类及减免误差的方法
在定量分析中,对于各种原因导致的误差,根据误差的来源和性质的不同, 可以分为系统误差和随机误差两大类。
根据产生的具体原因,系统误差可分为:方法误差; 仪器和试剂误差;操作误差;主观误差。
单次测定结果的相对平均偏差为(dr),公式如下:
当测定次数较多时,常使用标准偏差(s)或相对标准偏差 (RSD,sr)来表示一组平行测定值的精密度。公式如下:
标准偏差通过平方运算,它能将较大的偏差更显著地表现出来, 因此,标准偏差能更好地反映测定值的精密度。实际工作中, 都用RSD表示分析结果的精密度。
差值,即:
1.绝对误差的单位与测量值的单位相同,误差越小,表示测量值与真实值 越接近,准确度越高;反之,误差越大,准确度越低。
2.测量值大于真实值时,误差为正误差,表示测定结果偏高;反之,误差 为负值,表示测定结果偏低。
相对误差(Er)是绝对误差(E)相当于真实
值(xT)的百分率,即:
1.相对误差和绝对误差一样,有正有负。 2.相对误差反映的是误差在真实值中所占的比例大小,因此
绝对误差相同的条件下,待测组分含量越高。相对误差越 小;反之,相对误差越大。
真实值(XT)
• 某一物理量本身具有的客观存在的真实数值。真值是未知 的、客观存在的量,严格地说,任何物质中各组分的真实 含量是不知道的,用测量的方法得到的仅是测量值。
在分析化学中常将以下的值当作真值来处理: a、理论真值(如化合物的理论组成,例如硫酸铵含氮量) b、计量学约定真值(如国际计量大会确定的长度、质量、物质的量单位等, 例如原子量、分子量。 ) c、相对真值(如高一级精度的测量值相对于低一级精度的测量值。例如,标 准样品的标准值)
曲线平坦。
标准正态分布曲线
这样,曲线的横坐标就变为μ,纵坐标为概率密度,用μ和概率密度表 示的正态分布曲线称为标准正态分布曲线,用符号N(0,1)表示。这样,曲 线的形状与σ大小无关,即不论原来正态分布曲线是瘦高的还是扁平的, 经过这样的变换后都得到相同的一条标准正态分布曲线。
误差在某些区间出现的概率
两组精密度不同的测量值的正态分布曲线
正态分布规律
(1)x=μ时,y最大。即多数测量值集中在μ附近,或者说 总体平均值是最可信赖值或最佳值。
(2)x=μ时的直线为对称轴。即正负误差出现的概率相等。 (3)x→±∞时,曲线以x轴为渐近线。即大误差出现的
概率小,出现很大误差的测定值概率趋近零。 (4) ↗, y↘ ,即测量精密度越差,测量值分布越分散,
t x n
s
以t为统计量的分布称为t分布。t分布可说明当n不大时(n<20)随机误差分布的规律。
t分布曲线的纵坐标仍为概率密度,但横坐标为统计量t。
t分布与标准正态分布的区别:
1.横坐标不同t u;
2.随测定次数减少,t分布曲线
趋于平坦,即t分布曲线随着自
由度(f=n-1)而改变:
f<10, t分布曲线与标准正态分布
(1)t分布曲线
当测量数据不多时,无法求得总体平均值μ和总体标准偏差σ,只能用样本的标准 偏差s来估计测量数据的分散情况。用s代替σ,必然引起分布曲线变得平坦,从而引起 误差。为了得到同样的置信度(面积),必须用一个新的因子代替u,这个因子是由英 国统计学家兼化学家Gosset提出来的,称为置信因子t,定义为
标准正态分布曲线与横坐标之间所加的面积,代表了某 一区间的测量值或某一范围 随机误差出现的概率。
y (u)
1
u2
e2
2
正态分布概率积分表或简称u表
----不同u值对应的积分值(面积)做成的表
由u值可查表得到面积,也即是某一区间的测量值或某一范围 随机误差出现的概率。
测定值或误差出现的概率称为置信度或置信水平,
列关系
= 0.797σ 0.8
2.正态分布
在分析化学中,测量数据一般符合正态分布规律。正态分布是德国数学家高斯 首先提出的,又称高斯曲线,下图即为正态分布曲线N(μ,σ2),其数学表达式为
y f(x)
1
e
(x ) 2 2
2
2
y表示概率密度;x表示测量值; μ是总体平均值;σ是总体标准偏差 μ决定曲线在x轴的位置;σ决定 曲线的形状:σ小,数据的精密度好, 曲线瘦高;σ大,数据分散,曲线较扁平。
2.2 分析结果的数据处理
分析工作者获得了一系列数据后,需要对这些数据进行处理,譬如有个别偏 离较大的数据(称为可疑值)是保留还是该弃去,测得的平均值与真值或标准值 的差异是否合理,相同方法测得的两组数据或两种不同方法对同一试样测得的两 组数据间的差异是否在允许的范围内,都应做出判断,不能随意舍去。
频数
1 4 7 17 24 24 15 6 1 1
100
相对频数
0.01 0.04 0.07 0.17 0.24 0.24 0.15 0.06 0.01 0.01
1.00
以各组区间为底,相对频数为高做成一排矩形的相对频数分布直方图。如果测 量数据非常多,组距可更小些,组就分得更多些,直方图的形状趋于一条平滑的曲 线。
偏差与精密度
精密度(precision)是指在确定条件下,将测 试方法实施多次,求出所得结果之间的一致程度。 精密度的大小常用偏差来表示。
偏差(deviation)
在实际分析工作中,一般要对试样进行多次平行测定,以 求得分析结果的平均值。
为了说明分析结果的精密度,将各单次测定偏差的绝对值 的平均值称为单次测定结果的平均偏差(d),公式如下:
平均值的标准偏差:
s
s
x
n
t分布曲线:
置信区间:
x ta, f
s n
自由度 f = n-1 n-1 n s d与s相差较大
例3 p15
公差
公差是生产部门对分析结果误差允许的一种限量,若果误差超出允许的公差范围, 该项分析工作就应重做。 公差范围的确定,与诸多因素有关: 首先,根据实际情况对分析结果准确度的要求而定; 其次,公差范围常依据试样组成及待测组分含量而不同,组成愈复杂,引起误差的 可能性就愈大,允许的误差范围则宽一些。 此外,由于各种分析方法所能达到的准确度不同,则公差的范围也不同。
• 置信度的高低应定得合适,要使置信区间的宽度 足够窄,而置信度又足够高。
在分析化学中,一般将置信度定在95%或90%。
总体标准偏差:
(xi )2
n
平均值的标准偏差:
σ
x
n
正态分布曲线:
置信区间:
μxu σ n
样本容量 n n x μ 0.8
样本标准偏差:
s
(x x)2 i
n 1
95%。 注意:μ是个客观存在的恒定值,没有随机性,谈不上什么概率问题,不能说μ
落在某一区间的概率是多少。
• 置信度越低,同一体系的置信区间就越窄;置信 度越高,同一体系的置信区间就越宽,即所估计 的区间包括真值的可能性也就越大;
• 置信度过高会使置信区间过宽,这种判断往往就 失去了意义;置信度定的太低,其判断的可靠性 不能保证;
随机误差的分布服从正态分布
随机误差是由某些难以控制且无法避免的偶然因素 造成的,它的大小、正负都不定,具有随机性。尽管 单个随机误差的出现无规律,但在系统误差已排除的 情况下,进行多次重复平行测定,会发现随机误差是 服从一定的统计规律的。
用数理统计的方法研究发现,随机误差的分布符合 正态分布(即高斯分布)。
第2章 误差及分析数据的统计处理
2.1 定量分析中的误差 2.2 分析结果的数据处理 2.3 误差的传递 2.4 有效数字及其运算规则 2.5 标准曲线的回归分析
分析化学中的误差
• 定量分析的任务是准确测定组分在试样中的含量。在
测定过程中,即使采用最可靠的分析方法,使用最精密的 仪器,由技术很熟练的人员进行操作,也不可能得到绝对 准确的结果。因为在任何测量过程中,误差是客观存在的 。 • 因此,应该了解分析过程中误差产生的原因及其出现的 规律,以便采取相应措施,尽可能使误差减小。另一方面 需要对测试数据进行正确的统计处理,以获得最可靠的数 据信息。
亦称偶然误差,由难以控制且无法避免的偶然因素造成 ,如测定过程中温度、湿度、气压等变化引起的误差。 由于疏忽或错误引起,实质是一种错误,不能成为误差。
消除系统误差
1. 对照试验:检验系统误差 2. 空白试验:扣除系统误差 3. 校正仪器 4. 分析结果校正
消除随机误差
增加平行测定次数
思考
① 砝码受腐蚀:系统误差(仪器误差),更换砝码 ② 天平的两臂不等长:系统误差(仪器误差),校正仪器。 ③ 容量瓶与移液管未经校准:系统误差(仪器误差),校正仪器。 ④ 在重量分析中,试样的非被测组分被共沉淀: 系统误差(方法误差),修正方法,严格沉淀条件。 ⑤ 天平称量时最后一位读数估计不准: 偶然误差;严格按操作规程操作,增加测定次数。 ⑥ 以含量为99%的邻苯二甲酸氢钾作基准物标定碱溶液: 系统误差,做对照试验或提纯试剂。
直方图的两个特点: (1)离散特性 (2)集中趋势
相对频数分布直方图
当测定次数无限多时,其标准偏差称为总体标准偏
差,用符号σ来表示。
n
(xi )2
i 1
n
其中μ为总体平均值,即无限多次测定的平均值。
在确认消除系统误差的前提下总体平均值就是真值xT。此时总体平均偏差δ为
1 n
xi
当测定次数非常多(>20)时,总体标准偏差(σ)与总体平均偏差(δ)有下
1.频数分布
频数是指每组中测量值出现的次数,频数与数据总 数之比为相对频数,即概率密度。
整理上述数据,按组距0.03来分成10组,得频数分布表: