当前位置:文档之家› 分析化学第六版第二章PPT

分析化学第六版第二章PPT


2.2 分析结果的数据处理
分析工作者获得了一系列数据后,需要对这些数据进行
处理,譬如有个别偏离较大的数据(称为可疑值)是保留还 是该弃去,测得的平均值与真值或标准值的差异是否合理, 相同方法测得的两组数据或两种不同方法对同一试样测得的 两组数据间的差异是否在允许的范围内,都应做出判断,不 能随意舍去。
两个平均值的比较
_ _ 比较 x 1与 x 2 两组数据之间是否存在系统误差,首先要计 算合并标准偏差,
再计算出t值, 最后根据臵信度和自由度(f=n1+n2-2)查出相应的 值。 若t< ,说明两组数据的平均值不存在显著性差异,可 认为两个平均值属于同一总体;若t > ,则存在显著性 差异,说明两个平均值不属于统一总体,两组平均值之间 存在着系统误差。
标准正态分布曲线
这样,曲线的横坐标就变为μ,纵坐标为概率密度,用μ和概率密度
表示的正态分布曲线称为标准正态分布曲线,用符号N(0,1)表示。这样, 曲线的形状与σ大小无关,即不论原来正态分布曲线是瘦高的还是扁平的 ,经过这样的变换后都得到相同的一条标准正态分布曲线。
误差在某些区间出现的概率
标准正态分布曲线与横坐标之间所加的面积,代表了某 一区间的测量值或某一范围 随机误差出现的概率。
两组精密度不同的测量值的正态分布曲线
正态分布规律
(1)x=μ时,y最大。即多数测量值集中在μ附近,或者说
总体平均值是最可信赖值或最佳值。 (2)x=μ时的直线为对称轴。即正负误差出现的概率相等。 (3)x→〒≦时,曲线以x轴为渐近线。即大误差出现的 概率小,出现很大误差的测定值概率趋近零。 (4) ↗, y↘ ,即测量精密度越差,测量值分布越分散, 曲线平坦。
误差(Error) :
表示测量值与真值之差,表征测量

结果的准确度。 误差有两种表示方法:绝对误差(E)和相对误差(Er)。

绝对误差(E)是测量值(x)与真实值(xT)之间的
差值,即:
1.绝对误差的单位与测量值的单位相同,误差越小,表示测量值与真实 值越接近,准确度越高;反之,误差越大,准确度越低。 2.测量值大于真实值时,误差为正误差,表示测定结果偏高;反之,误 差为负值,表示测定结果偏低。
① 格鲁布斯(Grubbs)法
平均值与标准值的比较(检查方法的准确度)
为了检验一个分析方法是否可靠,是否有足够的准确度, 常用已知含量的标准试样进行试验,用t检验法将测定的平均 值与已知值(标样值)比较,按下式计算t值:
再根据臵信度和自由度由t值表查出相应的 值。若t > ,则认为x与μ之间存在显著性差异,说明该分析方 法存在系统误差;否则可认为无显著性差异, x与μ之间 的差异是由随机误差引起的。
有限次测定中随机误差服从t分布
正态分布是无限次测量数据的分布规律,而实际分析 工作中,只能对随机抽样进行有限次测量,其随机误差的
分布不服从正态分布。那么如何以统计的方法处理有限次
测量数据,使其合理地反映总体的特征?
(1)t分布曲线
当测量数据不多时,无法求得总体平均值μ和总体标准偏 差σ,只能用样本的标准偏差s来估计测量数据的分散情况。用s 代替σ,必然引起分布曲线变得平坦,从而引起误差。为了得到 同样的臵信度(面积),必须用一个新的因子代替u,这个因子 是由英国统计学家兼化学家Gosset提出来的,称为臵信因子t, 定义为
直方图的两个特点: (1)离散特性 (2)集中趋势
相对频数分布直方图
当测定次数无限多时,其标准偏差称为总体标准 偏差,用符号σ来表示。
其中μ为总体平均值,即无限多次测定的平均值。
在确认消除系统误差的前提下总体平均值就是真值xT。此 时总体平均偏差δ为 当测定次数非常多(>20)时,总体标准偏差(σ)与总 体平均偏差(δ)有下列关系 = 0.797σ 0.8
例3 p15
公差
公差是生产部门对分析结果误差允许的一种限量,若果误差超 出允许的公差范围,该项分析工作就应重做。
公差范围的确定,与诸多因素有关:
首先,根据实际情况对分析结果准确度的要求而定;
其次,公差范围常依据试样组成及待测组分含量而不同,组成 愈复杂,引起误差的可能性就愈大,允许的误差范围则宽一些。 此外,由于各种分析方法所能达到的准确度不同,则公差的范 围也不同。
准确度与精密度的关系
高的精密度不一定保证高的准确度; 但精密度高是准确度高的前提。
例2 p10
误差的分类及减免误差的方法
在定量分析中,对于各种原因导致的误差,根据误差的 来源和性质的不同,可以分为系统误差和随机误差两大类。
根据产生的具体原因,系统误差可分为:方法误差; 仪器和试剂误差;操作误差;主观误差。
偏差与精密度

精密度(precision)是指在确定条件下,将 测试方法实施多次,求出所得结果之间的一致程 度。精密度的大小常用偏差来表示。
偏差(deviation)
在实际分析工作中,一般要对试样进行多次平行测定,以
求得分析结果的平均值。

为了说明分析结果的精密度,将各单次测定偏差的绝对值
随机误差的分布服从正态分布
随机误差是由某些难以控制且无法避免的偶然因 素造成的,它的大小、正负都不定,具有随机性。尽 管单个随机误差的出现无规律,但在系统误差已排除 的情况下,进行多次重复平行测定,会发现随机误差 是服从一定的统计规律的。
用数理统计的方法研究发现,随机误差的分布符合 正态分布(即高斯分布)。
1.频数分布
频数是指每组中测量值出现的次数,频数与数据 总数之比为相对频数,即概率密度。
整理上述数据,按组距0.03来分成10组,得频数分布表:
分 组
1.265% 1.295% 1.295% 1.325% 1.325% 1.355% 1.355% 1.385% 1.385% 1.415% 1.415% 1.445% 1.445% 1.475% 1.475% 1.505% 1.505% 1.535% 1.535% 1.565%
不同f值及概率所对应的t值已由统计学家计算出来,见 。
表中臵信度用P表示,它表示在某一t值时,测定值落在 (μ〒t s)范围内的概率。显然,测定值落在此范围之外的概率 为(1-P),称为显著性水准。
臵信区间概念的理解:
= 47.50% 0.10% (P=95%)
应当理解为:在 47.50% 0.10% 的区间内包括总体平
以t为统计量的分布称为t分布。t分布可说明当n不大时 (n<20)随机误差分布的规律。
t分布曲线的纵坐标仍为概率密度,但横坐标为统计量t。
t分布与标准正态分布的区别: 1.横坐标不同t u; 2.随测定次数减少,t分布曲线 趋于平坦,即t分布曲线随着自 由度(f=n-1)而改变:
f<10, t分布曲线与标准正态分布 曲线差别较大; f>20,t分布曲线与标准正态分布曲 线很接近; f t,分布曲线与标准正态分布曲 线严格一致。
正态分布概率积分表或简称u表
----不同u值对应的积分值(面积)做成的表
由u值可查表得到面积,也即是某一区间的测量值或某一范围 随机误差出现的概率。
测定值或误差出现的概率称为臵信度或臵信水平, 上表中68.3%、95.5%、99.7%即为臵信度,其意义可理 解为某一定范围的测定值(或误差值)出现的概率。 μ±σ、 μ±2σ、 μ±3σ等称为臵信区间,其意义为真实值 在指定概率下,分布在某一个区间。 臵信度选得高,臵信区间就宽。
频 数
1 4 7 17 24 24 15 6 1 1
相对频数
0.01 0.04 0.07 0.17 0.24 0.24 0.15 0.06 0.01 0.01

100
1.00
以各组区间为底,相对频数为高做成一排矩形的相对频数 分布直方图。如果测量数据非常多,组距可更小些,组就分得 更多些,直方图的形状趋于一条平滑的曲线。
因此,应该了解分析过程中误差产生的原因及其出现的 规律,以便采取相应措施,尽可能使误差减小。另一方面 需要对测试数据进行正确的统计处理,以获得最可靠的数 据信息。

2.1 定量分析中的 误差
误差与准确度
准确度(accuracy)是指测定平均值与真值接近的程度,
常用误差大小表示。误差小,准确度高。



臵信度的高低应定得合适,要使臵信区间的宽度 足够窄,而臵信度又足够高。
在分析化学中,一般将臵信度定在95%或90%。
总体标准偏差:
样本标准偏差:
平均值的标准偏差:
平均值的标准偏差:
正态分布曲线: 置信区间:
t分布曲线:Байду номын сангаас置信区间:
样本容量 n n x μ 0.8
自由度 f = n-1 n-1 n s d与s相差较大
亦称偶然误差,由难以控制且无法避免的偶然因素造成 ,如测定过程中温度、湿度、气压等变化引起的误差。 由于疏忽或错误引起,实质是一种错误,不能成为误差。
消除系统误差
1. 2. 3. 4. 对照试验:检验系统误差 空白试验:扣除系统误差 校正仪器 分析结果校正
消除随机误差
增加平行测定次数
思考
① 砝码受腐蚀:系统误差(仪器误差),更换砝码 ② 天平的两臂不等长:系统误差(仪器误差),校正仪器。 ③ 容量瓶与移液管未经校准:系统误差(仪器误差),校正 仪器。 ④ 在重量分析中,试样的非被测组分被共沉淀: 系统误差(方法误差),修正方法,严格沉淀条件。 ⑤ 天平称量时最后一位读数估计不准: 偶然误差;严格按操作规程操作,增加测定次数。 ⑥ 以含量为99%的邻苯二甲酸氢钾作基准物标定碱溶液: 系统误差,做对照试验或提纯试剂。
均值μ的概率为95%。 注意:μ是个客观存在的恒定值,没有随机性,谈不上什 么概率问题,不能说μ落在某一区间的概率是多少。
相关主题