当前位置:文档之家› 分析化学中的数据处理

分析化学中的数据处理

随机误差是由一些偶然因素造成的误 差,其大小、方向都不固定,难以预 计,不能测量也无法消除。它的出现 似乎很不规律,但实质上,它的出现 和分布服从统计规律
分析化学中的数据处理
1.正态分布(高斯GAUSS分布)
它在概率统计中占有特别重要的地位,因为 许多随机变量都服从或近似服从正态分布, 分析测定中的随机误差也是这样的,P55图 3-3即为正态分布曲线,它的数学表达式为:
分析化学中的数据处理
若对某试样作若干批测定,每批又作n个 平行测定

S

X
S n
由此可见:
(2-4)
①平均值的精密度比单次测定的精密度
更次好数,的S X平方S根;成平反均比值.的②标增准加偏测差定与次测数定,
可使平均值的标准偏差减小。

s x
n 关系图如P59图3-5所示。
s
分析化学中的数据处理
分析化学中的数据处理
§2.1 几个概念(P52)
研究对象的某种特性值的全体叫总体; 从总体中随机取出的一组数据叫样本; 样本所含测量值的数目叫样本容量。例 如,对某矿石中Fe的含量作了无限次测 定,所得无限多个数据的集合就是总体, 其中每个数据就是个体,从中随机取出 一组数据(例如8个数据)就是样本,样 本容量为8。
3)大多数测定值集中在µ的附 近,所以µ为最可信赖值或 最佳值
分析化学中的数据处理
正态分布曲线随µ、σ值不同而不同,应
用起来不方便,为此,采用变量转换的
方法,将其化为同一分布-标准正态分


u= x-
令 代入(2-5)式得
y=f(x)=
1
- u2
e2
2
又 dx= du
所以
f(x)dx=
1
- u2
e 2 du (u)du
2
分析化学中的数据处理
即将式(2-5)转化为只有变量µ的方程
y=(u)
1
- u2
e2
2
(2-6)
因此曲线的形状与σ大小无关,即不同σ
曲线皆合为一条
标准正态分布曲线见P56图3-4
分析化学中的数据处理
分析化学中的数据处理
2.随机误差的区间概率
正态分布曲线与横坐标-∞到+∞之间所夹的面积代表
y=f(x)= 1 e-(x2-2)2
2
(2-5)
式中y-为概率密度 x-为测量值
分析化学中的数据处理
µ-为总体平均值,即无限次测定数据的 平均值,相应于曲线最高点的横坐标值, 在没有系统误差时,它即为真值 ,它
反映xT无限个测量数据分布的集中趋势
σ-总体标准偏差,是µ到曲线两拐点之一 的距离,它表征数据的分散程度,σ小, 数据集中,曲线瘦高;σ大,数据分散, 曲线矮胖。
X-µ表示随机误差,若以X-µ为横坐标, 则曲线最高点横坐标为0,即为随机误差 的正态分布曲线
分析化学中的数据处理
由图可看到随机误差有以下 规律性:
1)偏差大小相等、符号相反的 测定值出现的概率大致相等
2)偏差小的测定值比偏差较大 的测定值出现的概率大,偏 差很大的测定值出现的概率 极小,趋近于0
当测量次数为无限多次时,各测量值对总 体平均值µ的偏离,用总体标准偏差σ表示:
(x )2
n
②样本标准偏差
(2-2)
当测量值不多,总体平均值又不知道时, 用样本的标准偏差s来衡量该组数据的分 散程度。
s (x x)2 n 1 分析化学中的数据处理
当测量次数非常多时,测量次数n与自由度
s x
开始时,s 随 n 减 少 很快,n>5变化较 慢,而当n>10时, 变化很小,进一步增 加测定次数,徒劳无 益,对提高分析结果 可靠性,并无更多好 处。实际中,一般的 分析作3~5次平行 测定即可,而标样、 物理常数、原子量的 测定则次数较多
分析化学中的数据处理
§2.2随机误差的正态分布(P53)
例:P57 例7、例8、例9
分析化学中的数据处理
§2.3 少量数据的统计处理
对无限次测量而言,总体平均值µ衡量数 据的集中趋势,总体标准差σ反映了数据 的离散程度,但是,分析化学中常常只 作有限次测定。下面将讨论如何通过有 限次测定结果对µ和σ进行估计,从而合 理地推断总体的特性
分析化学中的数据处理
表中所列值是什么区间的概率,表中列出的面积与图中
阴影部分相对应(P57表3-2),表示随机误差在此区
间的概率,若是求 u 区间的概率,利用正态分布的对
称性,必须乘以2 分析化学中的数据处理
随机误差出现 的区间
u 1
测量值出现的 概率P 区间
2×0.3413=68.3
x 1 %
2×0.4773=95.5
全部数据出现概率的总和,显然应当是100%,即为1
P=
(u)du
1
u2
2
e
2 du 1(2-7)
随机误差或测量值在某一区间出现的概率可取不同u值
对式(2-7)进行定积分,求得面积(即为概率),并
制得标准正态分布概率积分表。由于积分上下限不同,
表的形式有很多种,为了区别,在表上方一般绘图说明
(n-1)的区别就很小了,此时 x

lim (x x)2 (x )2
n
同时s
n 1
n
③平均值的标准偏差(P58)
单次测定值的标准差S反映的是单次测定值
x1,x2,x3 xn 之间的离散性
平均值的标准差反映的是若干组平行测定,
各平均值
X1, X 2...之.X间n 的离散性
一.有限次测量时的随机误差
正态分布是无限次测量数据的分布规律,
而实际测定只能是有限次,其分布规律
不可能完全相同。 英国的统计学家兼化
学家戈塞特(W.S.GOSSET)提出了t分
u 2 x2 %
u2.6
x 2.6
2×0.4953=99.1 %
u 3
x 3 分析化学中的数据处理
2×0.4987=99.7 %
从计算结果可知,95%以上的测量值都会 落在范围内,随机误差x-μ超过 3 的 大误差(或测量值)出现的概率<0.3%,一般 化学分析是作几次测定,所以可以认为实 际上是不可能出现的,如一旦出现,可认 为其不是由于随机因素引起的,应弃去。
分析化学中的数据处理
设样本容量为n,则其平均值为 x
x
1 n
x
当测量次数无限多时,所得平均值 即为 总体平均值μ:
lim 1 xห้องสมุดไป่ตู้
n n
(2-1)
若没有系统误差,则总体平均值µ就是真
实值 xT
在分析化学中,广泛采用标准偏差来衡
量数据的分散(离散)程度
分析化学中的数据处理
①总体标准偏差
相关主题