当前位置:文档之家› 第三章分析数据中的误差与数据处理

第三章分析数据中的误差与数据处理


s n
置信区间:一定置信度(概率)下,以平均值为中心, 能够包含真值的区间(范围)
置信度越高,置信区间越大
f=20 t接近u值
定量分析数据的评价---解决两类问题: (1) 分析方法的准确性系统误差及偶然误差的判断
显著性检验:利用统计学的方法,检验被处理的问题 是否存在 统计上的显著性差异。
(1)t分布曲线
N →∞: 随机误差符合正态分布(高斯分布) (m,)
x
n 有限: t分布 和s 代替m,
m X t s
n
曲线下一定区间的积分面积,即为该区间内随机 误差出现的概率
f → ∞时,t分布→正态分布
(2)平均值的置信区间 某一区间包含真值(总体平均值)的概率(可能性)
m X tα、f
在相同条件下对某样品中镍的质量分数(%) 进行重复测定,得到90个测定值如下:
1.60 1.67 1.67 1.64 1.58 1.64 1.67 1.62 1.57 1.60 1.59 1.64 1.74 1.65 1.64 1.61 1.65 1.69 1.64 1.63 1.65 1.70 1.63 1.62 1.70 1.65 1.68 1.66 1.69 1.70 1.70 1.63 1.67 1.70 1.70 1.63 1.57 1.59 1.62 1.60 1.53 1.56 1.58 1.60 1.58 1.59 1.61 1.62 1.55 1.52 1.49 1.56 1.57 1.61 1.61 1.61 1.50 1.53 1.53 1.59 1.66 1.63 1.54 1.66 1.64 1.64 1.64 1.62 1.62 1.65 1.60 1.63 1.62 1.61 1.65 1.61 1.64 1.63 1.54 1.61 1.60 1.64 1.65 1.59 1.58 1.59 1.60 1.67 1.68 1.69
R=mA×nB/pC c. 指数运算
R=mAn d. 对数运算
R=mlgA
sR2=m2sA2+n2sB2+p2sC2 sR2/R2=sA2/A2+sB2/B2+sC2/C2 sR/R=nsA/A sR=0.434msA/A
(3)极值误差 最大可能误差
R=A+B-C ER=|EA|+|EB|+|EC| R=AB/C ER/R=|EA/A|+|EB/B|+|EC/C|
4. 绘直方图 以组值范围为横坐
标,以频数为纵坐 标绘制直方图。
测量数据有明显的集中 趋势 这种既分散又集中的特 性,就是其规律性。
频率密度
频数分布直方图
3.5 3
2.5 2
1.5 1
0.5 0 1 组号
由表中的数据和图可以看出,测定数据的分布并非 杂乱无章,而是呈现出某些规律性。在全部数据中,平均 值1.62%所在的组(第五组)具有最大的频率值,处于它 两侧的数据组,其频率值仅次之。统计结果表明:测定值 出现在平均值附近的频率相当高,具有明显的集中趋势; 而与平均值相差越大的数据出现的频率越小。
1n lim x
m
n n
i
i 1
况下总体平均值就是真值xT.
d: 总体平均偏差
n
xi
m
d i 1
n
n>20
d 0.797
由表1.1的频数表资料所绘制的直方图,(1)可以看出,高峰位 于中部,左右两侧大致对称。我们设想,如果观察例数逐渐增多, 组段不断分细,直方图顶端的连线就会逐渐形成一条高峰位于中 央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的 光滑曲线图(3)。这条曲线称为频数曲线或频率曲线,近似于 数学上的正态分布(normal distribution)。由于频率的总和为 100%或1,故该曲线下横轴上的面积为100%或1。
x
3.相对标准偏差(变异系数RSD) RSD S 100%
4.衡量数据分散度:
x
标准偏差比平均偏差合理
5.标准偏差与平均偏差的关系
d=0.7979σ
一、 偶然误差的统计规律
随机事件以统计形式表现的规律性称为统 计规律。
偶然误差对测定结果的影响是服从统计规 律的。
1 频率分布
例如有一矿石样品,在相同条件下测定Ni 的百分含量。共有90个测定值,这些测定 值彼此独立,属随机变量。
( 2 )随机误差(偶然误差、不定误差):
a、定义:由某些难以控制且无法避免的偶然因 素造成的误差。
b、原因:环境、温度、湿度、气压、仪器、样品处理 等的微小波动或变化。
c、性质: 1)单次测量,误差可大可小,可正可负,不能确定。
2)多次测量,统计处理,遵从“正态分布”规律。
3)随机误差无法避免。根据“正态分布”规律, 多次测量取平均值,可消除或减小随机误差。

NaOH
CaCO3 2HCl CaCl2 H2CO3 HCl(过量)
w CaCO3 =
H2O+CO2
0.1000
25.00
0.1000
24.10
M
(
1 2
CaCO3
)
ms 103
0.1000 25.00 0.1000 24.10 100.1/ 2
0.2351 103
0.0191599 ?0.0192
全距(极差):R
R=Xmax-Xmin
准确度与精密度的关系
x1
x2
x3
x4
准确度与精密度的关系
1.精密度好是准确度好的前提;
2.精密度好不一定准确度高
x1
x2
x3
准确度及精密度都高-结x4果可靠
2 系统误差与随机误差
(1)系统误差:又称可测误差 具单向性、重现性、可校正特点
方法误差: 溶解损失、终点误差-用其他方法校正 仪器误差: 刻度不准、砝码磨损-校准(绝对、相对) 操作误差: 颜色观察 试剂误差: 不纯-空白实验 主观误差: 个人误差
5.误差的传递
(1)系统误差
a. 加减法
R=mA+nB-pC
b. 乘除法
R=mA×nB/pC
c. 指数运算
R=mAn
d. 对数运算
R=mlgA
ER=mEA+nEB-pEC ER/R=EA/A+EB/B-EC/C ER/R=nEA/A ER=0.434mEA/A
(2)随机误差
a. 加减法
R=mA+nB-pC b. 乘除法
6
1.545 1.575
6
1.575 1.605
17
1.605 1.635
22
1.635 1.665
20
1.665 1.695
10
1.695 1.725
6
1.725 1.755
1

பைடு நூலகம்90
2.2% 6.7% 6.7% 18.9% 24.4% 22.2% 11.1% 6.7% 1.1% 100%
0.12
0.10
0.08
0.06
0.04
0.02
0.00 0 1 2 3 4 5 6 7 8 9 10
x
y
离散特性
用偏差来表示数据的离散程度,标准 偏差S ;测量次数多时,离散特性 用总体标准偏差σ
集中趋势
n
xi m 2
i1
n
数据无线多时将无线多次测定 的平均值成为总体平均值,用 符号μ,在消除系统误差的情
9.45×104, 95.2%, 8.65 e 对数与指数的有效数字位数按尾数计,如 pH=10.28, 则
[H+]=5.2×10-11 f 误差只需保留1~2位
◇分析天平(称至0.1mg):12.8228g(6) , 0.2348g(4) , 0.0600g(3)
◇千分之一天平(称至0.001g): 0.235g(3) ◇1%天平(称至0.01g): 4.03g(3), 0.23g(2) ◇台秤(称至0.1g): 4.0g(2), 0.2g(1) ☆滴定管(量至0.01mL):26.32mL(4), 3.97mL(3) ☆容量瓶:100.0mL(4),250.0mL (4) ☆移液管:25.00mL(4); ☆量筒(量至1mL或0.1mL):25mL(2), 4.0mL(2)
3.2 有效数字及运算规则
1 有效数字: 分析工作中实际能测得的数字,包括全 部可靠数字及一位不确定数字在内
a 数字前0不计,数字后计入 : 0.03400 b 数字后的0含义不清楚时, 最好用指数形式表示 : 1000
(1.0×103, 1.00×103, 1.000 ×103) c 自然数和常数可看成具有无限多位数(如倍数、分数关系) d 数据的第一位数大于等于8的,可多计一位有效数字,如
数据的精度定提高一位, • 即1.4851.515, 1.5151.545。这样1.51就分
在1.4851.515组。
3. 统计频数和计算相对频数
• 频 数:落在每个组内测定值的数目。 • 相对频数:频数与样本容量总数之比。
表2.1 频数分布表
分组
频数
相对频数
1.485 1.515
2
1.515 1.545
方法:t 检验法和F 检验法 确定某种方法是否可用,判断实验室测定结果准确性 (2)可疑数据的取舍 过失误差的判断 方法:4d法、Q检验法和格鲁布斯(Grubbs)检验法
2 有效数字运算中的修约规则
四舍六入五成双
尾数≤4时舍; 尾数≥6时入
尾数=5时, 若后面数为0, 舍5成双;若5后面还有 不是0的任何数皆入
例 下列值修约为四位有效数字
0.324 74 0.324 75 0.324 76
0.324 7 0.324 8 0.324 8
相关主题