当前位置：文档之家› (实验数据)3.误差理论和数据处理

(实验数据)3.误差理论和数据处理

0.
30 20 10 0 频数分布图
64
分组值
0. 5 68 0. 5 72 0. 5 76 0. 5 80 0. 5 84 0. 5 88 0. 5 92 5
归纳1、分组的一般步骤:
一、求极差：极差=样本数据中最大值－最小值二、确定组距与组数：（设k=极差÷组距）（1）若k为整数，则组数=k，
例如甲、乙、丙、丁四人同时测定一铁矿石中的含量(真实含量37.40％)，各分析四次，测定结果(％)如表所示。
3. 准确度与精密度的关系
x1
x2
x3
x4
1.精密度是保证准确度的先决条件;精密度低：说明所测结果本身就不可靠，当然准确度也就不高。 2.精密度好,不一定准确度高.
3.2 有效数字及其计算规则
计算机绘制频数分布图

OFFICE-EXCELL 输入120个值，单列。横坐标次数，纵坐标浓度，折线图。从小到大排列，分组。直方图，频数分布图。
折线图
1 0.9 0.8 0.7 0.6 0.5 0 20 40 60 Î Ê ´ ý 80 100 120
Ö ¨µ â ¶ ²
频数

【例3-1】测定碱灰的总碱量(Na20%)，得到5个数据：40.02，40.13，40.15， 40.16，40.20。试问40.02是否应舍去?
1)．4 d 法检验

根据测量值的正态分布可知，偏差大于3σ的测量值出现的概率约为0.3％，此为小概率事件，而小概率事件在有限次实验中是不可能发生的，如果发生了则是不正常的。即偏差大于3σ的测量值在有限次检验中是不可能的，如果出现则为异常值，为过失所致应舍弃。 (概率不超过5%的事件称为小概率事件)。

在作直方图时，要注意分组问题。组数的多少往往影响直方图反映数据分布的效应。如果组数过多，每组所占的区间就很狭窄，这不仅造成计算上的麻烦，而且也有可能因随机因素导致某组内数据稀少，甚至没有；如果组数过少，那么落在每组内的数据就较多，从而掩盖了组内数据变化的情况。在实际应用中，一般当数据多于100个时，宜分为10~20 组，当数据少于50个时，分为5~6组为宜。

用Excel制作频数分布表和直方图
输入数据
对数据进行分组，得到分组结果
调出数据分析工具
工具菜单
加载宏
分析工具库
原始数据+分组结果：
原始数据+分组结果：
工具菜单数据分析直方图
输入相关数据项目
得到频数分布表和简易直方图
对直方图进行修饰
频率
10 15 20 25 30 0 1 2 14 19 直方图 26 15 12 7 3 1 0
120次测量结果
Ô ¶ HgCl2Å ¨¶ È 0.86 0.82 0.87 0.77 0.76 0.79 0.82 0.81 0.81 0.75 0.76 0.81 0.8 0.85 0.82 £ g/L© ¨ £ 120´ Î Ö Ø · ´ â ² ¶ ¨½ á ¸ û 0.83 0.77 0.81 0.81 0.81 0.87 0.81 0.77 0.78 0.71 0.95 0.78 0.82 0.8 0.82 0.82 0.79 0.86 0.78 0.73 0.83 0.86 0.82 0.82 0.81 0.74 0.78 0.79 0.85 0.75 0.85 0.73 0.78 0.87 0.83 0.65 0.8 0.77 0.81 0.81 0.77 0.78 0.85 0.84 0.82 0.81 0.82 0.77 0.81 0.84 0.76 0.81 0.78 0.78 0.74 0.81 0.64 0.75 0.82 0.85 0.8 0.78 0.78 0.79 0.79 0.78 0.81 0.84 0.8 0.71 0.79 0.78 0.83 0.84 0.84 0.79 0.8 0.77 0.8 0.9 0.83 0.83 0.84 0.74 0.88 0.77 0.75 0.9 0.85 0.78 0.82 0.81 0.77 0.77 0.82 0.75 0.89 0.84 0.78 0.82 0.78 0.82 0.8 0.84 0.78

由于测量误差的不可避免，有时会发现一组测量值中总会有一二个值明显偏大或偏小，这样的测量值称为可疑值（离群值）。如果可疑值并未超出随机误差的限度，属正常值应予保留；如果超出随机误差的限度，应予舍弃。判断测量值应该保留还是舍弃的过程就是测量数据的合理性检验。
对于异常数据的取舍一定要慎重，一般处理原则如下：
（2）若k不为整数，则组数=[k]+1.
三、分组：分组区间常取左闭右开区间 , 最后一组取闭区间说明：样本容量不超过100时常分成5 -12组.

归纳 2 、画频率分布直方图步骤：作频率分布直方图的方法：
1、把横轴等分成若干段，每段对应每组组距；
2、依次以组距为宽、频率/组距为高作出矩形。 3、每个矩形的面积恰好是该组上的频率，这些矩形就构成频率分布直方图。
标准正态分布曲线 N (0,1)
0.4 0.3 0.2 0.1 0 -4
-3s -2s -s m-3s m-2s m-s
-3
-2
-1
0
m
68.3% 95.5% 99.7%
0
s 2s 3s m+s m+2s m+3s
1
2
3
4
x-m x
u

由前面的分析已知，总体的平均偏差为
1 n xi m n i 1
3.误差与数据处理
3．1 误差及其表示方法
误差来源

设备误差环境误差人员误差方法误差
误差分类

系统误差、随机误差、过失误差
(1)系统误差

系统误差是由某种确定的因素造成的，使测定结果系统偏高或偏低；当造成误差的因素不存在时，系统误差自然会消失。当进行重复测量时，它会重复出现。系统误差的大小，正负是可以测定的，至少在理论上说是可以测定的，系统误差的最重要特性是它具有‘‘单向性” 。
有效数字就是在测量中所能得到的有实际意义的数字 (只作定位用的”0”除外)。
在确定有效数字时要注意：
（1）数字“0”有时为有效数字，有时只起定位作用，例如20.50就有4为有效数字，其中的“0”都是有效数字；再如 0.108就只有3位有效数字，其中前一个 “0”只起定位作用。

（2）有些数字如48000、0.00051等，有效数字位数不定，为明确其有效数字，可采用如下表达形式。例如48000若记为4.8×104，就表示有两为有效数字；记为4.80×104，则表示有3位有效数字。 0.00051若记为5.1×10－3，表示有2位有效数字，记为5.10×10－3，则表示有3 位有效数字。
9 平均值的有效数字位数，通常和测量值相同。当样本容量较大，在运算过程中，为减少舍入误差，平均值可比单次测量值多保留一位数。
3.3实验数据的初步整理
3.3.1实验数据的列表整理 1.数据的归类整理 2.数据的分组整理

3.3.2 分布为了对某个随机变量的分布规律作出判断，最基本的方法就是在对该变量进行大量观测的基础上，对观测结果进行统计分析，将其绘制成为图形，从而估计其总体分布规律或直接给出其函数形式，进而求得随机变量的概率密度函数f（x）。

对于n个测量数据，样本的平均偏差为
d d1 d 2 d n n

在正态分布下
0.8s

这样就有
3s 4

缺点：由于 d 所以替代会产生误差。优点：4 d 法比较简便，不用查表。用4d法判定异常值时：（1）先将可疑异常值除去后，计算其余（n－1）个测量值的平均值及平均偏差 d 。（2）如果可疑异常值χ与 x 之差的绝对值不小于4 d ，即 x x 4d 则该值为异常值应舍去，否则为正常值应保留。
3.4 测量数据的合理性检验
虽然从理论上讲，测量中的系统误差、随机误差与过失误差性质各异不难分辨。但在实际过程中，这几种误差总是纠缠在一起而难以区分。实验数据的合理性检验就是利用数理统计方法对误差进行分析，从而正确地评价测量数据，并对如何有效改进实验提供有用的信息。

3.4.1 可疑值检验
(2) 随机误差（偶然误差)

随机误差又称偶然误差，它是由一些随机的、偶然的原因造成的。由于偶然误差是由一些不确定的偶然原因造成的，因而是可变的，有时大，有时小，有时正，有时负，所以又称不定误差。偶然误差在分析操作中是无法避免的。偶然误差的产生难以找出确定的原因，似乎没有规律性，但如果进行很多次测定，便会发现数据的分布符合正态分布规律。
(3)过失误差
由粗心大意引起, 可以避免。
重做!
3.1.2

准确度和精密度
准确度：表示分析结果与真实值接近的程度。

精密度：表示各次分析结果相互接近的程度。精密度高不一定准确度高，因为这时可能有较大的系统误差。
准确度和精密度都好
准确度差、精密度好
准确度差、精密度差
准确度和精密度都差

在试验过程中，若发现异常数据，应停止试验，分析原因，及时纠正错误；试验结束后，在分析试验结果时，如发现异常数据，则应先找出产生差异的原因，再对其进行取舍；在分析试验结果时，如不清楚产生异常值的确切原因，则应对数据进行统计处理再做取舍；对于舍去的数据，在试验报告中应注明舍去的原因或所选用的统计方法。

e商务文档

(实验数据)3.误差理论和数据处理

相关文档推荐：