当前位置:文档之家› (实验数据)3.误差理论和数据处理

(实验数据)3.误差理论和数据处理


0.
30 20 10 0 频数分布图
64
分组值
0. 5 68 0. 5 72 0. 5 76 0. 5 80 0. 5 84 0. 5 88 0. 5 92 5
归纳1、分组的一般步骤:
一、求极差:极差=样本数据中最大值-最小值 二、确定组距与组数 :(设k=极差÷组距) (1)若k为整数, 则组数=k,
例如甲、乙、丙、丁四人同时测定一铁矿石中的 含量(真实含量37.40%),各分析四次,测定结 果(%)如表所示。
3. 准确度与精密度的关系
x1
x2
x3
x4
1.精密度是保证准确度的先决条件;精密 度低:说明所测结果本身就不可靠,当然 准确度也就不高。 2.精密度好,不一定准确度高.
3.2 有效数字及其计算规则
计算机绘制频数分布图



OFFICE-EXCELL 输入120个值,单列。 横坐标次数,纵坐标浓度,折线图。 从小到大排列,分组。 直方图,频数分布图。
折线图
1 0.9 0.8 0.7 0.6 0.5 0 20 40 60 Î Ê ´ ý 80 100 120
Ö ¨µ â ¶ ²
频数

【例3-1】测定碱灰的总碱量(Na20%), 得到5个数据:40.02,40.13,40.15, 40.16,40.20。试问40.02是否应舍去?
1).4 d 法检验


根据测量值的正态分布可知,偏差大于3σ的测量 值出现的概率约为0.3%,此为小概率事件,而 小概率事件在有限次实验中是不可能发生的,如 果发生了则是不正常的。 即偏差大于3σ的测量值在有限次检验中是不可能 的,如果出现则为异常值,为过失所致应舍弃。 (概率不超过5%的事件称为小概率事件)。



在作直方图时,要注意分组问题。组数的多少 往往影响直方图反映数据分布的效应。 如果组数过多,每组所占的区间就很狭窄,这 不仅造成计算上的麻烦,而且也有可能因随机 因素导致某组内数据稀少,甚至没有; 如果组数过少,那么落在每组内的数据就较多, 从而掩盖了组内数据变化的情况。在实际应用 中,一般当数据多于100个时,宜分为10~20 组,当数据少于50个时,分为5~6组为宜。



用Excel制作频数分布表和直方图
输入数据
对数据进行分组,得到分组结果
调出数据分析工具
工具菜单
加载宏
分析工具库
原始数据+分组结果:
原始数据+分组结果:
工具菜单 数据分析 直方图
输入相关数据项目
得到频数分布表和简易直方图
对直方图进行修饰
频率
10 15 20 25 30 0 1 2 14 19 直方图 26 15 12 7 3 1 0
120次测量结果
Ô ¶ HgCl2Å ¨¶ È 0.86 0.82 0.87 0.77 0.76 0.79 0.82 0.81 0.81 0.75 0.76 0.81 0.8 0.85 0.82 £ g/L© ¨ £ 120´ Î Ö Ø · ´ â ² ¶ ¨½ á ¸ û 0.83 0.77 0.81 0.81 0.81 0.87 0.81 0.77 0.78 0.71 0.95 0.78 0.82 0.8 0.82 0.82 0.79 0.86 0.78 0.73 0.83 0.86 0.82 0.82 0.81 0.74 0.78 0.79 0.85 0.75 0.85 0.73 0.78 0.87 0.83 0.65 0.8 0.77 0.81 0.81 0.77 0.78 0.85 0.84 0.82 0.81 0.82 0.77 0.81 0.84 0.76 0.81 0.78 0.78 0.74 0.81 0.64 0.75 0.82 0.85 0.8 0.78 0.78 0.79 0.79 0.78 0.81 0.84 0.8 0.71 0.79 0.78 0.83 0.84 0.84 0.79 0.8 0.77 0.8 0.9 0.83 0.83 0.84 0.74 0.88 0.77 0.75 0.9 0.85 0.78 0.82 0.81 0.77 0.77 0.82 0.75 0.89 0.84 0.78 0.82 0.78 0.82 0.8 0.84 0.78




由于测量误差的不可避免,有时会发现一 组测量值中总会有一二个值明显偏大或偏 小,这样的测量值称为可疑值(离群值)。 如果可疑值并未超出随机误差的限度,属 正常值应予保留; 如果超出随机误差的限度,应予舍弃。 判断测量值应该保留还是舍弃的过程就是 测量数据的合理性检验。
对于异常数据的取舍一定要慎重,一般 处理原则如下:
(2)若k不为整数, 则组数=[k]+1.
三、分组:分组区间常取左闭右开区间 , 最后一 组取闭区间 说明:样本容量不超过100时常分成5 -12组.

归纳 2 、画频率分布直方图步骤: 作频率分布直方图的方法:
1、把横轴等分成若干段,每段对应每组组距;
2、依次以组距为宽、频率/组距为高作出矩形。 3、每个矩形的面积恰好是该组上的频率,这些矩形 就构成频率分布直方图。
标准正态分布曲线 N (0,1)
0.4 0.3 0.2 0.1 0 -4
-3s -2s -s m-3s m-2s m-s
-3
-2
-1
0
m
68.3% 95.5% 99.7%
0
s 2s 3s m+s m+2s m+3s
1
2
3
4
x-m x
u

由前面的分析已知,总体的平均偏差为
1 n xi m n i 1
3.误差与数据处理
3.1 误差及其表示方法
误差来源


设备误差 环境误差 人员误差 方法误差
误差分类

系统误差、 随机误差、 过失误差
(1)系统误差


系统误差是由某种确定的因素造成的,使测定 结果系统偏高或偏低;当造成误差的因素不存 在时,系统误差自然会消失。 当进行重复测量时,它会重复出现。系统误差 的大小,正负是可以测定的,至少在理论上说 是可以测定的,系统误差的最重要特性是它具 有‘‘单向性” 。
有效数字就是在测量中所能得到的有实 际意义的数字 (只作定位用的”0”除外)。
在确定有效数字时要注意:
(1)数字“0”有时为有效数字,有时 只起定位作用,例如20.50就有4为有效 数字,其中的“0”都是有效数字;再如 0.108就只有3位有效数字,其中前一个 “0”只起定位作用。




(2)有些数字如48000、0.00051等, 有效数字位数不定,为明确其有效数字, 可采用如下表达形式。 例如48000若记为4.8×104,就表示有 两为有效数字;记为4.80×104,则表示 有3位有效数字。 0.00051若记为5.1×10-3,表示有2位 有效数字,记为5.10×10-3,则表示有3 位有效数字。
9 平均值的有效数字位数,通常和测量值相同。 当样本容量较大,在运算过程中,为减少舍 入误差,平均值可比单次测量值多保留一位 数。
3.3实验数据的初步整理
3.3.1实验数据的列表整理 1.数据的归类整理 2.数据的分组整理


3.3.2 分布为了对某个随机变量的分布规律作出判断, 最基本的方法就是在对该变量进行大量观测 的基础上,对观测结果进行统计分析,将其 绘制成为图形,从而估计其总体分布规律或 直接给出其函数形式,进而求得随机变量的 概率密度函数f(x)。

对于n个测量数据,样本的平均偏差为
d d1 d 2 d n n

在正态分布下
0.8s

这样就有
3s 4



缺点:由于 d 所以替代会产生误差。 优点:4 d 法比较简便,不用查表。 用4d法判定异常值时: (1)先将可疑异常值除去后,计算其余(n-1) 个测量值的平均值及平均偏差 d 。 (2)如果可疑异常值χ与 x 之差的绝对值不小 于4 d ,即 x x 4d 则该值为异常值应舍去,否则为正常值应保留。
3.4 测量数据的合理性检验
虽然从理论上讲,测量中的系统误差、随 机误差与过失误差性质各异不难分辨。但 在实际过程中,这几种误差总是纠缠在一 起而难以区分。实验数据的合理性检验就 是利用数理统计方法对误差进行分析,从 而正确地评价测量数据,并对如何有效改 进实验提供有用的信息。

3.4.1 可疑值检验
(2) 随机误差(偶然误差)


随机误差又称偶然误差,它是由一些随机 的、偶然的原因造成的。 由于偶然误差是由一些不确定的偶然原因 造成的,因而是可变的,有时大,有时小, 有时正,有时负,所以又称不定误差。偶 然误差在分析操作中是无法避免的。偶然 误差的产生难以找出确定的原因,似乎没 有规律性,但如果进行很多次测定,便会 发现数据的分布符合正态分布规律。
(3)过失误差
由粗心大意引起, 可以避免。
重做!
3.1.2

准确度和精密度
准确度:表示分析结果与真实值接近的程 度。


精密度:表示各次分析结果相互接近的程 度。 精密度高不一定准确度高,因为这时可能 有较大的系统误差。
准确度和精密度都好
准确度差、精密度好
准确度差、精密度差
准确度和精密度都差





在试验过程中,若发现异常数据,应停止试验,分析原 因,及时纠正错误; 试验结束后,在分析试验结果时,如发现异常数据,则 应先找出产生差异的原因,再对其进行取舍; 在分析试验结果时,如不清楚产生异常值的确切原因, 则应对数据进行统计处理再做取舍; 对于舍去的数据,在试验报告中应注明舍去的原因或所 选用的统计方法。
相关主题