当前位置:文档之家› 有限实验数据的统计处理

有限实验数据的统计处理


解:先检验0.3018是否应舍去。查表Q 0.90,4 =0.76, 根据Q检验法有
0.3034-0.3018
Q=
=0.67
0.3042-0.3018
因Q计算 < Q 0.90,4 (0.76),故0.3018应该保留(P= 0.90)。如第5次测定得一最低值x1 ,因此
Q1= 0.3018-x1 0.3042-x1
0.1025 0.1016 Q计算 0.1025 0.1012 0.69 Q0.90(4) 0.76
0.1025应该保留 x 0.1017
例2 4次测定某试样中氯的质量分数,结果 分别为0.3018、0.3034、0.3038和0.3042。如 再测定一次,那么用Q法检验时,可以保留 的最低值或最高值各应为多少(P=0.90)?
1.总体(母体) 2.样本(子样) 3.样本大小
x
随机误差的正态分布
• 随机事件以统计形式表现的规律性称 为统计规律。
• 随机误差对测定结果的影响是服从统 计规律的。
• 1. 频率分布
• 例如有一矿石样品,在相同条件下测 定Ni的百分含量。共有90个测定值, 这些测定值彼此独立,属随机变量。
1.60 1.67 1.67 1.64 1.58 1.64 1.67 1.62 1.57 1.60 1.59 1.64 1.74* 1.65 1.64 1.61 1.65 1.69 1.64 1.63 1.65 1.70 1.63 1.62 1.70 1.65 1.68 1.66 1.69 1.70 1.70 1.63 1.67 1.70 1.70 1.63 1.57 1.59 1.62 1.60 1.53 1.56 1.58 1.60 1.58 1.59 1.61 1.62 1.55 1.52 1.49* 1.56 1.57 1.61 1.61 1.61 1.50 1.53 1.53 1.59 1.66 1.63 1.54 1.66 1.64 1.64 1.64 1.62 1.62 1.65 1.60 1.63 1.62 1.61 1.65 1.65 1.64 1.63 1.54 1.61 1.60 1.64 1.65 1.59 1.58 1.59 1.60 1.67 1.68 1.69
2
1.x 表示测量值,y 为测量值出现的概率密度
2.正态分布的两个重要参数
(1)μ为无限次测量的总体均值,表示无限个数据的
集中趋势(无系统误差时即为真值)
(2)σ是总体标准差,表示数据的离散程度
3.x -μ为偶然误差
以x-μ~y作图
y f (x)
1
( x )2
e 2 2
2
x
特点
➢ x =μ时,y 最大→大部分测量值集中 在算术平均值附近
➢ 曲线以x =μ的直线为对称→正负误差 出现的概率相等
➢ 当x →﹣∞或﹢∞时,曲线渐进x 轴, 小误差出现的几率大,大误差出现的
几率小,极大误差出现的几率极小
➢ σ↑,y↓, 数据分散,曲线平坦
σ↓,y↑, 数据集中,曲线尖锐
➢ 测量值都落在-∞~+∞,总概率为1
y f (x) 1
2
二. 平均值的置信区间 (一)偶然误差的区间概率
2.减小测量误差 1)称量
例: 天平一次的称量误差为 0.0001g, 两次的称量误差 为 0.0002g,RE% 0.1%, 计算最少称样量?
2 0.0001
RE%
100% 0.1%
w
w 0.2000g
2)滴定 例:滴定管一次的读数误差为0.01mL,两次的读数误差为 0.02mL,RE% 0.1%,计算最少移液体积?
括总体均值的可信范围
• 平均值的置信区间:一定置信度下,以测量结果的
均值为中心,包括总体均值的可信范围
• 置信限: u
x u
t s
x
➢ 结论:
置信度越高,置信区间越大,估计区间包含真值的可能性↑ 置信区间——反映估计的精密度 置信度——说明估计的把握程度
练习
例1:如何理解 47.50% 0.10%置信度P 95%
x2-0.3018
解之得x2=0.3083 依题意,如再测定一次,可以保留得最低值和 最高值分别为0.2975和0.3083(P=0.90)。
显著性检验
总体均值的检验——t检验法
平均值与标准值比较——已知真值的t检验(准确
度显著性检验)
x
由 x t s n t
n
s
在一定P时,查临界值表 t,f (自由度f n 1)
有限次测量平均值标准差 与单次测量值标准差的 关系
总体 抽出样本n x n , sx 例 若某样品经4次测
例 :n 4
s
x
1 2
sx
n 25
1 sx 5 sx
定,标准偏差是 20.5ppm,平均值是 144ppm。求平均值
注:通常3-4次或5-9次测定足够
的标准偏差。
2.平均值的置信区间
2 0.01
RE%
100% 0.1%
V
V 20mL
3.消除测量过程中的系统误差 1)校准仪器:消除仪器的误差 2)空白试验:消除试剂误差 3)对照实验:消除方法误差 4)校正方法 4.增加平行测定次数,一般测3~4次以减小偶然误差
总体平均值
x 有限次测量均值
(1)由单次测量结果估计μ的置信区间
x u
(2)由多次测量的样本平均值估计μ的置信区间
x u x
xu
n
(3)由少量测定结果均值估计μ的置信区间
x t sx
xt
sx n
x t, f
sx
x t, f
sx n
• 置信区间:一定置信度下,以测量结果为中心,包
4
47.60% 5.84 0.08% 47.60% 0.23%
4
测定结果离群值弃舍
Q检验法
Q计算
x离群 x邻近 xmax xmin
若Q计 Q表 ,则离群值应弃去.
例1 测定某溶液c,得结果: 0.1014, 0.1012, 0.1016, 0.1025,
问: 0.1025是否应弃去?(置信度为90%)
判断:
如t t, f ,则存在显著性差异 如t t, f ,则不存在显著性差异
例5-4:某化验室测定CaO的质量分数为30.43%的某样品中CaO
的含量,得如下结果:
问此测
定有无系统误差?(给定 = 0.05%)
x 30.51 30.43
t计算 s
n
0.05 6
3.92
t,f t0.95,5 2.57
u 1.96, x 1.96 95%
u ~ u
u 2, x 2
95.5%
u 2.58, x 2.58 9%
标准正态分布曲线 u x
正态分布与 t 分布区别
1.正态分布——描述无限次测量数据 t 分布——描述有限次测量数据
2.正态分布——横坐标为 u ,t 分布——横坐标为 t
4
x x2
s
0.08%
n 1
P 90% t0.10,3 2.35
47.60% 2.35 0.08% 47.60% 0.09%
4
P 95% t0.05,3 3.18 P 99% t0.01,3 5.84
47.60% 3.18 0.08% 47.60% 0.13%
t算 t表
有显著性差异
分析结果的数据处理与报告
(1)根据实验记录,将测定结果按大小排列 (2)用Q检验法检验有无离群值,并将离群值舍弃 (3) 根据所有保留值求出平均值、平均偏差、标准 偏差、变异系数CV (4)求出置信水平为95%时的置信区间
例题
用某种分析铁的方法测定含铁量为20.50%的标准样 品,得到如下结果:20.48,20.51,20.53,20.53, 20.54和20.60%,请回答下列问题:
➢ 偶然误差的区间概率P——用一定区间的积分面积表示 该范围内测量值出现的概率
➢ 从-∞~+∞,所有测量值出现的总概率P为1 ,即
(u) du
u2
1
e 2 1
2
u x
标准正态分布
区间概率%
正态分布
u 1, x 1
68.26%
概率积分表 u 1.64, x 1.64 90%
• 数据有离散性σ • 这种既分散又集
中的特性,就是 其规律性。 • 绘直方图 • 以组值范围为横 坐标,以频数为 纵坐标绘制直方 图。
0.2 0.1
图 5—3 相对频数分布直方图
第三节 有限实验数据的统计处理
一、偶然误差的正态分布
正态分布的概率密度函数式
y f (x)
1
( x )2
e 2 2
6
6.7%
1.545 1.575
6
6.7%
1.575 1.605
17
18.9%
1.605 1.635
22
24.4%
1.635 1.665
20
22.2%
1.665 1.695
10
11.1%
1.695 1.725
6
6.7%
1.725 1.755
1
1.1%

90
100%
4. 绘直方图
• 测量数据有明显 的集中趋势μ
• 为了研究测量数据分布的规律性,按 如下步骤编制频数分布表和绘制出频 数分布直方图,以便进行考察。
• 1. 算出极差 • R=1.74-1.49=0.25 • 2. 确定组数和组距 • 组数视样本容量而定,本例分成9组。
表3.1 频数分布表
分组
频数
相对频数
1.485 1.515
2
2.2%
相关主题