当前位置：文档之家› 有限实验数据的统计处理

有限实验数据的统计处理

解：先检验0.3018是否应舍去。查表Q 0.90,4 =0.76, 根据Q检验法有
0.3034-0.3018
Q=
=0.67
0.3042-0.3018
因Q计算 < Q 0.90,4 (0.76),故0.3018应该保留（P＝ 0.90）。如第5次测定得一最低值x1 ,因此
Q1= 0.3018-x1 0.3042-x1
0.1025 0.1016 Q计算 0.1025 0.1012 0.69 Q0.90(4) 0.76
0.1025应该保留 x 0.1017
例2 4次测定某试样中氯的质量分数，结果分别为0.3018、0.3034、0.3038和0.3042。如再测定一次，那么用Q法检验时，可以保留的最低值或最高值各应为多少（P=0.90）？
1.总体（母体） 2.样本（子样） 3.样本大小
x
随机误差的正态分布
• 随机事件以统计形式表现的规律性称为统计规律。
• 随机误差对测定结果的影响是服从统计规律的。
• 1. 频率分布
• 例如有一矿石样品，在相同条件下测定Ni的百分含量。共有90个测定值，这些测定值彼此独立，属随机变量。
1.60 1.67 1.67 1.64 1.58 1.64 1.67 1.62 1.57 1.60 1.59 1.64 1.74* 1.65 1.64 1.61 1.65 1.69 1.64 1.63 1.65 1.70 1.63 1.62 1.70 1.65 1.68 1.66 1.69 1.70 1.70 1.63 1.67 1.70 1.70 1.63 1.57 1.59 1.62 1.60 1.53 1.56 1.58 1.60 1.58 1.59 1.61 1.62 1.55 1.52 1.49* 1.56 1.57 1.61 1.61 1.61 1.50 1.53 1.53 1.59 1.66 1.63 1.54 1.66 1.64 1.64 1.64 1.62 1.62 1.65 1.60 1.63 1.62 1.61 1.65 1.65 1.64 1.63 1.54 1.61 1.60 1.64 1.65 1.59 1.58 1.59 1.60 1.67 1.68 1.69
2
1．x 表示测量值，y 为测量值出现的概率密度
2．正态分布的两个重要参数
（1）μ为无限次测量的总体均值，表示无限个数据的
集中趋势（无系统误差时即为真值）
（2）σ是总体标准差，表示数据的离散程度
3．x -μ为偶然误差
以x-μ～y作图
y f (x)
1
( x )2
e 2 2
2
x
特点
➢ x =μ时，y 最大→大部分测量值集中在算术平均值附近
➢ 曲线以x =μ的直线为对称→正负误差出现的概率相等
➢ 当x →﹣∞或﹢∞时，曲线渐进x 轴，小误差出现的几率大，大误差出现的
几率小，极大误差出现的几率极小
➢ σ↑，y↓, 数据分散，曲线平坦
σ↓，y↑, 数据集中，曲线尖锐
➢ 测量值都落在－∞～＋∞，总概率为1
y f (x) 1
2
二. 平均值的置信区间（一）偶然误差的区间概率
2．减小测量误差 1）称量
例：天平一次的称量误差为 0.0001g，两次的称量误差为 0.0002g，RE% 0.1%，计算最少称样量？
2 0.0001
RE%
100% 0.1%
w
w 0.2000g
2）滴定例：滴定管一次的读数误差为0.01mL，两次的读数误差为 0.02mL，RE% 0.1%，计算最少移液体积？
括总体均值的可信范围
• 平均值的置信区间：一定置信度下，以测量结果的
均值为中心，包括总体均值的可信范围
• 置信限： u
x u
t s
x
➢ 结论：
置信度越高，置信区间越大，估计区间包含真值的可能性↑ 置信区间——反映估计的精密度置信度——说明估计的把握程度
练习
例1：如何理解 47.50% 0.10%置信度P 95%
x2-0.3018
解之得x2＝0.3083 依题意，如再测定一次，可以保留得最低值和最高值分别为0.2975和0.3083（P=0.90）。
显著性检验
总体均值的检验——t检验法
平均值与标准值比较——已知真值的t检验（准确
度显著性检验）
x
由 x t s n t
n
s
在一定P时，查临界值表 t，f (自由度f n 1)
有限次测量平均值标准差与单次测量值标准差的关系
总体抽出样本n x n , sx 例若某样品经4次测
例：n 4
s
x
1 2
sx
n 25
1 sx 5 sx
定，标准偏差是 20.5ppm，平均值是 144ppm。求平均值
注：通常3-4次或5－9次测定足够
的标准偏差。
2．平均值的置信区间
2 0.01
RE%
100% 0.1%
V
V 20mL
3．消除测量过程中的系统误差 1）校准仪器：消除仪器的误差 2）空白试验：消除试剂误差 3）对照实验：消除方法误差 4）校正方法 4．增加平行测定次数，一般测3～4次以减小偶然误差
总体平均值
x 有限次测量均值
（1）由单次测量结果估计μ的置信区间
x u
（2）由多次测量的样本平均值估计μ的置信区间
x u x
xu
n
（3）由少量测定结果均值估计μ的置信区间
x t sx
xt
sx n
x t, f
sx
x t, f
sx n
• 置信区间：一定置信度下，以测量结果为中心，包
4
47.60% 5.84 0.08% 47.60% 0.23%
4
测定结果离群值弃舍
Q检验法
Q计算
x离群 x邻近 xmax xmin
若Q计 Q表 ,则离群值应弃去.
例1 测定某溶液c,得结果: 0.1014, 0.1012, 0.1016, 0.1025,
问: 0.1025是否应弃去?(置信度为90%)
判断：
如t t, f ，则存在显著性差异如t t, f ，则不存在显著性差异
例5-4:某化验室测定CaO的质量分数为30.43%的某样品中CaO
的含量，得如下结果：
问此测
定有无系统误差？(给定 = 0.05%)
x 30.51 30.43
t计算 s
n
0.05 6
3.92
t，f t0.95,5 2.57
u 1.96, x 1.96 95%
u ~ u
u 2, x 2
95.5%
u 2.58, x 2.58 9%
标准正态分布曲线 u x
正态分布与 t 分布区别
1．正态分布——描述无限次测量数据 t 分布——描述有限次测量数据
2．正态分布——横坐标为 u ，t 分布——横坐标为 t
4
x x2
s
0.08%
n 1
P 90% t0.10,3 2.35
47.60% 2.35 0.08% 47.60% 0.09%
4
P 95% t0.05,3 3.18 P 99% t0.01,3 5.84
47.60% 3.18 0.08% 47.60% 0.13%
t算 t表
有显著性差异
分析结果的数据处理与报告
（1）根据实验记录，将测定结果按大小排列（2）用Q检验法检验有无离群值，并将离群值舍弃（3）根据所有保留值求出平均值、平均偏差、标准偏差、变异系数CV （4）求出置信水平为95％时的置信区间
例题
用某种分析铁的方法测定含铁量为20.50％的标准样品，得到如下结果：20.48，20.51，20.53，20.53， 20.54和20.60％，请回答下列问题：
➢ 偶然误差的区间概率P——用一定区间的积分面积表示该范围内测量值出现的概率
➢ 从－∞～＋∞，所有测量值出现的总概率P为1 ，即
(u) du
u2
1
e 2 1
2
u x
标准正态分布
区间概率%
正态分布
u 1, x 1
68.26%
概率积分表 u 1.64, x 1.64 90%
• 数据有离散性σ • 这种既分散又集
中的特性，就是其规律性。 • 绘直方图 • 以组值范围为横坐标，以频数为纵坐标绘制直方图。
0.2 0.1
图 5—3 相对频数分布直方图
第三节有限实验数据的统计处理
一、偶然误差的正态分布
正态分布的概率密度函数式
y f (x)
1
( x )2
e 2 2
6
6.7%
1.545 1.575
6
6.7%
1.575 1.605
17
18.9%
1.605 1.635
22
24.4%
1.635 1.665
20
22.2%
1.665 1.695
10
11.1%
1.695 1.725
6
6.7%
1.725 1.755
1
1.1%
∑
90
100%
4. 绘直方图
• 测量数据有明显的集中趋势μ
• 为了研究测量数据分布的规律性，按如下步骤编制频数分布表和绘制出频数分布直方图，以便进行考察。
• 1. 算出极差 • R=1.74-1.49=0.25 • 2. 确定组数和组距 • 组数视样本容量而定，本例分成9组。
表3.1 频数分布表
分组
频数
相对频数
1.485 1.515
2
2.2%

e商务文档

有限实验数据的统计处理

相关文档推荐：