环境监测数据统计基础
.
6
误差
• 误差指分析测定值与真实值之差。根据生产的原因 可分为系统误差(可测误差)偶然误差(随机误差)及 粗差(过失误差)。
• 系统误差和偶然误差并没有绝对严格的界限,有时 人们对系统误差的复杂规律认识不清,往往把系统 误差当作偶然误差来处理。
• 偏差指分析测定值与平均值之差.反映数据之间的 离散程度。偏差大小既与方法本身的精确与否,也 与实验人员的操作水平有关。通常人们以平均值代 替真实值计算误差,严格说来应称作偏差。
绝对偏差是测量值与真值之差; di xi x
相对偏差是绝对偏差与真值之比
相对偏 d差 10% 0 x
平均偏差是绝对偏差绝对值之和的平均值
d
1 n
n i1
di
相对平均偏差是平均偏差与均值之比(常以
百分数表示) 相对平均偏 d1差0% 0
.
x
11
样本特征数的计算
• 有环境总体随机抽取的样本数据,可以代入一些 函数式通过计算得到一些计算值来描述该样本的 某些重要性,这些计算值成为样本特征数,又称 为统计量。
.
4
有效数字一般运算规则
• 有效数字个数:第一位非零数字后的数字数目. • 一般来说,非零数字中间的“0”均为有效数字,如
2008;在第一个非零数字前的“0”不作为有效数字 如0.0167和16.7都有三位有效数字. • 16.7毫升和16.70毫升代表了两种精密度,小数点后 的“0”不能随便加上和舍去. • “四舍六入五单双”的原则:有效数字后面的数字 按照此原则修约,14.9241-14.92,14.9260- 14.93,14.9250-14.92,14.9150-14.92, 14.9251-14.93 • 加减计算中结果的误差限应与数中误差限最大的那 一个相同;如在运算会导致效数字变化较大,则要 考虑尽量避免此类运算。
.
3
2.1.1 数据整理和样本特征计算
2.1.1.1有效数字一般运算规则
• 不管测量仪器,还是数字显示仪表,其准确度都是 有限的,有“观测误差”,对结果进行数值计算会 存在“舍入”、“纳入”等误差。
• 得到的近似值与真实值R有一定的误差 • 测定误差为最小刻度单位的1/2,例如滴定管和米尺
的读数。如滴定读数19.23毫升-- [19.225,19.235],某人身高172.0厘米-- [171.5,172.5]
.
13
•权
• 加权平均值
• 计算用不同方法或不同条件下对同一样本得到的测定位的平 均值时,因为方法及条件不同.其数值的精度与测定次数可 能不一致,可靠程度也有差异。要把这些因素反映出来,常 对不同的数据结以不同酌“权”,即是对一系列不同条件下 得到的测定值,用数学的方法对其印好的测定值给予大的信 任,在计算平均值时,使好的测定值占有较大的比例。所谓 加权就是对精度较高的测定值乘一个较大的系数,对精度较 差的测定值乘一个较小的系抵达个系数就称为“权”
.
5
• 在乘除计算中,结果有效数字与各数中位数最少者相同。
• 近似值的平方(根)、立方(根)或多次方(根)运算时, 计算结果的有效数字位数与原数相同。
• 对有效数字的第一位等于或大于8的数值进行计算时,可以 多算一位,如0.0894十分接近0.1000,因此可以把该数认为 有四位有效数字。
• 由于测定平均值的精度要优于个别测定值的精度,因此,在 计算准确度相同四个或四个以上的测定值的平均值时,结果 有效数字位数可以增加一位。
2、总体方差和总体标准偏差分别以σ2和σ表示
3、样本标准偏差用s或sD表示
4、样本方差用s2或V表示 分单个样本和多个样本
m ni
2
( xij X j)
S j1 i1
ni m
5、样本相对标准偏差:又称变异系数,是样本标准偏差在样 本均值中所占的百分数,
记为CV : 6、表极示差误:差一的组范测围量,值以中R最表大示值,R(=xxmmaaxx-)xm与in 最小值(xmin)之差,
• 算术平均值
• 中位数Me
n为基数时候 为
当n为偶数时 1
2
(xn
x n 1 ) 2
• 众数M0 出现次数最x n 2多1 的变量值
• 几何均数G n个变量值的几何数等于这些数的乘积
的n次方根,也可以用变量值的对数表示,例题见
书中P35
.
12
标准偏差和相对标准偏差
1、差方和:亦称离差平方或平方和。是指绝对偏差的平方之 和,以S表示。
.
9
精密度与准确度图示
精密度好 准确度好
绿色圆点为真实值, 红色为测定值
精密度差 准确度差
精密度好 准确度差
首先要考虑精密度,其次要考虑准确度。
在系统误差已消除的情况下,. 精密度愈高分析结果愈准确;
若有系统误差存在,则精密度高、准确度不一定高。
10
• 偏差
单次值与多次测量平均值之比(均值代真值)
随机样本和样本容量。
.
2
基本概念
• 总体(或称母体)指从研究对象得到的所有可能 的观测结果。样本(或称子样)指从总体中抽取 出来的一部分样品的测定值。样本中样品的个 数称为样本大小(或容量),当n>30时,称为大 样本。
• 必须指出,使用数理统计方法仅仅是分工作者 解决问题的有力工具,它不能代替严格的试验 工作;而恰恰相反,它只能在可靠的分行测试 基础上,才能发挥其应有的作用。
• 对于计算式中的常数e等以及乘除因子如 3 ,1/6之类的数值 的有效数值位数可以认为是无限的。
• 在对数计算时所取的位数(不包括首数)应与真数的有效数 字位数一致
• 对于标准偏差等表示测定精度的修约,一般情况下最多只取 两位有效数字,测定次数大于50可多取一位。注意对标准差 等修约只进不舍,如计算出的标准偏差为0.213时,则应修 约为0.22而不是0.21,修约不会提高精密度的
第二讲
环境监测数据统计基础
.
1
2.1 概述
• 环境监测会收集到大量的环境监测数据。 • 对同一环境样品多次重复测定得到的结果会
彼此不同。 • 我们的任务是去伪存真,认识和握误差产
生的原因及规律。 • 其是以概率为基础的分析法,是识别误差的
科学方法,是分析环境监测数据的必须工具 • 统计分析包括统计叙述和统计推断两部分。 • 总体和样本的定义:有限总体,无穷总体,
.
7
基本概念 Ⅱ 误差和偏差
• 误差 绝对误差 测量值与真值之差 相对误差 误差与真值之比,百分数
.
8
精密度的几种表示方法
• 精密度和淮确度:精密度指测得的数据之间 重复的程度,反映偶然误差的大小。准确度 指测定值与真实值(或多次测定平均值)符合的 程度,反映偶然误差和系统误差的大小。评 定分析数据的好坏,首先要考虑精密度,其 次要考虑准确度。一般来说在系统误差已消 除的情况下,精密度愈高分析结果愈准确。 但若有系统误差存在,则精密度高、准确度 不一定高。如图所示。