当前位置:文档之家› 环境监测数据统计基础2-1

环境监测数据统计基础2-1


• 在乘除计算中,结果有效数字与各数中位数最少者相同。 在乘除计算中,结果有效数字与各数中位数最少者相同。 • 近似值的平方(根)、立方(根)或多次方(根)运算时, 近似值的平方( )、立方( 立方 或多次方( 运算时, 计算结果的有效数字位数与原数相同。 计算结果的有效数字位数与原数相同。 • 对有效数字的第一位等于或大于8的数值进行计算时,可以 对有效数字的第一位等于或大于8的数值进行计算时, 多算一位, 0.0894十分接近0.1000, 十分接近0.1000 多算一位,如0.0894十分接近0.1000,因此可以把该数认为 有四位有效数字。 有四位有效数字。 • 由于测定平均值的精度要优于个别测定值的精度,因此,在 由于测定平均值的精度要优于个别测定值的精度,因此, 计算准确度相同四个或四个以上的测定值的平均值时, 计算准确度相同四个或四个以上的测定值的平均值时,结果 有效数字位数可以增加一位。 有效数字位数可以增加一位。 • 对于计算式中的常数e等以及乘除因子如 3 ,1/6之类的数值 对于计算式中的常数e 1/6之类的数值 的有效数值位数可以认为是无限的。 的有效数值位数可以认为是无限的。 • 在对数计算时所取的位数(不包括首数)应与真数的有效数 在对数计算时所取的位数(不包括首数) 字位数一致 • 对于标准偏差等表示测定精度的修约,一般情况下最多只取 对于标准偏差等表示测定精度的修约, 两位有效数字,测定次数大于50可多取一位。 50可多取一位 两位有效数字,测定次数大于50可多取一位。注意对标准差 等修约只进不舍,如计算出的标准偏差为0.213 0.213时 等修约只进不舍,如计算出的标准偏差为0.213时,则应修 约为0.22而不是0.21 0.22而不是0.21, 约为0.22而不是0.21,修约不会提高精密度的
21
偶然误差与概率关系
测定值或误差出现的概率95.5%,99.7%等称为置信概率或置信水平、置信度 (P).P=1-α, α称为显著性水平
22
环境监测数据场均按分布函数
• 两点分布 • 二项分布 • 泊松分布 应用在大气中颗粒数浓度进行监测,对 交叉路口的车流量进行统计、测定一个时间 间隔里放射性物质的衰变数等。 • 正态分布和对数分布 • 几种抽样分布
7
基本概念 Ⅱ 误差和偏差
• 误差 绝对误差 测量值与真值之差 误差与真值之比, 相对误差 误差与真值之比,百分数
8
精密度的几种表示方法
• 精密度和淮确度:精密度指测得的数据之间 重复的程度,反映偶然误差的大小。准确度 指测定值与真实值(或多次测定平均值)符合的 程度,反映偶然误差和系统误差的大小。评 定分析数据的好坏,首先要考虑精密度,其 次要考虑准确度。一般来说在系统误差已消 除的情况下,精密度愈高分析结果愈准确。 但若有系统误差存在,则精密度高、准确度 不一定高。如图所示。
S=
m
∑∑ ( x
j =1 i =1 i
ni
2 ij
− Xj )
∑n −m
5、样本相对标准偏差:又称变异系数,是样本标准偏差在样 、样本相对标准偏差:又称变异系数, 本均值中所占的百分数, 本均值中所占的百分数, 记为CV : 记为 6、极差:一组测量值中最大值(xmax)与最小值(xmin)之差, 与最小值( 之差, 、极差:一组测量值中最大值( 表示误差的范围, 表示,R=xmax-xmin 表示误差的范围,以R表示 表示
9
精密度与准确度图示
精密度好 准确度好
绿色圆点为真实值, 红色为测定值
精密度差 准确度差 精密度好 准确度差
首先要考虑精密度,其次要考虑准确度。 在系统误差已消除的情况下,精密度愈高分析结果愈准确; 若有系统误差存在,则精密度高、准确度不一定高。
10
• 偏差 单次值与多次测量平均值之比(均值代真值) 单次值与多次测量平均值之比(均值代真值) 绝对偏差是测量值与真值之差 是测量值与真值之差; 绝对偏差是测量值与真值之差;d = x − x d 相对偏差 = × 100% 相对偏差是绝对偏差与真值之比 相对偏差是绝对偏差与真值之比 x 平均偏差是绝对偏差绝对值之和的平均值 是绝对偏差绝对值 平均偏差是绝对偏差绝对值之和的平均值
6
误差
• 误差指分析测定值与真实值之差。根据生产的原因 误差指分析测定值与真实值之差。 指分析测定值与真实值之差 可分为系统误差(可测误差)偶然误差(随机误差) 可分为系统误差(可测误差)偶然误差(随机误差)及 粗差(过失误差) 粗差(过失误差)。 • 系统误差和偶然误差并没有绝对严格的界限,有时 系统误差和偶然误差并没有绝对严格的界限, 人们对系统误差的复杂规律认识不清, 人们对系统误差的复杂规律认识不清,往往把系统 误差当作偶然误差来处理。 误差当作偶然误差来处理。 • 偏差指分析测定值与平均值之差.反映数据之间的 偏差指分析测定值与平均值之差 指分析测定值与平均值之差. 离散程度。偏差大小既与方法本身的精确与否, 离散程度。偏差大小既与方法本身的精确与否,也 与实验人员的操作水平有关。 与实验人员的操作水平有关。通常人们以平均值代 替真实值计算误差,严格说来应称作偏差。 替真实值计算误差,严格说来应称作偏差。
2
基本概念
• 总体(或称母体)指从研究对象得到的所有可能 的观测结果。样本(或称子样)指从总体中抽取 出来的一部分样品的测定值。样本中样品的个 数称为样本大小(或容量),当n>30时,称为大 样本。 • 必须指出,使用数理统计方法仅仅是分工作者 解决问题的有力工具,它不能代替严格的试验 工作;而恰恰相反,它只能在可靠的分行测试 基础上,才能发挥其应有的作用。
13
• 权 • 加权平均值
• 计算用不同方法或不同条件下对同一样本得到的测定位的平 均值时,因为方法及条件不同.其数值的精度与测定次数可 能不一致,可靠程度也有差异。要把这些因素反映出来,常 对不同的数据结以不同酌“权”,即是对一系列不同条件下 得到的测定值,用数学的方法对其印好的测定值给予大的信 任,在计算平均值时,使好的测定值占有较大的比例。所谓 加权就是对精度较高的测定值乘一个较大的系数,对精度较 差的测定值乘一个较小的系抵达个系数就称为“权”
4
有效数字一般运算规则
• 有效数字个数:第一位非零数字后的数字数目. • 一般来说,非零数字中间的“0”均为有效数字,如 2008;在第一个非零数字前的“0”不作为有效数字 如0.0167和16.7都有三位有效数字. • 16.7毫升和16.70毫升代表了两种精密度,小数点后 的“0”不能随便加上和舍去. • “四舍六入五单双”的原则:有效数字后面的数字 按照此原则修约,14.9241-14.92,14.9260- 14.93,14.9250-14.92,14.9150-14.92, 14.9251-14.93 • 加减计算中结果的误差限应与数中误差限最大的那 一个相同;如在运算会导致效数字变化较大,则要 考虑尽量避免此类运算。 5
i i
1 n d = ∑ di n i=1
相对平均偏差是平均偏差与均值之比( 相对平均偏差是平均偏差与均值之比(常以 是平均偏差与均值之比 百分数表示) 百分数表示) 相对平均偏差 = d × 100%
x
11
样本特征数的计算
• 有环境总体随机抽取的样本数据,可以代入一些 有环境总体随机抽取的样本数据, 函数式通过计算得到一些计算值来描述该样本的 某些重要性,这些计算值成为样本特征数, 某些重要性,这些计算值成为样本特征数,又称 为统计量。 为统计量。 • 算术平均值 • 中位数Me 中位数 1 n为基数时候 为 为基数时候 当n为偶数时 2 (x + x ) 为偶数时 x • 众数M0 出现次数最多的变量值 众数M • 几何均数G n个变量值的几何数等于这些数的乘积 几何均数G n个变量值的几何数等于这些数的乘积 次方根,也可以用变量值的对数表示, 的n次方根,也可以用变量值的对数表示,例题见 书中P35 书中P35
3
2.1.1 数据整理和样本特征计算
2.1.1.1有效数字一般运算规则
• 不管测量仪器,还是数字显示仪表,其准确度都是 有限的,有“观测误差”,对结果进行数值计算会 存在“舍入”、“纳入”等误差。 • 得到的近似值与真实值R有一定的误差 • 测定误差为最小刻度单位的1/2,例如滴定管和米尺 的读数。如滴定读数19.23毫升-- [19.225,19.235],某人身高172.0厘米-- [171.5,172.5]
17
统计图表
• • • • • • 统计图 P43 A 条图 百分条图 百分位数条图 圆图和放射状图 线图
18
19
•Q值法
20
有关正态分布的定理
• 假设X为服从正态 N(µ x,σx2),Y为服从正态 N(µ y,σy2)而又相互独立的两个随机变量,则随 机变量X+Y服从N(µ x+µ y ,σy2+σy2)而X-Y服从 N(µ x-µ y ,σy2+σy2). • 由正态N(µ x,σx2),抽取一个容量为n的随机样本, 其独立变量为xi,则
n
d. 判断假设是否成立:t≤t0.05(f),则无显著性差异 判断假设是否成立: , t>t0.05(f),则有显著性差异 > , 双侧检验和单侧检验。 注:双侧检验和单侧检验。 统计检验有两类。通常我们只关心总体均值µ是否等于已知值 统计检验有两类。通常我们只关心总体均值 是否等于已知值 x,至于二者究竟那个大,对所研究的问题并不重要。这种情 ,至于二者究竟那个大,对所研究的问题并不重要。 况的假设为µ=x,否定假设为 况的假设为 ,否定假设为x≠µ。 。
第二讲
环境监测数据统计基础
1
2.1 概述
• 环境监测会收集到大量的环境监测数据。 • 对同一环境样品多次重复测定得到的结果会 彼此不同。 • 我们的任务是去伪存真,认识和掌握误差产 生的原因及规律。 • 其是以概率为基础的分析法,是识别误差的 科学方法,是分析环境监测数据的必须工具 • 统计分析包括统计叙述和统计推断两部分。 • 总体和样本的定义:有限总体,无穷总体, 随机样本和样本容量。
相关主题