第四章环境规划与管理的数学基础第一节环境数据处理方法一、数据的表示方法1、列表法例:研究电阻的阻值与温度的关系时,测试结果如下:测量序号温度t/℃电阻R/Ω1 10.5 10.422 29.4 10.923 42.7 11.324 60.0 11.805 75.0 12.246 91.0 12.67 2、图示法⏹图示法的第一步就是按列表法的要求列出因变量y与自变量x相对应的y i与x i数据表格。
⏹作曲线图时必须依据一定的法则,只有遵守这些法则,才能得到与实验点位置偏差最小而光滑的曲线图形。
⏹坐标纸的选择--常用的坐标系为直角坐标系,包括笛卡尔坐标系(又称普通直角坐标系)、半对数坐标系和对数坐标系。
•半对数坐标系• 一个轴是分度均匀的普通坐标轴,另一个轴是分度不均匀的对数坐标轴。
• 右图中的横坐标轴(x 轴)是对数坐标。
在此轴上,某点与原点的实际距离为该点对应数的对数值,但是在该点标出的值是真数。
为了说明作图的原理,作一条平行于横坐标轴的对数数值线。
3、插值法计算数值 (1)作图插值法例:用分光光度计法测定溶液中铁的含量,测得标准曲线数据如下: Fe (μg/mL ) 2 4 6 8 10 12 吸光度(A ) 0.097 0.200 0.304 0.408 0.510 0.613 测得未知液的吸光度为0.413,试求未知液中铁的含量。
在图的纵坐标上0.413处找到直线上对应点,读出其对应的横坐标即为未知液中铁的含量 8.122(2)比例法半对数坐标的标度法工作曲线y = 0.0516x - 0.0061R 2 = 10.10.20.30.40.50.60.702468101214Fe的浓度(μg/mL)吸光度(A )(3)牛顿内插公式一般的非线性函数都可以展开为多项式(二)数据特征⏹ 数据特征是对环境总体状况进行估计判断的基础,是认识数据理论特性的基本出发点,通常可分为以下三类:⏹ 位置特征数:表示数据集中趋势或刻画频数分布图中心位置的特征数; ⏹ 离散特征数:用来描述数据分散程度;⏹ 分布形态特征数:刻划了根据所获数据绘制的分布曲线图的形态。
1. 位置特征数 (1)算术平均数:式中:x1, x2, …, xn 为样本个体数据,n 为样本个数(2)加权平均数如果样本个体数据x 1, x 2, …, x n 取值因频 数不同或对总体重要性有所差别,则常nxnx x x x ni in ∑==+++=121 ∑∑===++++++=ni ini ii nnn w wxw w w w x w x w x w x 11212211采取加权平均方法。
式中:wi 是个体数据出现频数,或是因该个体对样本贡献不同而取的不同的数值。
(5)中位数⏹ 环境数据有时显得比较分散,甚至个别的数据离群偏远,难以判断去留,这时往往用到中位数。
⏹ 样本数据依次排列(从大到小或者从小到大)居中间位置的数即为中位数,若数据个数为偶数,则中位数为正中两个数的平均值。
⏹ 只有当数据的分布呈正态分布时,中位数才代表这组数据的中心趋向,近似于真值。
1. 位置特征数⏹ 环境统计中常常用到几何平均数。
不同的平均值都有各自适用场合,选择的平均数指标应能反映数据典型水平,并非随意采用。
几何平均直径:2. 离散特征数3. 分布形态特征数3121/g 123p g(...)ln exp()==∑ 或 n n n N iid d d d n d d N二、异常数据的剔除⏹ 在处理实验数据的时候,我们常常会遇到个别数据偏离预期或大量统计数据结果的情况,如果我们把这些数据和正常数据放在一起进行统计,可能会影响实验结果的正确性,如果把这些数据简单地剔除,又可能忽略了重要的实验信息。
这里重要的问题是如何判断异常数据,然后将其剔除。
判断和剔除异常数据是数据处理中的一项重要任务,目前的一些方法还不是十分完善,有待进一步研究和探索。
⏹ 目前人们对异常数据的判别与剔除主要采用物理判别法和统计判别法两种方法。
⏹ 物理判别法就是根据人们对客观事物已有的认识,判别由于外界干扰、人为误差等原因造成实测数据偏离正常结果,在实验过程中随时判断,随时剔除。
⏹ 统计判别法是给定一个置信概率,并确定一个置信限,凡超过此限的误差,就认为它不属于随机误差范围,将其视为异常数据剔除。
⏹ 剔除异常数据实质上是区别异常数据由偶然误差还是系统误差造成的问题。
⏹ 若是人为因素的偶然误差就应剔除,如果没有足够的理由证实是偶然过失造成的时候,应对数据进行统计处理,采用一定的检验方法来决定取舍。
⏹ 本节着重介绍统计判别法。
1.拉依达准则若可疑数据xp 与样本数据之算术平均值的偏差的绝对值大于3倍(2倍)的标准偏差,即:则应将xp 从该组数据中剔除,至于选择3s 还是2s 与显著性水平α有关,显著性水平α表示的是检验出错的几率为α,或检验的可置信度为1-α。
3s 相当于显著水平=0.01,2s 相当于显著水平=0.05。
2. 格拉布斯准则用格拉布斯准则检验可疑数据x p 时,选取一定的显著性水平α ,若:s 23或s x x d p p >-=则应将x p 从该组数据中剔除, 称为格拉布斯检验临界值,可查相关表格得到。
以上准则是以数据按正态分布为前提的,当偏离正态分布, 特别是测量次数很少时,则判断的可靠性就差。
因此,对粗大误差除用剔除准则外,更重要的是要提高工作人员的技术水平和工作责任心。
另外, 要保证测量条件稳定,防止因环境条件剧烈变化而产生的突变影响。
3.狄克逊(dixon )法⏹ 狄克逊研究了n 次测量结果,按其数值大小排列成如下次序: ⏹ 当 x i 服从正态分布时⏹ 用不同的公式求得 f 值,再经过查表,得到相应的临界值,进行比较,若计算值>f(n ,α)视为异常值,舍弃;再对剩余数值进行检验,直到没有异常值为止。
狄克逊通过模拟实验认为:n ≤7,使用 f 10 ;8≤n ≤10,用 f 11 ;11≤n ≤13,用 f 21 ;n ≥14,用 f 22 效果好。
例题⏹ 用狄克逊法判断下列测试数据(40.02,40.15, 40.20,40.13,40.16)中的40.02是否应舍弃?⏹ 解:将数据排列,取 α =0.05⏹ 40.02 40.13 40.15 40.16 40.20⏹,0.611<0.642⏹ 所以40.02应保留。
(1)(2)()n χχχ≤≤≤三、数据的误差分析(一)几种误差的基本概念V绝对误差相对误差20.00 mL ±0.02 mL ±0.1%2.00 mL ±0.02 mL ±1.0%(二)误差的来源及分类1. 随机误差随机误差是在一定条件下以不可预知的规律变化着的误差。
这些偶然因素是操作者无法严格控制的,故无法完全避免随机误差。
但它的出现一般具有统计规律,大多服从正态分布。
2. 系统误差系统误差是指由某个或某些不确定的因素所引起的误差。
当条件一旦确定,系统误差就是一个客观上的恒定值,它不能通过多次测量取平均值的方法来消除,只能根据仪器的性能、环境条件或个人偏差等进行校正,使之降低。
3. 过失误差过失误差是由于操作人员不仔细、操作不正确等原因引起的,它是可以完全避免的。
(三)误差分析⏹误差可能是由于随机误差或系统误差单独造成的,还可能是两者的叠加。
误差分析中,常采用精密度、正确度和准确度来表示误差的性质。
⏹精密度反映了随机误差大小的程度,是指在相同条件下,对被测对象进行多次反复测量,测量值之间的一致(符合)程度。
⏹正确度指测量值与其“真值”的接近程度。
⏹对于一组数据来说,精密度高并不意味着正确度也高;反之,精密度不好,但当测量次数相当多时,有时也会得到好的正确度。
⏹准确度指被测对象测量值之间的一致程度以及与其“真值”的接近程度。
准确度、正确度和精密度的关系四、数据的标准化处理⏹在大批的环境统计数据中,当数据的物理量不同、单位或量值差别较大时,常常会给下一步分析带来困难,这时就有必要对数据进行标准化处理,从而提高计算的精度。
⏹环境管理与规划中,常采用下面的公式进行标准化处理:第二节最优化分析方法一、线性规划在环境规划管理中,线性规划常常用来解决两类优化问题:一是如何优化资源配置使产值最大或利润最高,二是如何统筹安排以便消耗最少的资源或排放最少的污染物。
一般线性规划问题的求解,最常用的算法是单纯形法。
二、非线性规划在环境规划与管理中,某些问题的决策模型可能会出现下面的情况:①目标函数非线性,约束条件为线性;②目标函数为线性,约束条件非线性;③目标函数与约束条件均为非线性函数。
上述情况均属于非线性规划问题,其数学模型的一般形式是:⏹数值求解非线性规划的算法大体分为两类:⏹一是采用逐步线性逼近的思想,通过一系列非线性函数线性化的过程,利用线性规划获得非线性规划的近似最优解;⏹二是采用直接搜索的思想,根据部分可行解或非线性函数在局部范围内的某些特性,确定迭代程序,通过不断改进目标值的搜索计算,获得最优或满足需要的局部最优解。
三、动态规划⏹在环境规划管理中,经常遇到多阶段最优化问题,即各个阶段相互联系,任一阶段的决策选择不仅取决于前一阶段的决策结果,而且影响到下一阶段活动的决策,从而影响到整个决策过程的优化问题。
这类问题通常采用动态规划方法求解。
⏹基本原理为:作为多阶段决策问题,其整个过程的最优策略应具有这样的性质,即无论过去的状态和决策如何,对前面的决策所形成的状态而言,其后一系列决策必须构成最优决策。
⏹可以把多阶段决策问题分解成许多相互联系的小问题,从而把一个大的决策过程分解成一系列前后有序的子决策过程,分阶段实现决策的“最优化”,进而实现“总体最优化”方案。
为使最后决策方案获得最优决策效果,动态规划求解可用下列递推关系式表示:第三节常用决策分析方法⏹决策是指通过对解决问题备选方案的比较,从中选出最好的方案。
⏹决策贯穿于环境管理与规划的各个方面,是管理与规划的核心。
决策技术⏹技术经济分析中的决策,是指对多方案进行评价与择优,从而选定一个最满意的方案。
⏹决策的分类⏹按决策的条件⏹确定型⏹非确定型⏹风险型⏹按决策的对象⏹宏观⏹微观⏹按决策在企业组织中的地位分类⏹高层决策⏹中层决策⏹基层决策决策树法⏹决策树技术的含义⏹是把方案的一系列因素按它们的相互关系用树状结构表示出来,再按一定程序进行优选和决策的技术方法。
⏹决策树技术的优点⏹便于有次序、有步骤、直观而又周密地考虑问题;⏹便于集体讨论和决策;⏹便于处理复杂问题的决策。
决策树图形⏹适用对象⏹多阶段决策、前一阶段的决策影响后续阶段的结构和决策的项目。
⏹方法⏹用决策树的形式列出决策问题的逻辑结构。
⏹从决策树的末端向决策点倒退,计算出不同决策方案下的期望值,将未占优的方案去掉,直到得出初始的决策方案。