大气污染评价与预报模型摘要本文对空气质量的评价及污染预报问题进行了分析,运用层次分析法依据处理后的数据对六个城市的空气质量进行了具体细致的排序;对2010年9月15日至9月21日的各项污染物浓度、各气象参数运用一元多项式回归模型进行了预测;就气象参数所属城市问题及污染物浓度与其的关系建立了相关性分析模型和多元线性回归模型;最后,根据建模过程和结果,我们对相关部门提出了几个具体的建议。
通过将数据附件所给有效数据,即日污染物浓度,转化为对应的月污染物浓度的均值,根据各城市月均污染浓度做出其随时间的走势折线图,分析了各个城市2SO 、2NO 、PM10之间的特点。
我们拟根据API 指数值,以二级达标次数为准,对各城市之间的空气质量进行排名,但由于依据API 的区分空气质量等级时灵敏度较低,故采用了层次分析法对空气质量进行排名。
由于我们采用了全部数据进行排名,而E 、F 数据较少,故只对ABCD 进行了排名。
依据层次分析法得出的排名为:A 、B 、D 、C 。
为了精确预测各城市短期内的数据,本文选用一元多项式回归模型。
对2010年的数据进行分析整理,依据回归模型得出其与时间的关系,得出预测值,并得出其置信度为95%的置信区间,结果显示模型的预测效果尚能接受,能够对所要预测数据进行预测。
但由于F 城市数据缺失,根据假设做了合理的定性分析,并未对其进行定量预测。
分析空气质量与气象参数之间的关系时,首先根据数据完整性,气象参数应只属于其中一个城市,排除了D 、E 、F 的可能性,再根据相关性分析的方法,确定了气象参数属于A 城市。
根据污染物与气象参数之间的因果关系,建立了多元线性回归模型,由于季节对污染物的浓度存在影响,分季节得出各污染物与各气象参数之间的相关系数,定性分析该相关系数,得出污染物与气象参数之间的关系。
最后对该系数的理论与实际意义做了检验。
根据以上分析及结果,确定部分与空气质量控制相关的部门,针对其职能提出了诚恳建议。
关键词:API 评价模型 层次分析 一元多项式回归模型 相关性分析 多元回归一、 问题重述大气是指包围在地球外围的空气层,是地球自然环境的重要组成部分之一。
人类生活在大气里,洁净大气是人类赖于生存的必要条件。
随着地球上人口的急剧增加,人类经济增长的急速增大,地球上的大气污染日趋严重,其影响也日趋深刻。
因此,加强大气质量的监测和预报是非常必要。
目前对大气质量的监测主要是监测大气中2SO 、2NO 、悬浮颗粒物(主要为PM10)等的浓度,研究表明,城市空气质量好坏与季节及气象条件的关系十分密切。
现有城市A 、B 、C 、D 、E 、F 从2003年3月1日至2010年9月14日测量的污染物含量及气象参数的数据。
1. 找出各个城市2SO 、2NO 、PM10之间的特点,并将几个城市的空气质量进行排序。
???2. 对未来一周即2010年9月15日至9月21日各个城市的2SO 、2NO 、PM10以及各气象参数作出预测。
3. 分析空气质量与季节、气象参数之间的关系。
4. 就空气质量的控制对相关部门提出你的建议。
二、 问题分析问题一寻找各城市SO2、NO2、PM10的特点,最直观的方法就是作图,把各城市的三种污染物浓度做到一张图中进行比较分析可较容易的得到其特点, 而排序题目中给出的是三种污染物浓度,必须先用一个指标将它们统一起来综合的对城市的空气质量进行评价,用同一个指标进行排序。
问题二是依据所给的2010年1月1日至9月14日的数据,预测2010年9月15日至9月21日各个城市的SO2、NO2、PM10以及各气象参数,预测的时期较短,数目多,选择时间序列进行预测。
同时将数据序列选取为2010年所有测量日的数据。
根据给定的数据,利用一元多项式回归,求得回归模型,从而预测出需要的7项数据,并进行预测误差估计。
问题三是研究2SO 、2NO 、PM10的浓度与气象参数之间的关系。
首先应对六个城市的2SO 、2NO 、PM10的浓度同气象参数进行相关性检验,以找出气象参数与2SO 、2NO 、PM10的浓度的对应关系。
又由于城市空气质量好坏与季节及气象条件的关系十分密切。
故分季节对2SO 、2NO 、PM10的浓度与气象参数进行回归分析,并进行检验。
问题四则是通过对气象参数,季节等因素的考量,分析得出提高空气质量减小2SO 、2NO 、PM10的浓度的方法,从而给有关部门提出合理性的建议。
三、 模型假设1. 各城市的检测时间具有随机性;2. F 城市的发展是平衡发展,政府对环境治理干预较小,即F 城市的环境不会出现强烈波动;3. 数据附件所给的各个城市的污染物浓度及气象参数不随测量地点的改变而改变,且有效数据都准确可靠。
同时不考虑人为因素,检测仪器精确度不同的影响具有统计、预测意义;4. 在对预测期内即2010年9月15日至9月21日时间段内,各个城市不会出现重大空气污染事故,或环境不会变好;5. 城市空气质量好坏与气象条件的关系十分密切,与其他因素关系不大。
四、 符号说明五、 模型的建立和求解(一)找出各个城市2SO 、2NO 、PM10之间的特点,并将几个城市的空气质量进行排序数据处理:剔除1.第86项2005年的,与前后年份不符很明显是错误数据;2.第986项气压值的明显错误。
大气污染程度与空气中有害气体的含量有关,根据题目要求我们只考虑SO2、NO2、PM10的影响,由于数据量大我们按月为周期计算出了每个城市每种污染物浓度的月平均值,据此画出折线图从而观察分析其特点。
对于排序问题,我们参考相关资料采用了判断大气污染的空气污染指数(API ),API 的计算依据为其中,I 为某污染物的污染指数,C 为该污染物的污染浓度。
C 大与C 小分别为上表中最贴近C 值的两个限值,C 大为大于C 的限值,C 小为小于C 的限值,同样,I 大与I 小也是最靠近C 值的两个限值。
得出每种污染物的月平均污染指数。
取三种污染物中API 中的最大值作为该市的月平均污染指数。
等级判断标准:我们采用层次分析法对来处理,最终得到方案层对目标层权重,进行排序。
①建立以各个城市为方案层,空气质量为准侧层,空气质量排名为目标层的层次分析模型,由于E 、F 市数据过少,这里我们只考虑A 、B 、C 、D 市的排名,层次图如下②根据两两比较法建立准则层对目标层的判断矩阵A根据等级的1—9比较尺度定性的两两比较得到判断矩阵A 计算出权重向量E②建立方案层对准则层的判断矩阵B根据我们求得的各城市每月空气污染指数统计得从而再次利用两两比较法分别得到各城市对不同空气等级的判断矩阵Bi ,根据特征根法确定权重向量F=(w1,w2,w3,w4,w5)通过一致性检验后,由W=TE F得到最终方案层对目标层的权重,它表示的是受污染程度的权重,所以权重越大,受污染程度越高,空气质量越差。
求解用Matlab 作图得到各城市直线图,下图中蓝色的实线为SO2浓度折线图,红色的虚线为PM10的浓度折线图,黑色的点线为NO2浓度折线图。
空气质量排名ⅠⅡⅤⅢ Ⅳ 城市D城市A 城市B城市C从图中可看出A城市中SO2指数除前几个月有明显上升外,有明显的下降趋势,大部分低于PM10的指数,且变化与PM10有一定的一致性。
PM10指数有较明显的振荡,但总体变化不是很大。
NO2指数普遍最低,较平稳。
B城市的SO2、PM10变化很是相似,都以较大的幅度振荡且总趋势是下降的。
SO2的振荡更明显,NO2指数均低于前两种污染物指数,较平稳。
与A、B一样C市中SO2、PM10的振荡具有一致性,但C市的PM10普遍比SO2高,且在20~25月左右有十分明显的上升,SO2振荡幅度不是很大,较平稳。
D市中SO2和PM10又出现大幅度的振荡总体趋于降低的趋势,NO2指数还是最低最平稳。
E 市中PM10指数高于另两种指数,在5月和22月左右各出现一次大幅度振荡,且下降趋势不明显,SO2指数在PM10下振荡下降,NO2出项小幅的振荡但总体平稳。
F 市数据太少,仅有的三个月数据看较平稳,但数据太少不足信。
1根据两两比较的到准则层对目标层的判断矩阵A A=11/21/31/41/5212/32/42/533/213/43/544/24/314/555/25/35/41⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦计算的max)(λ=,CI=0,CR1=0,一致性通过,所以得到权向量 E= (0.1238,0.1599,0.3857,0.3317)T又根据表3得到方案层对准则层的判断矩阵BB1=15/35/1153/513/11311/511/31111/51/31/111⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦B2= 140/3240/234/331/40131/2331/3023/4023/31123/303/430/3130/231⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦B3=115/2515/2115/1825/15125/2125/1821/1521/25121/1818/1518/2518/211⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦ B4=11/21/41/4211/21/242114211⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦ 由于第五等级的数据较少,可以定性的判断其权重运用Matlab 编程算出其权向量i w ,最大特征根i λ和一致性指标i CI ,结果列入下表由表中i CI 值可知一致性检验全部通过。
最后根据公式W=TE F ,算得组合权向量W=(0.1238,0.1599,0.3857,0.3317)T组合一致性检验CR= 0*0.12380*0.15990.066*0.38570*0.3317+-+=<< 所以依权重,空气质量从优到劣的顺序为:A 、B 、D 、C(二) 一元多项式回归分析预测2010年9月15日至9月21日的气象参数和污染物浓度环境中污染物的浓度、气象因子与时间之间存在着某种振荡关系。
例如A 城市SO2的浓度随着时间呈现先减少后增加再减少的趋势。
为了更准确的刻画这种污染物(气象因子)与时间的关系,我们建立了一元多项式回归模型。
进而预测2010年9月15日至9月21日的污染物浓度和气象因子,最后进行预测误差估计,分析估计数据的置信度。
一般的,一元多项式回归分析的模型为:0120,nn y x x E D βββεεεσ⎧=++++⎪⎨==⎪⎩L (**)式中201,,,,n βββσL 都是与x无关的未知参数,其中201,,,,n βββσL 称为回归系数。
本题中,由于观测数据为污染物浓度,故(**)式中所示的y 应是相应的污染物浓度。
自变量元素为时间(日期转化为对应的1,2,…),则具体模型为:501520,y x x E D βββεεεσ⎧=++++⎪⎨==⎪⎩L (***) 用试验值(污染物浓度,气象参数),对201,,,,n βββσL 作点估计,并对回归系数01,,,n βββL 作假设检验,最后在0x x =处对y 作预测,并对y 作区间估计。