当前位置:文档之家› 数学建模城市空气问题

数学建模城市空气问题

天津市空气质量评价与预测摘要本文对天津市区的空气质量进行了评价,并选出了主要的污染物进行研究分析,运用综合指数评价法和回归分析等方法对其空气质量进行分析,综合各种因素我们建立了如下模型。

1、本文对2001-2010年的空气污染指数和空气质量状况进行了分析,采用了指标评价法和综合指数评价法分析了对空气污染最主要的物质, 对每每年每种物质用(u u i u o u o i I C C C C I I I +-⨯--=)( )这个式子计算它们的污染指数,那么计算得到的最大的值的那种物质即是天津的主要污染物,我们发现对天津市空气质影响最大的物质是10PM ;2、运用spss 软件我们对天津过去十年的主要污染物进行多种模型拟合分析,发现三次曲线模型的相关系数最接近1,曲线模型拟合度较高,因此我们运用三次曲线模型进行预测分析,运用下面式子C x b x b x b y +++=12233我们得到了未来五年主要污染物浓度预测值,再根据这些值来分析与评价未来五年的空气质量;3、研究发现我国各个城市的空气质量有类似的,也有差别很大的,文中我们利用了聚类分析法来分析我国各个城市的空气质量。

[关键词] 综合指数评价 回归分析 主要污染物 三次曲线模型 聚类分析一、问题提出空气是地球上的生物赖以生存的物质,是必不可少的一种物质。

随着人类文明和经济的发展,空气污染越来越严重,尤其是工业城市,如何改善空气质量、合理进行大气环境质量预测预警、寻求有效的控制措施是当前环境科学研究的重要内容。

空气质量的好坏直接反映了空气的污染程度,它是依据空气中污染物浓度的高低来判断的,所以控制污染物的排放是改善空气质量的根本措施。

空气污染的污染物主要有二氧化硫(SO2)、二氧化氮(NO2)、可吸入悬浮颗粒物\浮尘(PM10)等等。

目前,城市空气质量污染指数的分级标准是根据空气污染指数(API)的取值界定的,空气污染指数指常规监测的几种空气污染物浓度简化成为单一的概念性指数值形式,并分级表征空气污染程度和空气质量状况。

天津是中国重要的能源与工业城市,其工业化与城市化的快速发展对城市环境产生了重要影响。

近年来,市委市政府立足资源型城市可持续发展战略,努力改善全市空气质量。

(1)根据你们所掌握的数据资料、选出影响空气质量的主要污染物、建立适当的数学模型对天津市空气质量进行综合评价;(2)对天津市未来几年空气质量及未来某段时间的主要污染物浓度进行预测;(3)定量分析全国主要城市空气质量并进行分类;(4)根据所建立的数学模型,分析主要污染物的来源及控制措施,向有关当局写份建议性报告。

二、问题分析空气是地球上的生物赖以生存的物质,空气中含有很多物质,这些物质对生物本身是有益而无害的,但是随着我国第二产业的迅速发展,我国一些工业城市的污染越来越严重,例如天津就是以工业为主的城市,本文也对天津的空气污染指数进行了分析,我们知道物质过量的出现在空气中会给人类甚至各种生物带来一定的危害,我们需要采取一定的措施来改善空气环境。

问题一:根据《中国人民共和国环境保护法》和《中华人民共和国大气污染防治法》规定,空气质量的好坏反映了空气污染程度,一般是依据空气中污染物浓度的高低来判断。

以天津的实际具体情况分析,被计入控制污染指数(API)的污染物项目为:SO2、NO2、PM10。

因此我们通过综合指数评价法和时间序列法等来对天津这个工业城市进行空气指数的模型建立与求解。

问题二:预测天津未来几年的空气质量首先要对主要污染物的浓度进行分析,再根据计算得到的未来几年污染物的浓度来分析天津未来几年的空气质量,针对这两个方面我们采用了回归分析法来计算天津未来五年的空气质量;问题三:我国空气质量情况在各个城市都有一定的区别,那么我们可以将情况类似的城市归为一类,这样也比较方便研究问题,所以我们聚类分析法进行研究计算。

三、模型假设3.1忽略空气中在指标控制范围内的其他污染物;3.2假设所给数据均有效;3.3 假设在较近一段时间内,不发生重大工业事故;3.4假设在未来一段时间内,城市自然环境稳定,不发生一些较大的自然灾害,例如:地震、洪灾、海啸等;3.5 天津未来一段时间内,政府没有出台关于大规模工业的迁入迁出政策;3.6 假设在较近的一段时间内,国家政治、自然环境稳定。

四、符号说明与名词解释4.1 符号说明符号符号意义I i第i种污染物的污染指数C i第i种污染物的浓度(mg/m3)C o标准限度的上限C u标准限度的下限I o标准污染指数的上限(mg/m3)I u标准污染指数的下限(mg/m3)A 常数4.2名词解释1、空气污染指数(Air pollution index ,简称API)[3],就是将常规监测的几种空气污染物浓度简化成为单一的概念性指数值形式,并分级表征孔子去染程度和空气质量状况,适合于表示城市的短期空气质量状况和变化趋势。

中国计入空气污染指数的项目暂定为:二氧化硫、氮氧化物、总悬浮颗粒物。

2、拟合度:拟合度检验是对已制作好的预测模型进行检验,比较它们的预测结果与实际发生情况的吻合程度。

五、模型的建立与求解5.1 综合评价首先,我们对数据进行预处理,根据数据的顺序分别对每一年的各种污染物进行污染指数计算:u u i u o u o i I C C C C I I I +-⨯--=)( (5-1-1)且同年的空气污染指数API=max (I 1,I 2,I 3)。

(5-1-2)表5.1.1.空气污染指数对应的污染物浓度限值据表5.1.1的标准值,找出每一年的每一种污染物介于的标准限度的上限C o 与下限C u ,及标准污染指数的上、下限(I o 、I u );再将数值带入(5-1-1)和(5-1-2)中进行计算;计算可得到如表5.1.2结果:表5.1.2.各种污染物的污染指数从表5.1.2中可分析得出,从2001年到2010年,污染物指数最大的都为PM10,及可吸入悬浮颗粒物\浮尘,则根据空气污染指数的定义可确认PM10是最主要的污染物。

为了更好的评价天津市空气质量,我们查得空气污染指数范围及相应的空气质量类别[3],另外运用了EXCEL对2001-2010年的API画图进行了分析,分别为表5.1.3和图5.2.11.4。

表5.1.3.空气污染指数范围及相应的空气质量类别图5.2.11.4.观察表5.1.3和图5.2.11.4不难发现在过去的十年间天津空气质量徘徊于50~100之间,对应标准表发现,天津空气质量良好,且呈缓慢下降的趋势,说明在过去十年间对天津环境的治理得到了一定的成果,比较适合人们生活。

在国家环境保护部的数据中心[4]我们可查到,在过去的几年间,天津空气质量好于二级的天数基本都占有效监测天数的百分比在持续上升,说明空气质量正在朝好的方向不停发展。

符合我们所建立模型得出的结论,因此可证明该模型在评价空气质量时是可靠的。

5.2 预测未来年空气质量与主要污染物首先根据问题一所得到的结果,我们发现天津的主要污染物是PM10,因此我们先建立对于PM10未来几年进行预测的数学模型,对数据进行预处理,画出散点图,通过观测图图形我们可以发现PM10的发展趋势大约为回归模型,运用spss软件对过去十年的PM10浓度数据进行多种模型拟合分析,得出图2.和表4.分别如下:图5.2.1从图5.2.1和表5.2.2.中分析可以得到,R 2一栏中,三次曲线模型的R 2最接近1,也就说明三次曲线模型的拟合度较高,因此我们选择运用三次曲线模型进行预测分析,即:A x b x b x b y +++=12233 (5-2-1) 运用spss 软件进行运算得出图5.2.3和表5.2.4如下:图5.2.3表5.2.4综合以上数据可以得到,PM 10未来几年预测模型为:189.0028.0003.0623.8235+-+-=-x x x e y (1≥x )(5-2-2)(注:x =1时的y 值为2001年PM 10的浓度值)当x =11,12,13,14,15时,将它们分别带入(5-2-2)中计算PM 10的浓度值,运用excel 软件对模型进行计算可以到表5.2.5和图5.2.6分别如下:表5.2.5图5.2.6.继续带入(5-2-2)中计算我们发现,该模型十年后的趋势将降低至负值,而根据实际情况,PM10的浓度值是不可能低至负值,因此这个模型只适合预测短时间内的PM10的浓度,对于长期的预测会出现较大的误差。

对于问题二的要求,我们值预测未来五年PM10的浓度。

则未来五年主要污染物PM10的浓度预测值为:0.1109、0.1122、0.1123、0.1106、0.1065。

(单位:mg/m3)我们将所得到的PM10的浓度预测值带入(5-1-1)中,我们得到了PM10的污染指数分别为I11=80.45、I12=81.1、I13=81.15、I14=80.3、I15=78.25;根据问题一的分析我们可以知道PM10是主要污染物,所以计算所得到的API值也就是PM10的污染指数,结合表5.1.3我们知道API值在101~150之间属于轻度污染的,建议尽量身体健康状况不好的人减少外出活动的次数。

5.3 定量分析城市空气质量首先,每个城市的空气质量是存在一定的差异的,每个城市之间的差异有大有小,所以我们将差异较小的归为一类,这就需要考虑如何归类,因此我们用到了聚类分析法来将每个差异小城市归为一类。

所谓聚类分析,就是给定一个元素集合D ,其中每个元素具有n 个可观察属性,使用某种算法将D 划分成k 个子集,要求每个子集内部的元素之间相异度尽可能低,而不同子集的元素相异度尽可能高。

其中每个子集叫做一个簇。

本文采用其中一个聚类算法——k 均值(k-means )算法,具体步骤如下: 1.据具体问题,从原始数据中随机取4个元素,作为4个簇的各自中心。

2.计算每类的样本均值,将样本均值作为初始聚类中心。

分别计算剩下的元素到k 个簇中心的相异度,一种很自然的想法是用两者的欧几里得距离来作为相异度,欧几里得距离的定义如n 下:2222211)(...)()(),(n n y x y x y x y x d -++-+-= (5-3-1) ( 注 :其中x ,y 是两个元素项,各自具有n 个可度量特征属性。

)下面进行四次迭代,对聚类中心内部进行更改,使其相似度渐进的归为一类,重由此,我们便得到第一次聚类结果,聚类号相同的意味着归属为一类,即其类内对象的欧氏距离应最小,类之间的欧式距离应最大。

然而下表5.3.2.中的欧式距离与理论脱节,有所偏颇。

针对上面的问题,我们进一步求新的样本均值,更新新的各簇的中心点,采用误差平方和准则函数判断聚类是否合理,不合理则修改分类。

相关主题