数理统计课程作业报告题目:郑州市主要空气污染物相关性分析课程:数理统计学院:物流工程院专业:物流工程专业姓名:原上草学号: 6666666666682015年12月20 日目录一、研究背景 (4)二、污染物各月数据特征分析 (4)三、郑州与杭州空气质量比较分析 (6)四、多元线性回归模型 (7)4.1 PM2.5浓度相关性分析 (7)4.2建立模型 (8)4.3求解模型 (8)4.4残差分析 (9)4.5模型预测 (9)五、总结 (10)参考文献 (11)附件程序 (12)摘要本文选取了2014年12 月至2015年11月期间郑州市主要空气污染物浓度数据,首先分析了郑州市各个月空气中PM2.5、PM10、CO、SO2和NO2的污染物浓度数据的特征值, 探讨了空气污染物浓度的时间变规律;然后对比了郑州市和杭州市AQI指标,分析空气污染物的空间变化规律;最后采用MATLAB软件分析了PM2.5与其它主要空气污染物之间的相关性得到了350.39*143.99*20.032=-+++-的多元线性回归模型,用12月份的y x x x x数据进行预测PM2.5浓度与真实值比较,结果表明该模型能较好的拟合PM2.5与其它污染物间相关性。
关键词:多元线性回归;特征分析;空气污染物;相关性一、研究背景随着城市社会经济快速发展、资源能源消耗和污染物排放总量的增长,城市的空气污染问题越来越突出,长期积累的环境风险开始出现。
在2 0 1 2 年2月,国家出台了新版《环境空气质量标准》(GB3095—2012),调整了部分污染物浓度限值,并增设PM2.5和O3浓度限值,对环境监测环境管理和环境评价提出了新的要求。
城市环境空气质量的好坏与气象条件密切相关,研究和解决空气质量问题,通过分析各污染物浓度之间相关性,才可能准确掌握城市大气污染规律,对改善城市空气质量、提高人民健康水平有重要意义。
本文重点分析了郑州市PM2.5浓度与其他主要空气污染物浓度的相关性。
二、污染物数据特征分析郑州市属北温带大陆性季风气候,冷暖适中、四季分明,春季干旱少雨,夏季炎热多雨,秋季晴朗日照长,冬季寒冷少雪。
四季分明的特点在污染物的时空分布上也是表现的十分明显。
本文对郑州市最近12个月空气中PM2.5、PM10、CO、SO2和NO2的污染物浓度特征值进行分析,主要污染物的变化情况如下所示:表一:PM2.5浓度特征值表二:PM10浓度特征值表三:CO浓度特征值表四:NO2浓度特征值表五:SO2浓度特征值为了方便于直观的分析空气污染物浓度与时间之间的变化规律,将以上表格数据中主要污染浓度的月平均值作折线图如下:图1:污染物浓度月平均值从图1中可以看出郑州市主要空气污染物浓度在十二月至来年二月份左右达到最大,然后污染物浓度开始下降,到六月至八月份降到最低。
郑州市区雾霾天气情况随季节变化比较明显,在冬季,气象条件将更加不利于污染物扩散。
进一步分析PM2.5和PM10的变化趋势可预测郑州市雾霾天气大多发生在每年的十二月份至来年的二月份,而每年六月份至八月份雾霾天气出现次数较少。
三、郑州与杭州空气质量比较分析本文分别选取了郑州市和杭州市最近12个月的空气污染浓度数据,以AQI 为指标,将空气污染程度划分为优、良、轻度污染、中度污染、重度污染和严重污染六个等级,下图是对两城市空气质量等级的天数进行比较:图2:郑州市与杭州市空气质量等级由上图可以看出杭州市空气质量等级主要是优和良,占总天数77.3%,中重度污染占比3.2%,郑州市空气质量优良的比例是36.6%不及杭州市的一半,中重度以上污染占比30.1%。
杭州市空气质量等级明显优于郑州市,对于两城市空气质量的差别进行分析得出两方面的主要影响因素,一人为因素影响:郑州市能源消耗以燃煤为主,占整个能源消耗量的73%。
其中,相当一部分单位的燃煤排放没有达到国家标准,然而即使排放全部达标,因燃煤基数过大,也将对大气环境造成极大危害。
二气候地理因素影响:通过百度地图可以看出郑州位于秦岭以北,121231237323158023076132空气质量等级郑州市杭州市属于北温带大陆性季风气候,天气干燥少雨,本地产生的污染物不易扩散,且容易受到北方气流影响,冬季冷空气带来大量污染物被阻隔在秦岭一带,污染物停滞在华北平原,造成郑州空气污染越发严重。
杭州位于秦岭以南属于亚热带季风气候,降水充沛,受东南季风影响,从海上吹来的温湿气流给杭州带来了新鲜的空气的同时也使杭州本地产生的污染更容易扩散。
图3:郑州市与杭州市地理位置关系郑州市空气污染的预防与控制也可以从两个方面讨论:一方面对于本地产生的污染问题,可以提高能源利用率、发展新型清洁能源严查排放不达标车辆、提倡步行与骑行等来减少污染物的产生。
另一方面对于北方气流带来的污染物可以通过与周边省市进行联防联控,减少空气流通带来的污染。
四、空气污染物浓度相关性分析4.1 PM2.5浓度相关性分析PM2.5指环境空气中空气动力学当量直径小于等于 2.5 微米的颗粒物。
它能较长时间悬浮于空气中,其在空气中含量浓度越高,就代表空气污染越严重。
本文对郑州市最近12个月天气数据分析,研究空气中PM2.5浓度与PM10、CO、NO2、和SO2浓度是否相关。
其散点图如下所示:图4:PM2.5与PM10相关性图5:PM2.5与CO相关性图6:PM2.5与NO2相关性 图7:PM2.5与SO2相关性由图4-7可知PM2.5浓度随着PM10、CO 、NO2、和SO2浓度增加而增加,成线性相关。
4.2建立多元线性回归模型对PM2.5浓度与PM10、CO 、NO2、和SO2浓度进行多元线性回归,设PM2.5浓度为y ,则01234*1*2*3*4+y x x x x βββββε=++++其中:x1、x2、x3、x4是回归变量代表PM10、CO 、NO2、和SO2浓度,01234,,,,βββββ是回归系数,ε是随机误差应大致服从均值为0的正态分布。
4.3求解模型直接利用matlab 工具箱中的命令regress 求解,使用格式为:[b,bint,r,rint,stats]=regress(y,x,0.05)其中y 为pm2.5浓度,置信度水平设为0.05。
输出b 为的估计值,bint 为b 的置信区间,stats 为回归模型的检验统计量,有4个值,第一个是回归方程决定系数2R ,第二个是F 统计量,第三个是与F 统计量对应的概率值p ,第四个是剩余方差2s 。
得到模型的回归系数估计值及其置信区间、检验统计量的结果如下:表六:多元线性回归计算结果20.7968R = 356.80F = 0.0001p < 2583s =表六显示,2R =0.7968指因变量y (PM2.5浓度)的79.68%可以由模型确定,F 检验值远超过F 检验的临界值,p 远小于置信水平0.05,拟合从整体来看是可用的。
所以拟合方程为:350.39*143.99*20.032*30.16*4y x x x x =-+++-4.4残差分析作出残差图,从图 1可以看出,红线为异常数据,除少数几个异常数据外,其余数据的残差离零点均较近,且残差的置信区间包含零点,这说明回归方程y=-35+0.39*x1+43.99 x2-0.032x3+0.16x4能较好地符合原始数据。
图8:残差图分析图根据以上公式,空气中PM2.5浓度与pm10、CO 、NO2、和SO2浓度具有线性相关性,具有一定的现实意义,例如当某个监测站pm2.5检测仪出现故障时,可利用其它污染物浓度推出。
4.5模型预测为检验所得多元线性回归模型的可靠度,本文利用2015年12月份的污染物浓度数据进行预测PM2.5的浓度与真实PM2.5浓度进行对比,预测值与真实数据对比如图五,其中蓝色星点为PM2.5浓度真实值,红色曲线为PM2.5浓度预测值,对比发现预测曲线全部在真实值附近。
图9:预测浓度与真实浓度的对比五、总结文中利用多元线性回归方法分析PM2.5浓度与主要污染物浓线性相关性,得到回归方程350.39*143.99*20.032*30.16*4y x x x x =-+++-,并通过检验方法证明所建立的模型有一定的理论意义和实用价值,体现了多元线性回归模型广阔的应用前景。
参考文献[1]陈杜甫,高祎楠,张稳定,姜楠,燕启社,张瑞芹.郑州市大气PM2.5污染传输影响研究—中国环境科学学会学术年会(2015)光大环保优秀论文集[C].郑州:郑州大学,2015.234-244.[2]王佳.郑州市PM2.5污染特征及其源解析研究[D].郑州:郑州大学,2015.5-10.[3]毕丽玫,史建武,刘意,邓昊,盛涛.昆明城区PM2.5与常规大气污染物及气象因素的相关性分析—中国环境科学学会学术年会论文集[C].昆明:昆明理工大学.4499-4505.[4]孟小峰.重庆主城区空气质量时空分布及其影响因素研究[D].重庆:西南大学,2011.[5]蒋维嵋.空气污染气象学教程[M].北京中国气象出版社,2004.[6]丁国安.实用污染气象学[M].北京:气象出版社,1981.[7]气象网站天气后报:/附件程序%%多元线性回归程序clearclc%清除所有数据x=xlsread('222.xls','sheet12','e2:i370'); %读取郑州市污染物浓度数据y=x(:,1);%PM2.5浓度x1=x(:,2);%PM10浓度x2=x(:,3);%CO浓度x3=x(:,4);%SO2浓度x4=x(:,5);%NO2浓度x=[ones(369,1) x1 x2 x3 x4];[b,bint,r,rint,stats]=regress(y,x,0.05);%多元线性回归函数%%预测程序clearclc%清除所有数据x=[];%复制2015年12月的天气污染数据x1=x(:,2);x2=x(:,3);x3=x(:,4);x4=x(:,5);y=x(:,1);Y= -35+0.39*x1+43.99*x2-0.032*x3-0.16*x4;X=1:17;plot(X,Y,'r',X,y,'b*')。