天津商业大学Tianjin University of Commerce 学年论文题目我国城市空气质量的状况分析学院经济学院专业金融学_____姓名胡鹏学号*********完成时间2014年11月10日我国城市空气质量的状况分析摘要:本文针对我国城市的空气质量现状及影响城市空气质量的主要因素进行分析研究。
运用聚类分析方法对我国城市空气质量等级进行分类,把空气质量状况最相似的城市聚成一类,分析原因、得出结论。
并对影响城市空气质量的5个主要因素进行主成分分析,找出最能代表原来数据信息的2至3个因子代替原来的5个变量。
建立回归模型,对结果进行分析,寻找解决空气质量问题的方法,并对原有方法进行改进,以便更为高效、快速地解决空气质量问题。
关键词:空气质量;聚类分析;主成分分析;回归分析Abstract:This article mainly analyze urban air quality present situation in China and the key factors affecting urban air quality study. Using clustering analysis method on the classification of China's urban air quality levels, gather into the city air quality in most similar category, analysis of causes, concluded. Then 5 main factors affecting urban air quality to principal component analysis identify the most representative of the original data instead of the 2 to 3 factors 5 variables. Established regression model an analysis of the results, looking for ways to address air quality issues, and to improve the existing methods, to more efficient and faster to solve the air quality problem.Keywords: air quality;cluster analysis;Principal components analysis;regression analyze一、我国城市空气质量的现状我国是一个人口大国,城市众多,人口密集。
但由于工业的发展,我们的很多城市都受到了不同程度的污染,直接对我们造成伤害,人们疾病的发生率也逐年提高。
空气中的污染物主要是可吸入颗粒、二氧化硫、二氧化氮等物质。
据环保部2012年统计2011年度各省、自治区、直辖市和八家中央企业主要污染物总量减排核查核算工作表明,全国化学需氧量、氨氮和二氧化硫排放量实现同比下降,氮氧化物排放量同比上升。
“十二五”期间,国家对化学需氧量、氨氮、二氧化硫、氮氧化物4种主要污染物实施排放总量控制。
其中,北京市、上海市、浙江省和河南省四项主要污染物排放量平均降幅全部位居前列。
但同时仍有个别地区在污染减排工作中存在突出问题。
许多城市和地区空气污染依然严重,污染类型以烟煤型污染为主,颗粒物仍是影响中国城市空气质量的主要污染物。
从2013年1月12日开始,北京、天津、河北、河南、江苏等地都笼罩在雾霾中,污染程度高。
在全国73个监测城市中,33个城市的部门监测站点监测数据显示,空气质量指数超过300,北京PM2.5一度超过900微克/立方米以上,空气质量达到重度污染。
二、影响城市空气质量的因素(一)衡量指标衡量指标的选取对于聚类分析来说至关重要,具有决定性的意义,影响空气质量好坏的因素有很多,为便于比较各个城市空气质量指标的异同点,根据我国各主要城市2011年城市空气质量指标的数据表,可以采用多元统计分析中的系统聚类法对31个主要城市的空气质量指标进行分析。
由下表一知,前三个指标和后一个指标的含义不一样,并且前三个指标不能完全代表空气质量状况,所以只用后一个指标对原始数据进行聚类分析,就能透彻地来衡量我国主要城市的空气质量。
原文数据如下:表一摘编自《中国区域经济统计年鉴2012》(二)聚类结果及分析聚类结果:树图1C A S E 0 5 10 15 20 25Label Num +---------+---------+---------+---------+---------+杭州 11 -+银川 30 -+沈阳 6 -+-----+上海 9 -+ |3长沙 18 -+ +-----+南宁 20 -+ | |贵阳 24 -+-----+ |呼和浩特 5 -+ +-----------------------------------+南昌 14 -+ | |长春7 -+ | |福州 13 -+ | |广州 19 -+-----------+ |4海口 21 -+ | 昆明 25 -+ |拉萨 26 -+ |北京 1 -+---+ |1乌鲁木齐 31 -+ +---------------+ | 兰州 28 -----+ | |武汉 17 -+ | |西安 27 -+ +---------------------------+太原 4 -+-----+ |合肥 12 -+ | |哈尔滨8 -+ | |2南京 10 -+ +-------------+西宁 29 -+ |郑州 16 -+ |石家庄 3 -+-----+济南 15 -+天津 2 -+重庆 22 -+成都 23 -+本文是按二级以上天数及所占比重作为衡量标准对各个城市空气质量做聚类分析。
明显可见全国31个主要城市被分为四类,分类结果见树图1。
各类所包含的省市自治区、直辖市如下:第一类有3个城市,其中包括北京、兰州、乌鲁木齐;第二类有13个城市,其中包括哈尔滨、天津、太原、西安、石家庄、济南、郑州、合肥、南京、武汉、西宁、成都、重庆;第三类有10个城市,其中包括银川、沈阳、长春、贵阳、呼和浩特、南昌、杭州、长沙、南宁、上海;第四类有5个城市,其中包括福州、广州、海口、昆明、拉萨。
根据《环境空气质量标准》(GB3095-1996)规定二类区即二级标准为城镇规划中确定的居住区、商业交通居民混合区、文化区、一般工业区和农村地区。
我国31个主要城市都已经达到二级标准,但不同的是达到二级标准的天数各不相同。
可以看出:第一类的三个城市明显是达到二级标准天数及所占比重最少的。
这主要归因于其特殊的城市职能和地理位置,工业发展比较快,工业企业比较多,而且人口密度过大,又容易受西北沙尘暴袭击。
诸多因素影响导致空气质量严重恶劣,是重点治理对象。
第二类的十三个城市居于中等。
主要区域为城镇规划确定的居民区、商业区交通居民混合区、文化区、一般工业区和农村地区;也相对存在一些不足之处,有待个相关部门的进一步调查及相关对策治理。
第三类的十个城市与其他大城市相比处于中中上等水平。
与空气质量较好的城市相比,I级天数较少,III级天数较多,仍存在着不少差距。
但是上海是进步最大的一个城市。
其中上海市政府加大力度控制大气污染源排放和建设城市绿地是促进城区空气质量变好的重要原因。
这是其他城市应该学习和借鉴的。
重点是分到第四类的五个城市,其中昆明、海口二级以上天数所占比重达到100%,是中国空气最好的城市。
其余三个相对前三类也有明显优势。
主要区域为自然保护区、风景名胜区和其他需要特殊保护的地区。
三、对各城市空气质量的主成分分析(一)衡量空气质量好坏的指标影响空气质量的因素有很多,本方法选取可吸入颗粒物(因子1),二氧化氮(因子2),二氧化硫(因子3),湿度(因子4),温度(因子5)等五个因素。
数据如下:(二)共线性诊断选取的指标具有不同的量纲和量纲单位,对选中指标进行标准化处理,使其无量纲化,从而可以得到相同的协方差矩阵或相关矩阵。
由下表可知,VIF都大于1,则上述5个变量之间存在多重共线性,在下面的建模中首先要运用提取主成分的方法消除这种共线性。
表三系数a(三)提取主成分根据所述原理,将标准后的样本数据输入spss软件进行主成分分析,并取特征值为大于1,得到累计贡献大于85%的主成分,结果如图:表四解释的总方差表五二氧化氮(NO2) .445 .707 -.516年平均湿度-.549 .692 .346年平均气温-.776 .461 .020用这三个因子代替原来的5个变量可以概括全部信息的85.570%。
说明前三个主成分代表原来的五个指标评价城市空气质量已经有足够的把握。
因此,描述空气质量,可以用这三个因子。
经过spss分析最终得出综合主成分得分(表五),它反应了各样本的综合水平。
表六成分得分系数矩阵成份1 2 3可吸入颗粒物二氧化硫(SO2) 二氧化氮(NO2) 年平均湿度年平均气温.335.338.191-.236-.333.278.120.519.508.339.208.734-.877.588.034从而得到主成分方程:=0.335+0.338错误!未找到引用源。
+0.191错误!未找到引用源。
-0.236错误!未找到引用源。
-0.333错误!未找到引用源。
; (1)=0.278+0.120错误!未找到引用源。
+0.519错误!未找到引用源。
+0.508错误!未找到引用源。
+0.339错误!未找到引用源。
; (2)=0.208+0.734错误!未找到引用源。
-0.877错误!未找到引用源。
+0.588错误!未找到引用源。
+0.034错误!未找到引用源。
; (3)在上表中可以看出:在第一和第三主成分上,二氧化硫的得分最高,这说明二氧化硫成为我国主要城市空气污染的主要污染源,这在一定程度上说明汽车尾气,工厂废气带来的危害。
在第二主成分上,二氧化氮的得分最高,表明二氧化氮也能够影响空气的质量。
(四)建立回归模型为了使各主成分影响指标更加明显,再对数据进行回归分析,用城市空气质量达到及好于二级的天数作为因变量y 对前三个主成份、、做普通最小二乘回归,112233ˆm yc m c m c =++ (4) 模型非标准化标准化 tSig.B标准误差 试用版 常量326.806 3.378 96.757 .000 REGR factor score 1 for analysis 1-19.820 3.433 -0.722 -5.773 .000 REGR factor score 2 for analysis 1-6.353 3.433 -0.231 -1.850 .075 REGR factor score 3 for analysis 1 -1.6563.433-0.060-0.482.634得到标准化后的主成份回归的回归方程:123ˆ0.7220.2310.060yc c c =--- (5) 还原后的标准化的主成份回归方程为:123450.3190.3160.2050.0180.16y x x x x x =---++ (6)表八模型非标准化系数标准系数tSig.B标准 误差 试用版(常量)326.806 3.37896.757 .000REGR factor score 1 for analysis 1-19.820 3.433-.722 -5.773 .000 REGR factor score 2 for analysis 1-6.353 3.433-.231 -1.850 .075得到未标准化的主成份回归的回归方程:123326.80619.820 6.353 1.656y c c c =--- (7)还原后的未标准化的主成份回归方程为:12345326.8068.7498.671 5.6310.476 3.889y x x x x x =---++ (8)(五)结果分析及综合评价由方程(6)可知,可吸收颗粒物的系数最大,它对空气质量好坏的影响最大;二氧化硫次之;空气湿度的影响最小。