当前位置:文档之家› 北京空气质量以及可能影响因素调查研究

北京空气质量以及可能影响因素调查研究

《商务统计学》课程报告北京空气质量以及可能影响因素调查研究——基于因子分析和线性回归小组成员姓名:周坤郝策张庆庆郝坤2016年5月7号《商务统计学》课程报告摘要北京空气质量近些年成为人们关注的热点,客观地评价其变化趋势和影响因素,不仅有利于正确认识北京空气质量,也为有效预测和控制提供依据。

本文主要通过对其他文献研究和空气质量评价体系,尽可能选取多的与北京空气质量可能有关的因素,希望找出具体的影响因素,更加清晰认识到北京的空气质量的罪魁祸首。

通过选取北京2008年至2014年的相关数据,先通过因子分析的方法,提取四个公共因子,构建新的空气质量评价体系。

然后用因子得分矩阵,得到四个的得分结果,用这个结果作为自变量,空气质量优良天数作为因变量做回归分析,最终得到一个线性回归模型,可以很好的解释北京空气质量的影响因素。

关键词:北京空气质量因子分析回归分析模型构建AbstractBeijing's air quality in recent years becomes the focus of public, objective evaluation of its trends and influencing factors can not only conducive to a correct understanding of Beijing's air quality, but also provide the basis for effective prediction and control.In this paper, by factors other literature research and air quality evaluation system, select the number of Beijing's air quality as possible and may be relevant to find out which specific factors, a clearer understanding of the air quality in Beijing is the culprit. By selecting the relevant data in Beijing from 2008 to 2014, first by the method of factor analysis extracted four common factors to build a new air quality evaluation system. Then scoring matrix by a factor to obtain the results of four scores, as a result of using this argument, the air quality days to do as the dependent variable regression analysis, end up with a linear regression model can well explain the factors that affect air quality in Beijing.Keywords: Beijing Air Quality ,Factor Analysis ,Regression ,Model《商务统计学》课程报告目录摘要 (1)1绪论 (3)1.研究背景及目的 (3)2.可能影响因素与空气质量评价体系的构建 (3)2 空气质量影响的因素选取 (3)3数据分析与研究 (5)3.1 数据采集 (5)3.2 数据因子分析与描述 (5)3.2.1 数据标准化处理 (5)3.2.2 因子分析和可行性分析 (6)3.2.3 提取公因子 (6)3.2.4 因子命名与新空气质量评价体系的构建 (9)3.3 因子的回归分析与描述 (10)3.3.1因子的回归分析 (10)3.3.2回归分析结果的解释 (14)3.4 数据可视化描述与解释 (14)4结论 (16)参考文献 (16)附录 (17)图表目录图表 1 变异数总计 (7)图表 2 碎石图 (8)图表 3 因子旋转组件矩阵 (9)图表 4 组件评分系数矩阵 (12)图表 5 因子得分变换 (12)图表 6回归模型摘要 (13)图表 7 回归模型系数 (13)图表 8 年份趋势图 (15)《商务统计学》课程报告1绪论1.研究背景及目的近年来工业化和城镇化的快速发展,我国的经济飞速增长。

但同时出现的环境问题也日益突出,最受大家关注的莫过于雾霾与PM2.5,越来越频发的雾霾天气严重影响了人们的正常生活和身体健康。

那么北京作为国家首都,经济政治文化中心,那么它的空气质量也当然备受关注,研究影响空气质量因素也显得尤为必要,因为一些预防治理政策都要以此为依据。

在想到这篇文章的题目时,就想知道大家说的空气质量到底和什么因素有关呢?现有的质量评价体系又是怎么样的,是不是很全面很有说服力呢?因此在一些研究的基础上,本文想通过分析得到更全面的,更具有说服力的的评价体系,找到更多的可能影响空气质量的因素。

2.可能影响因素与空气质量评价体系的构建在分析了一些文献和自己的想法后,选取了以下的21个可能影响因素,可吸入物颗粒年日均值,二氧化硫排放量,氮氧化物年日均值,粗钢产量,水泥产量钢材产量,发电量年,平均降水量年,平均气温,平均气压,大风日数,雨日数,日照数机动车拥有量,,环境污染治理投资城市绿化覆盖率,常住人口密度,用电量,煤炭日均消耗量,汽油日均消耗量,天然气日均消耗量希望通过这些因素构建新的质量评价体系。

2 空气质量影响的因素选取《商务统计学》课程报告《商务统计学》课程报告影响空气质量不仅有以上几个方面,其他的因素当然还有很多,本文由于获取数据途径和考虑范围有限,只能选取以上因素进行分析,数据选取于北京市统计年鉴。

3数据分析与研究3.1 数据采集数据主要来源于北京统计年鉴和国家统计年鉴,选取北京市2008年至2014年这七年的数据作为分析样本,具体数据见附录。

3.2 数据因子分析与描述3.2.1 数据标准化处理本文选取的指标不是同一个量纲和量纲单位,不能直接对不同量纲的指标进行比较。

为了对整体指标进行综合评价,需要先对评价指标进行数学变换来消除指标量纲的影响,即进行无量纲化处理。

标准化法是目前使用较为广泛的一种无量纲化方法,公式如下所示:《商务统计学》课程报告Z=X−JYδ其中,Z为原始变量X标准化后的数值,JY为X的期望值,δ为X的标准差。

3.2.2 因子分析和可行性分析应用KMO和Bartlett球形检验测定样本是否适宜做因子分析。

KMO的值在0~1之间,越接近于1,变量间的偏相关性越强,因子分析效果越小。

可是当我们把所有因子输入做可行性分析时,并没有输出相关系数矩阵,显示为此矩阵为非正定矩阵,但输出了因子分析的结果,研究和查找资料发现,可能是由于样本数太少,也可能是某些变量间相关性太强,进一步发现后面一些变量的方差太小,也就是特征值太小,意味着主成分方差过小,也说明主成分包含的信息量少,因此可能无法满足正定矩阵的条件。

此种情况可以采取逐一淘汰变量的方法,最终得到检验的结果,由于影响不大,也可以直接使用因子分析得出的结果,本文采取第二种方法。

3.2.3 提取公因子利用特征值作为保留主成分标准,经SPSS分析得到如下主成分方差累计贡献率的表格:说明的变异数总计组件起始特征值撷取平方和载入循环平方和载入总计变异的 % 累加 % 总计变异的 % 累加 % 总计1 13.256 63.125 63.125 13.256 63.125 63.125 11.1692 3.128 14.894 78.019 3.128 14.894 78.019 3.5213 2.533 12.062 90.081 2.533 12.062 90.081 3.1824 1.026 4.884 94.964 1.026 4.884 94.964 2.0715 .757 3.607 98.5716 .300 1.429 100.0007 2.946E-15 1.403E-14 100.000《商务统计学》课程报告8 1.376E-15 6.551E-15 100.0009 4.802E-16 2.287E-15 100.00010 4.185E-16 1.993E-15 100.00011 2.903E-16 1.382E-15 100.00012 1.224E-16 5.829E-16 100.00013 2.597E-17 1.237E-16 100.00014 -4.159E-17 -1.980E-16 100.00015 -1.641E-16 -7.813E-16 100.00016 -2.168E-16 -1.032E-15 100.00017 -2.979E-16 -1.419E-15 100.00018 -3.429E-16 -1.633E-15 100.00019 -5.111E-16 -2.434E-15 100.00020 -6.181E-16 -2.943E-15 100.00021 -1.447E-15 -6.891E-15 100.000提取方法:主成分分析图表 1 变异数总计根据上表可知,提取因子因子有四个,累计方差贡献率为94.964,碎石图如下:《商务统计学》课程报告图表 2 碎石图由上图可直观看出,因子4和因子5很接近,而且从因子4开始,下降趋势很缓慢,因此提取四个因子是合理的。

4个因子的旋转矩阵如下表:《商务统计学》课程报告图表 3 因子旋转组件矩阵3.2.4 因子命名与新空气质量评价体系的构建根据旋转矩阵我们可以看出,可吸入颗粒物年日均值(x1),二氧化硫排放量(x2), 氮氧化物年日均值(x3), 环境污染治理投资(x4), 粗钢产量(x5), 钢材产量(x6) 发电量(x8), 日均用电量(x9), 汽油日均消耗量(x11), 天然气年日均消耗量(x12), 雨日数(x17), 机动车拥有量(x19), 常住人口密度(x20), 城市绿化覆盖率(x21),在因子1上有较高载荷,这些变量比较综合,涉及到各个方面,里面主要有工《商务统计学》课程报告业产能,污染物排放以及人口与活动方面的因素,因此可以命名为“污染物排放与人类活动指数”,记为Y1。

年平均降水量(x13)大风日数(x16)在因子2上载荷较大,因此可以命名为“自然风雨量指数”,记为Y2。

相关主题