当前位置:文档之家› 应用统计学课程设计-运用SPSS对城市空气质量的统计分析

应用统计学课程设计-运用SPSS对城市空气质量的统计分析

学号(应用统计学课程设计)设计说明书运用SPSS对城市空气质量的统计分析起止日期:2013年7 月1 日至2013年7 月5 日学生姓名班级成绩指导教师(签字)经济与管理学院2013年7月5日应用统计学课程设计课程设计分工及成绩评定表成绩评定表目录1确定假设 (4)2分析思路 (4)3选用的分析方法 (4)4 描述性分析 (4)4.1空气质量达到二级以上的天数占全年的比例的描述性统计 (4)4.2城市空气质量因素的描述性统计 (5)5统计图 (6)5.1立体柱状图对两年各类的空气质量描述 (6)5.2折线图对降水量对空气质量的影响描述 (7)6统计报表 (7)7均值比较 (8)8相关分析 (10)9一元线性回归分析 (11)9.1可吸入颗粒和空气质量达到二级以上的天数的一元线性回归分析 (11)9.2降水量和空气质量达到二级以上的天数的一元线性回归分析 (12)10多元线性回归分析 (13)11总结 (14)12 统计调查方案 (15)12.1问题提出 (15)12.2确定调查对象和调查单位 (16)12.3确定调查内容 (16)12.4调查方式和方法 (16)12.5调查期限 (16)12.6确定假设 (16)附原始数据 (17)1确定假设1.假设忽略空气中可能影响空气质量的其他污染物;2.假设在较近一段时间内,不发生重大工业事故;3.假设在未来一段时间内,城市自然环境稳定,不发生一些较大的自然灾害,例如:地震、洪灾、海啸等;4.假设未来一段时间内,政府没有出台关于大规模工业的迁入迁出城市的政策。

2分析思路此次课程设计,我针对中国主要城市在2010年及2011年的空气质量,利用SPSS软件进行统计分析。

先是对全国各主要城市的空气质量进行横向比较,分析我国的空气质量的总体情况和地区差异,然后对代表性空气质量影响因素进行分析。

分析思路总结大致是:首先利用SPSS软件中的描述性统计分析的方法对主要城市空气质量进行横向比较,利用统计图判断在全国范围内是否存在影响空气质量的共同因素及两年的变化,然后利用报表统计城市空气质量在2010年及2011年的分布状况是否具有一致性,随后利用均值比较、相关性分析、回归分析对各个因素影响效果进行分析。

3选用的分析方法根据分析思路知在本次统计分析中主要运用的分析方法有:描述性分析、统计图、统计报表、均值比较、相关分析、一元线性回归分析、多元线性回归分析。

4 描述性分析4.1空气质量达到二级以上的天数占全年的比例的描述性统计本设计选择2011年中国统计年鉴中2010年全国主要城市的空气质量统计数据及2012年中国统计年鉴中2011年全国主要城市的空气质量统计数据作为统计研究对象,对城市空气质量达到二级以上的天数占全年的比例进行分类,并进行频数分析,分析结果如表4.1及4.1.2 所示。

表4.1 空气质量达到二级以上的天数占全年的比例(已离散化)频率百分比有效百分比累积百分比有效< 70.0 2 3.2 3.2 3.270.0 - 79.9 5 8.1 8.1 11.380.0 - 89.9 26 41.9 41.9 53.290.0+ 29 46.8 46.8 100.0合计62 100.0 100.0从表4.1及表4.1.2对比可以看出,2010年及2011年空气质量达到二级以上的天数占全年的比例小于70%的各1个省市,占两年的3.2%;70% 到80% 元之间2010年有3个省市,2011年有2个省市,占两年的8.1%;80% 到90% 之间2010年有14个省市,2011年有13个省市,占两年的41.9%;大于90%,2010年有13个省市,2011年有15个省市,占两年的46.8%;从上面分析可以看出2011年较2010年的空气质量有所好转,但一半以上的省市空气质量达到二级以上的天数占全年的比例仍小于90%,说明城市空气质量还有提升的空间。

4.2城市空气质量因素的描述性统计本设计对城市空气质量的可吸入颗粒、二氧化硫、二氧化氮、空气质量达到二级以上的天数、年平均温度及年平均降水量六项影响空气质量的因素做描述性统计分析,包括频数、最小值、最大值、平均值、标准差五个项目,见表4.2。

从表4.2可以看出,在影响空气质量的因素中,可吸入颗粒的最小值为0.04毫克/立方米,最大值为0.155毫克/立方米,平均值为0.09334毫克/立方米,标准差为0.023294;二氧化硫的最小值为0.007毫克/立方米,最大值为0.089毫克/立方米,平均值为0.03998毫克/立方米,标准差为0.016621;二氧化氮的最小值0.015毫克/立方米,最大值为0.068毫克/立方米,平均值为0.04019毫克/立方米,表4.1.2按空气质量达到二级以上的天数分组* 空气质量数据的年份 交叉制表计数空气质量数据的年份 合计2010 2011 按空气质量达到二级以上的天数分组 <=244 1 1 2 <=286 3 2 5 <=329 14 13 27<=365 13 15 28 合计 31 31 62 表4.2 描述统计量N极小值极大值均值 标准差 可吸入颗粒 62 .040 .155 .09334 .023294 二氧化硫 62 .007 .089 .03998 .016621 二氧化氮62 .015 .068 .04019 .012125 空气质量达到二级以上的天数62223365324.0029.019年平均降水量 62 166.2 2445.1 882.923 543.3003 年平均温度62 4.524.613.9845.0910有效的 N (列表状态)62标准差为29.019;空气质量达到二级以上的天数的最小值为223天,最大值为365天,平均值为324,标准差为29.019;年平均降水量的最小值为166.2毫米,最大值为2445.1毫米,平均值为882.923毫米,标准差为543.3003;年平均温度的最小值为4.5摄氏度,最大值为24.6摄氏度,平均值为13.984摄氏度,标准差为5.0910;5统计图5.1 立体柱状图对两年各类的空气质量描述按照4.1 的分类对2010年及2011年四类空气质量在可吸入颗粒、二氧化硫、二氧化氮三个方面用立体柱状图展示,如图5.1 所示:图5.1从图5.1得知可吸入颗粒物为影响我国城市空气质量的主要因素,2011年较2010年在空气质量达到二级以上的天数占全年的比例小于70%的城市中可吸入颗粒的含量得到有效控制,其他分组的可吸入颗粒含量没有明显变化。

5.2 折线图对降水量对空气质量的影响描述按照4.1 的分类对四类空气质量在年平均降水量方面用折线图展示(温度受地区、纬度及降水量的影响在这不做分析),如图5.2所示:图5.2从图5.2得知降水量对空气质量有影响,这个影响表现在降水量的增多会使空气质量有所好转,可视为降水量对空气质量的影响成正相关,但此影响是否显著还有待检验。

6统计报表对2011年及2010年四类空气质量的可吸入颗粒、二氧化硫、二氧化氮进行统计报表。

统计报表如报表6.1所示:报表6.1空气质量空气质量达到二级以上的天可吸入颗粒二氧化硫二氧化氮数据年份数占全年的比例(已离散化) 合计合计合计_________ _________________________ _____________ ____________ ____________2010 < 70.0 .155 .057 .04870.0 - 79.9 .362 .162 .18180.0 - 89.9 1.395 .570 .52090.0+ 1.046 .478 .5012011 < 70.0 .138 .048 .04270.0 - 79.9 .245 .107 .12480.0 - 89.9 1.308 .550 .51090.0+ 1.138 .507 .566总计 5.787 2.479 2.492从统计报表中可以看出,2011年较2010年影响空气质量的因素(可吸入颗粒、二氧化硫、二氧化氮)的含量都有所下降,进一步证实了表4.1及表4.1.2和图5.1所说明的问题。

7均值比较对影响空气质量的六个因素进行均值比较,分析出影响空气质量的主要因素,并对这些因素的均值情况进行描述,分析结果如表7.1及表7.1.2所示:从表7.1.2可以看出四类空气质量,可吸入颗粒的均值分别为0.14650、0.12140、0.10385、0.07439表明不同类别空气质量在可吸入颗粒的含量上有很大的差异,可吸入颗粒含量越高,城市空气质量越差,这和实际相符合;二氧化硫的均值分别为0.05250、0.05380、0.04363、0.03311表明不同类别空气质量在二氧化硫的含量上无明显差异,甚至有些空气质量好的反而比空气质量差的二氧化硫含量高;二氧化氮的均值分别为.0.4500、0.06100、0.03944、0.03686表明不同类别空气质量在二氧化氮的含量上无明显差异,甚至有些空气质量好的反而比空气质量差的二氧化氮含量高;年平均降水量的均值分别为186.5、641.58、776.563、1078.325表明不同类别空气质量在降水量的对少上有很大的差异,降水量越大,城市空气质量越好;年平均温度的均值分别为7.8、11.46、13.34、15.496表明不同类别空气质量在温度上有差异,但这个差异明显不明显不能下结论,因为受到地理位置的影响。

8相关分析对影响空气质量的六个因素进行相关性分析,分析出影响空气质量的因素之间的相关性大小,分析结果如表8.2所示:从表8.2可以得知,空气质量达到二级以上的天数分组与可吸入颗粒、二氧化硫、二氧化氮在0.01置信度条件下呈高度负相关,其中可吸入颗粒与空气质量达到二级以上天数的分组的相关性大于二氧化硫及二氧化氮与空气质量达到二级以上的天数的分组的相关性;空气质量达到二级以上的天数分组与年平均降水量、年平均温度在0.01置信度条件下呈高度正相关,其中降水量与空气质量达到二级以上的分组相关性大于温度与空气质量达到二级以上的天数分组的相关性。

这与表7.1.2所分析的结果一致。

9一元线性回归分析由均值分析和相关性分析可知影响空气质量的主要因素是可吸入颗粒和降水量,可吸入颗粒与空气质量成负相关,而降水量与空气质量成正相关,下面分别对两个因素与质量达到二级以上天数进行一元线性回归分析,看二者之间是否存在线性关系。

9.1可吸入颗粒和空气质量达到二级以上的天数的一元线性回归分析可吸入颗粒和空气质量达到二级以上的天数的一元线性回归分析结果如表9.1及表9.1.2及表9.1.3所示:由表9.1所示,本次回归分析得到的相关系数R=0.902,调整的决定系数R方为0.811,模型拟合效果很理想。

相关主题