武汉市环境污染问题的因子分析
摘要:九十年代以来,武汉市经济建设取得长足发展,人民生活水平不断提高。
十二五期间,随着高铁网络的逐步建设,武汉市交通枢纽的地位愈发显著;复兴大武汉战略提出后,武汉市经济快速发展,城市建设日新月异。
但在经济快速发展的同时,也带来了一些社会问题,其中环境污染问题日益严重,愈发影响人民生活水平的进一步提高,阻碍了武汉市经济社会的良性循环发展。
本文应用数理统计中所学的因子分析的知识,对武汉地区的环境污染问题的分析与评价。
所得到的分析结果可以为武汉市的环境治理与整治提供一定的参考价值和理论基础。
关键词:环境污染、因子分析、数理统计、SPSS 。
一 问题提出与分析
环境问题中,各个指标错综复杂,这不利于我们分析问题。
如何从数据中抓住主要规律,从而分析样本或总体的主要性质呢?这就需要运用到因子分析的统计学方法了。
因子分析是一种把原来多个指标化为少数几个互不相关的综合指标的一种统计方法,可以达到简化数据、揭示变量之间的关系和进行统计解释的目的,为进一步分析总体的性质和数据的统计特性提供一些重要信息。
本文就武汉市2008年—2013年的废水排放总量、工业废水排放量、废气排放总量、二氧化硫排放量、工业中二氧化硫排放量、烟尘排放量、工业烟尘排放量、工业固体废物产生量等8个环境污染指标之间的关系进行了一定的分析,为武汉市的环境治理提供一定的理论依据。
二 数学模型、原理及算法
2.1因子分析的一般模型
因子分析的一般模是:112233...,(1,2,3...)i i i i im m X a f a f a f a f i i k ε=+++++=,在这个模型中:
(1)12,,...k X X X 为原始变量经过标准化处理后的标准化变量。
标准化处理可以消除量纲的影响,而且标准化变换不影响变量的相关系数。
这里的X i 都具有均值为0,方差为1的特征。
(2)12,...m f f f 叫做公因子,它们是在各个变量表达式中都出现的因子。
是理论计算出来,实际中不可观测的变量。
(3)εi 称为特殊因子,是每个观察变量特有的,表示该变量中不能被公共因子解释的部分。
它相当于回归分析中的残差项,各个特殊因子之间以及特殊因子与公因子之间是相互独立的。
(4) a ij 称为因子载荷,它是第i 个变量在第j 个公因子上的负载,它的绝对值越大说明,和X i f i 的相依程度越大,即公因子f j 对X i 的载荷量大。
2.2 因子分析中的几个重要概念的统计意义
(1) 因子载荷的统计意义。
因子载荷a y 是X i 与f j 的协方差,也是 X i 与f j 的相关系数。
它是连接观测变量和公因子的纽带,反映因子和变量之间的相关关系。
我们还可以由因子载荷估计出观测变量之间的相关系数:
21222.....i y j i j i jm r a a a a a a =+++
(2)公共方差的统计意义。
公共方差也叫公因子方差,变量共同度,指变量的因子载荷平方和,记为h i2,如:
变量X i 的公共方差为:212222....i i i im h a a a =+++
公共方差表示了变量方差中能被公共因子所解释的部分,它的值越高,变量能被因子说明的程度越高。
公共方差的意义在于说明用公因子代替观测变量以后,原来每个变量的信息被保留的程度。
(3)方差贡献的统计意义。
公因子f j 对所有普量的因子载荷的平方和称为公因子f j 的方差贡献。
记为g i2。
公因子的方差贡献为: 212122...i j j mj g a a a =+++ 所有公因子的总贡献为:2i g ∑
实际中我们常用贡献率这个指标 ,即某个因子的方差贡献和公因子的总贡献的比率。
确定因子个数的方法通常是使累积的方差贡献率达 85 %以上。
2.3. 因子分析的一般步骤
(1)原始数据的标准化。
标准化的公式为X ij =(j ij - X j ) /σj
,其中X ij 为第
i 个变量的第j 个观测量,而X j 和δ
j
分别为该变量的均值和标准差。
标准化的
目的在于消除不同变量的量纲的影响,而且标准化转称不会改变变量的相关系数。
(2)计算标准化数据的相关系数矩阵,并求出相关系数矩阵的特征值和特征向量。
(3)进行正交变换,通过使用方差最大法。
其目的是使因子载荷两极分化,而且旋转后的因子仍然正交。
确定因子个数,计算因子得分,进行统计分析。
三实验数据收集及预处理
进入湖北省统计局网站,找到《2014年武汉市统计年鉴》,从中找到11-35环境保护基本情况表一,并对数据进行一定的处理。
表一
得到表二
将八个环境污染指标进行分析,评价指标表见表三
表三
序号指标名称代码
1 废水棑放总量X1
2 工业废水棑放量X2
3 废气排放总量X3
4 二氧化硫排放X4
5 工业二氧化硫排放量X5
6 烟尘排放量X6
7 工业烟尘排放量X7
8 ^工业固体废弃物产生量X8
四实验
运用SPSS统计软件对数据进行分析。
先对8个指标的数据进行标准化处理,并得到各个指标的相关系数矩阵,如表四所示。
从表中可以看出二氧化硫排放量与工业二氧化硫排放量相关系数为1,二氧化硫排放量与工业烟尘排放量的相关系数为0.986,工业烟尘排放量与烟尘排放量的相关系数为0.934,它们都具有显著的相关性。
表四相关矩阵
公共因子的特征值和贡献率,见表五、表六
表五解释的总方差
提取方法,主成份分析法。
提取方法,主成份分析法。
从表五可以看出前两个因子的累计方差贡献率为87%,超过85%,所以取前两个为主因子,并得到因子载荷矩阵,见表七
提取方法,主成份分析法。
然而得到的初始因子载荷矩阵结构并不简单,各因子的典型代表量都不是很突出,容易使因子的意义含糊不清,不利于对因子进行解释。
为此必须对因子载荷矩阵进行旋转变化,以达到简化结构的目的。
最常用的旋转方法是方差最大正交旋转法,表八就是采用这一方法得到的。
于是得到了F1、F2两个主因子。
旋转在3次迭代后收敛。
五 结果分析
主因子的线性组合为:
112345678
0.0950.1500.5540.9660.9660.9310.9890.827F X X X X X X X X =-+-++++-2123456780.9740.9700.3540.1560.1610.0910.1300.369F X X X X X X X X =-+--+-+ 可以看出主因子F1在X4、X5、X6、X7上的因子负荷较大,它们分别是二氧化硫排放、工业二氧化硫排放量、烟尘排放量、工业烟尘排放量。
主因子F2在X1上的因子负荷较大,它是废水棑放总量。
通过主因子的线性组合公式,我们可以计算出武汉从2008年至2013年环境保护的因子得分,用主因子代替各项指标,得到表九
表九 因子得分表
年份 F1 F2 2008 -73735.8 56820.04 2009 -73487.3 56506.65 2010 -73683.1 56704.71 2011 -72755.4 54743.04 2012 -78339.5 62661.45 2013 -81411.1 67434.64
由表九可以看出,武汉市在F1因子的得分上逐年减小, F1主要表示的是大气环境污染指标,这说明武汉市近几年在大气环境的污染防治上取得一定成效,大气污染物排放量下降,大气环境好转;在F2因子的得分上08年至10年基本保持稳定,11年急剧下降,然而又在12、13年快速上升,F2主要表示水环境污染指标,这说明武汉市自2012年开始水环境污染问题日益严重,废水排放量不断增长。
综上所述,武汉市近几年在大气环境污染治理方面取得一定进展,而在水环境污染治理上应投入更多的资金和技术支持,以应对愈发严重的水环境污染问题。
六 参考文献
[1]吴翊.应用数理统计,1995.01 [2]李广平.环境污染的因子分析,2010.03
[3]沈士珍. 环境质量分析的数理统计方法,1995.12 [4]栾忠祥. 浅析数理统计知识在社会经济的应用,2014.03 [5]湖北省统计局官网.2014年武汉市统计年鉴
/wzlm/sjzx/%20sjkscx/tjnj/gfztjnj/whs/11024 6.html。