云南财经大学实验报告系(院):统计与数学学院专业:经济学创新人才培养基地班级:经基14-1学号: *************名:***实验时间: 2016年5月指导教师:***云南财经大学教务处制城市表层土壤重金属污染分析摘要本文主要是由采样数据对该城市八种重金属元素污染的程度进行分析。
首先我们对采样数据进行预处理,用EXCEL对数据进行处理,然后用MATLAB等软件对所给的数值进行空间作图。
针对问题一我们对八种重金属含量分成若干段段分别来表示不同的浓度,再利用Matlab软件根据取样点的坐标,做出各种重金属元素的空间分布图,并用不同的颜色表示重金属元素的浓度各功能区污染程度针对问题二,对各功能区的污染物含量进行分析,分析推测该城市可能存在规模较大或者数量较多的Hg,Cu,Zn,Pb严重超标的工厂。
为进一步揭示表层土壤重金属污染来源,我们对三个污染相对严重的功能区的超标较严重的重金属元素Hg,Cu,Zn,Pb进行相关性分析,运用MATLAB软件计算出各相关系数,揭示出不同功能区内土壤表层重金属污染的不同来源,分析可得,交通区污染主要来源于汽车尾气排排放,工业区污染主要来源于工厂的超标排放。
第三问为找出传播特征和确定污染源,我们主要是利用MATLAB软件做出8种污染物各自在该城区的矢量图,然后通过直观的观察和线性的拟合来判断污染物的传播特征和污染源的大体位置。
最后说明该模型的缺点以及需要改进的地方。
关键词: MATLAB软件;主成分分析法;内梅罗综合污染指数;矢量图;一、问题重述随着城市经济的快速发展和城市人口的不断增加,人类活动对城市环境质量的影响日显突出。
对城市土壤地质环境异常的查证,以及如何应用查证获得的海量数据资料开展城市环境质量评价,研究人类活动影响下城市地质环境的演变模式,日益成为人们关注的焦点。
按照功能划分,城区一般可分为生活区、工业区、山区、主干道路区及公园绿地区等,分别记为1类区、2类区、……、5类区,不同的区域环境受人类活动影响的程度不同。
现对某城市城区土壤地质环境进行调查。
为此,将所考察的城区划分为间距1公里左右的网格子区域,按照每平方公里1个采样点对表层土(0~10 厘米深度)进行取样、编号,并用GPS记录采样点的位置。
应用专门仪器测试分析,获得了每个样本所含的多种化学元素的浓度数据。
另一方面,按照2公里的间距在那些远离人群及工业活动的自然区取样,将其作为该城区表层土壤中元素的背景值。
附件1列出了采样点的位置、海拔高度及其所属功能区等信息,附件2列出了8种主要重金属元素在采样点处的浓度,附件3列出了8种主要重金属元素的背景值。
现要求你们通过数学建模来完成以下任务:(1) 给出8种主要重金属元素在该城区的空间分布,并分析该城区内不同区域重金属的污染程度。
(2) 通过数据分析,说明重金属污染的主要原因。
(3) 分析重金属污染物的传播特征,由此建立模型,确定污染源的位置。
(4) 分析你所建立模型的优缺点,为更好地研究城市地质环境的演变模式,还应收集什么信息?有了这些信息,如何建立模型解决问题?二、问题分析随着城市经济的快速发展和城市人口的不断增加,人类活动对城市环境质量的影响日显突出。
对于重金属在环境中的影响更为明显,因此研究城市表层土壤重金属污染是迫在眉下的事。
(一)对问题1的分析:对于问题1,经过对数据和题目的分析,直接使用MATLAB 使用二次插值法可以画出8种主要重金属元素在该城区的空间分布图。
对于第二小问,我们首先根据所给的数据将已区分好的各个区域归在一起,求出各种重金属元素在该区域的平均值,建立综合污染指数评价法模型;分析各种重金属元素在各个区域的污染指数来分析该城区内不同区域重金属的污染程度。
(二)对问题2的分析:问题2要求通过数据分析来说明重金属污染的主要原因。
首先可以对重金属和海拔进行相关性分析,得出相关矩阵和相关度,再结合问题一求出的结论分析出重金属可能的主要来源和重金属污染的主要原因。
(三)对问题3的分析:问题3要求通过分析重金属污染物的传播特征,找出污染源的位置。
首先通过对数据的处理得到污染源的可能位置,然后经过建立模型,应用MATLAB进行拟合,从而更好的找到污染源的位置,得到比较满意的结果(四)对问题四的分析:首先对我们建立的模型进行优缺点分析,然后通过查询资料了解影响城市地质环境演变的其他一些因素,从而选择模型解决问题。
三、问题假设1、假设题目中所给数据可靠无误;2、假设问题一中各区平均的污染程度可以看作该区的污染程度;3、假设问题二中只考虑题目中所给的8中重金属,不考虑其它重金属;4、假设重金属传播特征不受风向等因素影响;5、短期内重金属元素的物理、化学变化及迁移对周围环境影响不大;6、不考虑元素间的相互作用的影响;7、不考虑采集填埋土和堆积时间不长的新成土,采集城市老成土。
四、符号说明五、模型的建立与求解5.1问题一的求解5.1.1用MATLAB软件对所给数据进行插值拟合得出调查区的地形图和8 种主要重金属元素在该城区的空间分布图1-1,再用MATLAB软件对所给数据进行分析得出功能区散点图1-2:图1-1:城区地形图图1-2 功能区分布图图1-3 As在该城区的空间分布图图1-4 Cd在该城区的空间分布图图1-5 Cr在该城区的空间分布图图1-6 Cu在该城区的空间分布图图1-7 Hg在该城区的空间分布图图1-8 Ni在该城区的空间分布图图1-9 Pb在该城区的空间分布图图1-10 Zn在该城区的空间分布图说明:图1-1的Z 轴为海拔高度,X 、Y 轴为地理坐标值(单位:m )。
图1-2的X 、Y 轴为地理坐标值(单位:m )。
图1-3到图1-10的Z 轴为重金属元素的浓度(单位:μg/g ),X 、Y 轴为地理坐标值(单位:m )。
5.1.2模型建立土壤环境质量单项污染指数主要用来评价某一污染物的污染程度,指数小污染轻,指数大污染则重。
但区域内土壤环境质量作为一个整体和外区域进行比较时除用单项污染指数外,还常用综合污染指数。
综合污染指数可以综合判断某土壤多种污染物的联合污染效应。
目前土壤环境质量评价方法有很多,各有优点和缺点。
本文根据我国《土壤监测技术规范》(HJ/T 166-2004) 中推荐的内梅罗综合污染指数法进行评价。
在计算某个区域某种重金属单项污染指数分指数的基础上,再计算该区域多种重金属的综合污染指数。
单项污染指数和综合污染指数的计算公式如下:P ij =C j S j (1)P N =√(P j,ave 2+P j,max 2)/2 (2)当P i,j ≤1时表示土壤未受该因子污染,当P i,j >1时,表示土壤受该因子污染。
内梅罗综合污染指数反映了各污染物对土壤的作用,同时突出了高浓度污染物对土壤环境质量的影响。
根据HJ/T 166-2004,内梅罗综合污染指数的分级标准(见表1-1),及以背景值作为评价标准(见表1-2),得出各个区域的污染等级。
5.1.3模型求解本文以背景值作为评价标准进行求解,EXCEL对文中所给数据进行分类,把数据分入1类区、2类区、3类区、4类区、5类区。
然后得出各个区里面主要重金属含量的平均值,用EXCEL做出了各区域各重金属平均值的二维折线图,可看作各区中主要重金属含量值。
如下表:然后根据公式(1)、(2)结合MATLAB软件算得各区重金属单项污染指数和综合污染指数,如下表:再由内梅罗综合污染指数的分级标准得出各区的综合污染等级,如下表:从表中可以看出,该城区内生活区、工业区、主干道路区属于重污染区,公园绿地区属于中等污染区,山区属于轻度污染区。
5.2问题二的求解5.2.1模型的建立采用主成分分析法对重金属污染的原因进行分析:利用已给定的数据,使用主成分分析法分析每类区域中不同化学元素对该地区的主要影响和次要影响,并对八种元素在该地区土壤的污染程度的影响进行排序。
假设进行主成分分析的指标变量有m 个,将各指标值a ij 转换成标准化指标a ij ̅̅̅̅。
其中:a ij̅̅̅̅=a ij −μijs j(i =1,2…,n;j =1,2…,m )相应的,称x i ̅=x i −μis i为标准化指标变量。
相关系数矩阵:R 1=(r ij )m×n ,组成的元素为:r ij =∑aki ∙̃a kj ̃n k=1n−1式中r ii =1,r ij =r j i ,r ij 是第i 个指标与第j 个指标的相关系数。
下面计算相关系数矩阵ℛ的特征值λ1≥λ2≥⋯≥λm ≥0,以及对应的特征向量μ1,μ2,…,μm ,其中,μj=(μ1j ,μ2j ,…μmj )T,由特征向量组成m 个新的指标向量:{y 1=μ11x 1̃+μ21x 2̃+⋯+μm1x m̃y 2=μ12x 1̃+μ22x 2̃+⋯+μm2x m ̃…………y m =μ1m x 1̃+μ2m x 2̃+⋯+μmm x m̃式中y 1是第1主成分,y 2是第2主成分,…,y m 是第m 主成分。
下面计算特征值λj (j =1,2…,m )的信息贡献率和累积贡献率。
主成分y j 的信息贡献率为:b j =λj ∑λkm k=1 j =(1,2,…m )主成分y 1,y 2,…y p 的累积贡献率为:αp =∑λkp k=1∑λkm k=1当αp 接近于1时,则选择前p 个指标量y 1,y 2,…y p 作为p 个主成分,代替原来m 个指标变量,从而可对p 个主成分进行综合分析。
下面计算综合得分:综合得分:Z =∑b j y j p j=1其中b j 为第j 个主成分的信息贡献率,根据综合得分值就可以进行相关的评价。
利用最大方差正交旋转法在因子对应轴相互正交下进行因子旋转,使因子载荷矩阵中因子载荷的平方值向0和1两个方向分化,使每个因子上具有最高载荷变量数最小,使最大的载荷最大,小的载荷更小。
通过适当的旋转得到8种重金属元素在四大主成分中的得分,从中获得旋转后的主成分载荷矩阵,从中可以得到8种重金属元素与四种主成分的相似度。
相对污染指数=重金属土壤含量实测值该重金属土壤含量背景值5.2.2模型求解利用每种重金属的319组相对污染指数代替实测值,更能充分地表现出功能区的污染情况。
因为给定的背景值中可能存在各种重金属污染的程度。
根据引入的5个功能区和319组数据,并利用主成分分析法对8种重金属元素进行污染原因分析。
利用matlab 工具箱中的zscore 函数对数据进行标准化,再用princomp 函数进行主成分分析计算,得到的结果如下:0.225640.186140.693250.628610.0345630.0989630.0129990.165930.376690.26240.287490.367630.334620.494430.402390.230460.389530.414040.308930.0527180.144210.149420.520330.514550.400870.11620.371-----------840.156920.203350.620960.456020.167340.216460.62790.302820.512160.202730.358520.186240.023590.383090.47980.193160.156080.0183030.303820.218010.648980.404940.293030.241460.282830.207410.32-------------9740.516630.439570.370370.034870.125440.275010.860370.0909030.100520.10788----- 根据上述,我们可以得出,各区域的污染程度有严重到一般的顺序为:工业区,交通区,生活区,公园绿地区,山区。