数学建模数据处理
2011 高教社杯全国大学生数学建模竞赛
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网 上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的 资料(包括网上查到的资料 ),必须按照规定的参考文献的表述方式在正文引用处和参 考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规 则的行为,我们将受到严肃处理。
Cu 49.4032 47.1629 9.73~248.85
Cu 127.5358 414.9413 12.7~2528.48
Hg 93.0307 102.9024 12.00~550.00 Hg 642.3553 2.24E+03 11.79~13500
NI 18.3423 5.6623 8.89~32.80
主成分为交通区得到 y1 = 0.4226x1* + 0.3385x2* + 0.4233x3* + 0.3864x4* + 0.4436x5* + 0.4262x6* 对于问题四:我们考虑的模型是主因子模型,由于我们只是考虑从重金属元素浓度
的角度出发进行确定污染源,忽略了其它因子的影响,所以在有些情况求解出的主成分 很可能并不是我们所得到的污染源,故此需要我们对模型进行修正和改进。在研究城市 地质环境演变规模的过程中,我们利用因子分析方法,分析地区降水量,地区土壤的酸 碱度,地下水含量,降水量,大气中重金属沉降,含重金属废弃物的堆积等主要因素的 对城区地质环境演变过程的影响,然后提取共性因子,由此建立模型,以土壤的地质情 况为因变量,找出主因子,并求出各因子得分及载荷,因子分析与主成分分析同样具有 降维的作用,最后得到主要因子及为所求,从而分析城市土壤地质环境的演变过程。
统计表 2
山区
交通区
元 平均值 标准差 范围
元 平均值 标准差 范围
素
素
As 4.0441 1.7993 1.77~10.99 As 5.708 3.2383 1.61~30.13
Cd 152.3197 78.3797 40~407.6
Cd 360.1045 243.392 50.1~1619.8
Cr 38.9579 24.5946 16.2~173.34 Cr 58.0539 81.6055 15.32~920.84
As 7.2514 4.2443 1.61~21.87
Cd 289.9614 183.6808 86.8~1044.5 Cd 393.11 237.5764 114.5~1092.9
Cr 69.0184 107.88913 18.46~744.46 Cr 53.4092 44.0022 15.4~285.58
NI 19.8117 8.3702 4.27~41.7
Pb 69.1064 72.3252 24.43~472.48 Pb 93.0408 85.3673 31.24~434.8
Zn 237.0086 443.6384 43.37~2893.47 Zn 277.9275 350.309 56.33~1626.02
已知数据如:列出了采样点的位置、海拔高度及其所属功能区等信息;给出了 8 种 主要重金属元素在采样点处的浓度和背景值;
现要求通过数学建模解决以下问题: (1) 给出 8 种主要重金属元素在该城区的空间分布,并分析该城区内不同区域重金 属的污染程度。 (2) 通过数据分析,说明重金属污染的主要原因。 (3) 分析重金属污染物的传播特征,由此建立模型,确定污染源的位置。 (4) 分析你所建立模型的优缺点,为更好地研究城市地质环境的演变模式,还应收 集什么信息?有了这些信息,如何建立模型解决问题?
∧
12, R :为 R 的估计值 13, X :为观测值矩阵
3
4.1 问题(1)的分析
四、问题分析
如何画出该城区的画出该城区的空间分布图,再根据采样到的金属元素含量数据, 确定各重金属元素在该城区中各区的空间分布?我们首先用等高线,位置坐标 x,y 画出 总体的城区图,再以以浓度为纵轴以及位置坐标 x,y 画出浓度的总体城区分布图,再分 别画出八种元素在各个城区的分布图,并进行标注。
4.2 问题(2)的分析
根据画出的空间分布图我们只能大致判断污染的程度,并不能准确界定污染程度, 也不明确污染的主要原因。所以我们可以通过处理数据来判定重金属污染的原因。现在 我们利用统计的方法来对各分区重金属元素进行对比分析,我们参考背景值的指标,同 样将采样数据分为 1 区,2 区,…,5 区,对各个区的 8 种元素用 matlab 计算其均值, 标准差,及各种元素在该区的范围,这样有益于与背景值比较且,不会造成太多耗费: 从大致的空间图形中我们大致看出,在人类活动频繁的地方,重金属元素的分布比较集 中,而在山区地区重金属元素的分布比较分散,所以从浓度的高低趋向,我们可以逐步 分析探索重金属元素的污染源
我们参赛选择的题号是(从 A/B/C/D 中选择一项填写):
A
我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名):
贵州大学
参赛队员 (打印并签名) :1.
2.
3.
指导教师或指导教师组负责人 (打印并签名):
日期: 2011 年 9 月 11 日
赛区评阅编号(由赛区组委会评阅前进行编号):
4.3 问题(3)的分析
由于重金属元素污染主要受人类活动影响,我们研究其传播特征,对其累积的过程是 必要的,为此我们还得回到数据上,对数据进行重新分析,找出各分区重金属元素的污 染浓度及范围,再计算出各元素平均分配值,由这些值做样本,进行样本主成分分析, 由于主成分分析利用降维技术用少数几个综合变量来代替原始多个变量,这些综合变量 集中了原始变量的大部分信息,并且它在应用上侧重于信息贡献影响力综合评价,是我 们寻早污染源头的好方法,如果我们计算出这些因子中的第一主成分,在通过主成分程 序运行出的得分矩阵容易得出我们要的污染源的位置。
4.4 问题(4)的分析
由于我们考虑的模型是主因子模型,我们只是考虑从重金属元素浓度的角度出发 进行确定污染源,但对在常规情况下我们忽略了某些因子的影响,所以在有些情况求解 出的主成分很可能并不是我们所得到的污染源,故此需要我们对模型进行修正和改进。
在研究城市地质环境演变规模的过程中,在多因子的影响下,我们利用因子分析方 法,分析地区降水量,地区土壤的酸碱度,地下水含量,降水量,大气中重金属沉降, 含重金属废弃物的堆积等主要因素的对城区地质环境演变过程的影响,然后提取共性因 子,由此建立模型,以土壤的地质情况为因变量,找出主因子,并求出各因子得分及载 荷,因子分析与主成分分析同样具有降维的作用,最后得到主要因子及为所求,从而分 析城市土壤地质环境的演变过程。
2
二、模型假设
1,假设各影响因素之间独立。 2,假设选中的这五种因素为主要影响因素。 3,在着重讨论主要因素时,次要因素对主要因素的影响可以忽略 4,公共因子不相关,且具有单位方差,即 E( f ) = 0m×1 , var( f ) = Im×m ; 5,特殊因子彼此不相关,即 E(ε ) = 0 p×1 : 6,假设因子载荷不唯一: 7,假设主成分向量的协方差矩阵为对角阵:
对于问题一:我们首先用等高线,位置坐标 x,y 画出总体的城区图,再以以浓度为纵 轴 以 及 位 置 坐 标 x,y 画 出 浓 度 的 总 体 城 区 分 布 图 , 再 分 别 画 出 八 种 元 素 (As,Cd,Cr,Cu,Hg,Ni,Pb,Zn)在各个城区的分布图,并进行标注。通过图中坐标对比我 们发现在各个城区中,工业区和交通区污染比较严重,其次是居民区,主干道路及公园 区,山区。
Cu 17.3173 10.7324 2.29~69.06 Cu 62.2149 120.2222 12.34~1364.85
Hg 40.9561 27.8543 9.64~206.79 Hg 446.8225 2.18E+03 8.57~16000
NI 15.4538 10.4278 5.51~74.03 NI 17.6171 11.787 6.19~142.5
对于问题三:由于我们在实际生活中,我们采样得到的往往只是样本值,对于总体 主成分来说并不知道总体 x 的协方差矩阵 Σ 或相关系数矩阵 R ,所以我们进行的是样本主成分
分析,通过 matlab 与 excel 的嵌套调用,将因子进行降维,求解出主成分,并通过与其得分矩阵对 比,找到主成分对应区域或因子,再分析第一,二主成分,确定污染源为第一主成分工业区。第二
6
5.2 关于问题(2)的分析与求解
我们利用 Matlab,计算出每一区各个元素的平均值与标准差,并利用 excel 计算出每 一元素的变化范围,将数据整合到如下表中,并与背景值相比较。
统计表 1
生活区
工业区
元 平均值 标准差 范围
元 平均值 标准差 范围
素
素
As 6.2705 2.1502 2.34~11.45
8,主成分的总方差等于原始变量的总方差:
三、符号说明
1, x1 :生活区各元素平均取值 2, x2 :工业区各元素平均取值 3, x3 :山区各元素平均取值 4, x4 :交通区各元素平均值 5, x5 :公园绿化区各元素平均值 6, x6 :背景对照区元素均值 7, yi :样本主成分得分值
∧
8,Y :样本主成分得分值矩阵 9, Σ : Σ =var( xi ) 10, S : 为 Σ 的估计值 11, R :为相关系数矩阵
2011 高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用): 评 阅 人 评 分 备 注