当前位置:
文档之家› 第十四届五一数学建模竞赛C题
第十四届五一数学建模竞赛C题
二、基本假设
1、假设评价宜居城市的指标和相应的数据都是合理并具有代表性的 2、假设人为的主观因素对宜居城市的排名不产生影响或者影响可以忽略 3、假设在一二三问中不需要考虑第四问的不确定因素的影响 4、假设所筛选出的主要指标仅对本文需要排名的城市具有代表性,并不能完全
作为评价其他宜居城市的指标 5、假设主成分分析法得到的主成分只要累计贡献率达到 85%,就能代表原始数
查阅相关资料和数据,结合数据特点,回答下列问题: 问题 1. 通过查阅资料,筛选评价宜居城市的主要指标,并阐述这些指标的 合理性。根据所筛选的主要指标,建立评价宜居城市的数学模型。 问题 2. 利用你构建的评价宜居城市的数学模型,对淮海经济区内的 8 个城 市(宿迁、连云港、宿州、商丘、 济宁、枣庄、徐州、淮北)进行合理性研究, 给出宜居城市排名。 问题 3. 以问题 2 为例,定量分析你所建立的模型中,哪些评价指标的变化 会对宜居城市排名产生显著的影响。 问题 4. 一些不确定性的因素(如突发自然灾害、房价大幅波动、宏观政策 的重大调整等)会对宜居城市的某些指标产生重大影响。建立基于某些不确定性 因素的评价宜居城市的数学模型,并重新讨论问题 2。 问题 5. 根据上述定量分析的结果,请有针对性地给出进一步提高徐州市宜 居水平的政策建议。
在问题三中,主要探究哪些评价指标的变化会对宜居城市的排名产生显著的 影响。我们需得在问题二的基础上建立新的模型重新对数据进行定量分析,评价 指标对于宜居度的影响力。再用各个指标的贡献率的大小对答案进行验证。
对于问题四,在自然灾害,房价大幅度波动,宏观政策等不确定因素对问 题二中的变量产生影响的基础上对问题进行分析处理。研究此时哪些指标对最后 城市适宜度的影响。由于数据的不确定性关系。我们选择模糊化处理的方法处理。 建立起城市适宜度与各指标(受三个不确定性因素影响较大的数据)间的线性回
据的几乎所有的信息。
三、符号说明
1
符号
意义
单位
Yi
筛选前的 19 个指标
Xi
筛选后的 16 个指标
Fi
第 i 个主成分
yj
第 j 个指标的平均值
sj
第 j 个指标的均方差
aij
第 i 个主成分的第 j 个指标的系数
ni
第 i 个主成分的贡献率
四、问题分析
问题一需要我们筛选出评价宜居城市的主要指标,同时阐述这些指标的合理 性。并根据所筛选的主要指标,建立评价宜居城市的数学模型。首先,评价指标 体系进行适当筛选,从中选取城市人口,人口密度,人均地区生产总值,绿化覆 盖率等 19 个具有代表性的定量指标,分别用 Y1 , Y2 ··· Y19 表示,之后我 们用最小均方差法对指标进行了筛选,将均方差小于 1 的指标忽略,得到 16 个 主要指标,分别用 X1 , X2 ··· X16 表示。
参赛队号:
00985
参赛组别(研究生、本科、专科、高中): 本科
所属学校(学校全称)
西南交通大学峨眉校区
参赛队员(打印并签名): 1.
李科
2.
李洋
3.
梁宇
日期: 2017 年 5 月 1 日
获奖证书邮寄地址: 四川省乐山市峨眉山市黄湾乡西南交通大学峨眉校区
邮政编码:
614202
收件人姓名:
李科
联系电话: 18398627470
y j )2
( j 1,2,...,19) ;
(3)求最小均方差:
s j0 min s1, s2 ,..., s j (1 j0 19) ;
计算结果如下表所示:
表二:各项指标的均值与均方差
指标
平均值
y1
公交线路(条)
63.000
y2
绿化覆盖率(%)
42.125
y3
平均房价(元)
5141.625
y4
人均住房面积(平方米) 38.325
五一数学建模竞赛
承诺书
我们仔细阅读了五一数学建模竞赛的竞赛规则。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮
件、网上咨询等)与本队以外的任何人(包括指导教师)研究、讨论与赛题有关
的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其它
公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正
本文的特色在于将所有的定量指标通过主成分分析法综合提取到了四个主 要成分,并且其累计贡献率高达 90.42%,可以近似看作完全代表了指标的影响 力。同时使用了变异系数法与主成分分析法相互比较与检验,并且通过模糊化处 理加入了不确定性因素,使得整个问题得到了多方面的解答。
一、题提出
城市宜居性是即当前城市科学研究领域的热点议题,也是政府和城市居民密 切关注的焦点。建设宜居城市已成为现阶段我国城市发展的重要目标,对提升城 市居民生活质量、完善城市功能和提高城市运行效率具有重要意义。
设有 i 个评价对象,每个评价对象都有 j 个评价指标,其指标观测值分别为
yi ( yi1, yi2 ,..., yi19 ) (i 1,2,...,8)
(1)求第 j 项指标的平均值:
yj
1 n
8
yij
i1
( j 1,2,...,19) ;
(2)求第 j 项指标的均方差:
sj
1 n
8
( yij
i1
主成分分析是数学上对数据降维的一种方法。由于主成分分析法以最少的信 息丢失为前提,将众多的原有变量综合成较少几个综合指标,主成分个数远远少 于原有变量的个数 ,且主成分能够反映原有变量的绝大部分信息,之间互不相 关,于是我们使用主成分分析法对筛选出的 16 个指标提取得到 4 个主成分,分 别用 F1, F2 , F3, F4表示。通过计算每个主成分的指标系数和成分贡献率, 最终得到主成分综合评价模型。
主成分分析是数学上对数据降维的一种方法。由于主成分分析法以最少的信 息丢失为前提,将众多的原有变量综合成较少几个综合指标,主成分个数远远少 于原有变量的个数 ,且主成分能够反映原有变量的绝大部分信息,之间互不相 关,于是我们使用主成分分析法对筛选出的 16 个指标提取得到 4 个主成分,分 别用 F1, F2 , F3, F4表示。通过计算每个主成分的指标系数和成分贡献率, 最终得到主成分综合评价模型。
y5
人均地区生产总值/元
42176.625
y6
犯罪率排行(第 位)
105.875
y7
三甲医院(座)
2.750
y8
新农合参保率(%)
99.613
y9
第三产业占 GRP 的比重(%) 40.138
y10
人均淡水资源总量(吨) 6.650
问题二则通过将得到的特征向量与 8 个城市标准化后的数据相乘, 就可以得 出基于四种不同主成分的评价模型的排名情况。问题三则需得在问题二的基础上 建立新的模型重新对数据进行定量分析,评价指标对于宜居度的影响力。再用各 个指标的贡献率的大小对答案进行验证。
对于问题四,在自然灾害,房价大幅度波动,宏观政策等不确定因素对问 题二中的变量产生影响的基础上对问题进行分析处理。研究此时哪些指标对最后 城市适宜度的影响。由于数据的不确定性关系。我们选择模糊化处理的方法处理。 建立起城市适宜度与各指标(受三个不确定性因素影响较大的数据)间的线性回 归模型,最终分析出对城市适宜度影响最大的指标。最后,在问题五中,我们从 徐州市在问题一,二,三,四中的指标影响度以及其权重出发,分别从高校数, 交通便利度,平均房价等方面提出了进一步提高徐州市宜居水平的政策建议。
5.1.2 问题一模型的建立与求解
最小均方差法对指标的筛选
通过查阅2016年宿迁、连云港、宿州、商丘、 济宁、枣庄、徐州、淮北的 统计年鉴,8个城市分别对应的19个定量指标 Y1 ,Y2 ···Y19 的数据如下(详 情请见附录一)
城市 y1 公交线路(条) y2 绿化覆盖率(%) y3 平均房价(元) ······
五一数学建模竞赛
题目
C 题: 宜居城市问题
关键词:最小均方差法 主成分分析法 定量分析 模糊分析 变异系数法 摘 要:
城市宜居性是即当前城市科学研究领域的热点议题,也是政府和城市居民密 切关注的焦点。我国宜居城市的排名每年都是热门话题,不同机构对宜居城市的 排名结果不尽相同,宜居城市评价指标体系不同,宜居城市排名结果也会发生变 化。本文则是通过在不同的评判条件下,对淮海经济区内的 8 个城市(宿迁、连 云港、宿州、商丘、 济宁、枣庄、徐州、淮北)进行合理性研究,给出宜居城 市排名。
我国宜居城市的排名每年都是热门话题,不同机构对宜居城市的排名结果不 尽相同,宜居城市评价指标体系不同,宜居城市排名结果也会发生变化。宜居城 市是指那些社会文明度,经济富裕度,环境优美度,资源承载度,生活便宜度, 公共安全度较高,城市综合宜居指数在 80 以上且没有否定条件的城市。人们选 择留在某个城市,不单是为了生存,更是寄托了自己的梦想与希望。对很多人来 说,衡量是否宜居或许就是八个字:衣食住行、安居乐业。
表一:指标原始数据
48.5 5980 5967
47.2 11477 4783
47.7 22108 5571
46.3 29041 11159
47.3 5780 4691
48.1 46.9 48.3 9780 29604 14680 2431 13479 3603
通过原始数据可以发现,有些数据比如绿化覆盖率在 8 个城市中的变化程度 很小,所以它对 8 个城市宜居度的影响可以近似忽略,这样就可以简化数据量, 起到筛选指标的作用。根据这个原理,我们采用了最小均方差法对指标进行筛选。
问题一首先对评价指标体系进行适当筛选,从中选取城市人口,人口密度, 人均地区生产总值,绿化覆盖率等 19 个具有代表性的定量指标,再用最小均方 差法对指标进行了筛选,将均方差小于 1 的指标忽略,得到 16 个主要指标,并 对指标进行了合理化分析。由于主成分分析法以最少的信息丢失为前提,将众多 的原有变量综合成较少几个综合指标,主成分个数远远少于原有变量的个数 , 且主成分能够反映原有变量的绝大部分信息,之间互不相关,于是我们使用主成 分分析法对筛选出的 16 个指标提取得到 4 个累计贡献率 90.42%的主成分,通过 计算每个主成分的指标系数和成分贡献率,最终得到主成分综合评价模型。