大学生数学建模竞赛
承 诺 书
我们仔细阅读了大学生数学建模竞赛细则。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。
参赛队员 (签名) :
队员1:
队员2:
队员3:
大学生数学建模竞赛组委会
大学生数学建模竞赛
编 号 专 用 页
选择的题号: B
(以下内容参赛队伍不需要填写)
竞赛评阅编号:
大学生数学建模竞赛
题目: 各地区经济发展评价
【摘 要】
在当今世界经济全球化的趋势下,资源市场竞争不断地增大,中国的经济实力及综合国力水平近几年时间里都有了大幅度的发展。在经济发展水平向前推进的同时,也由于各地区经济发展受到自然条件、资源条件、人口数量、政策等影响,产生了地区发展不平衡问题。
我们根据2011年的统计数据,先用spss软件对数据进行标准化处理,处理后不用再考虑单位的问题。再对各地区发展经济水平采用因子分析,选取具有决定性的关键因子,根据所得变量的相关系数矩阵内部的研究,找出控制所有变量的少数几个变量去描述原始变量之间的相似关系。通过对指标的分析和最后得到的综合因子得分,可以从中看出全国各地区经济发展状况。
在因子分析基础上,根据得出影响经济发展水平的关键因素,提取出的两个因素(人均GDP和第三产业)作为聚类分析的指标,运用SAS软件对数据进行聚类分析,通过分析元素的指标值来分辨元素之间的差距。按照经济发展水平,把31个地区分成四大类,每一类的经济发展水平相差不是很大,可以采用类似或同样的措施去发展。根据这四类的情况,我们提出了一些政策性建议。
关键词:经济全球化 标准化 因子分析 聚类分析
第 1 页 共 4 页 一、背景
当今世界已步入了全球性经济大协作,资源市场大竞争,经济循环一体化时代。中国的经济实力及综合国力水平在近几十年的时间里都得到了长足的发展。在经济发展水平向前推进的同时,由于各地区经济发展受到自然条件,资源条件,人口数量,政策等影响,产生了地区发展不平衡问题。
地区经济发展是指一个地区从贫困、落后的状态向经济化及社会生活化发展的过程。如何客观、正确的地评价各地区的经济状况,选择正确的发展方向,提高人们的生活水平,是实现经济全面、协调、可持续发展的关键。我国社会主义现在化建设取得的一切成就都是建立在经济持续发展的基础上,所以经济发展仍是解决我国所以问题的关键。
我国虽然国土辽阔,但却是一个经济与社会发展水平,资源与环境状况在各地区差异非常大。因受到各种因素的综合作用,我国各地的发展水平存存在很大差异,区域经济发展水平呈现出不平衡的状态。在国家规划下下一步发展战略及出台相关政策时,急需对各个地区的经济和社会综合实力做出评价。
二、问题的重述
中国作为世界上的发展中国家,其经济实力及综合国力水平在近几十年的时间里都得到了长足的发展。经济实力的不断攀升,以及经济增长速度的持续加速,令中国经济已成为世界各国所关注的焦点。在制定允许一部分人先富起来的政策之后,在经济发展水平向前推进的同时,也产生了地区发展不平衡问题。国家为了实现各地区的均衡发展,首先需要了解各地区的发展状况,才能采取一系列相应的解决方案。
三、问题的分析
影响城镇化水平的因素是很多的,建立模型目的是为了解各地区经济发展水平,根据模型的结果,提出合理的建议。2011年的表中数据众多,为更好的比较和评估,从中找出来9个具有代表性的数据作为经济因素,分别为GDP(亿元),固定资产投资(元),进出口总额(万美元)第一产业(亿元),第二产业(亿元),第三产业(亿元),工业总产值(亿元),储蓄总额(亿元), 人均GDP(元),运用spss软件,对数据进行标准化处理,通过SAS软件计算所选指标,得出样本的因子得分,从而找到与原始变量的相关性,更合理地揭示了影响经济发展水平的因素。
再根据找到的指标用SAS进行聚类,把31个地区,根据经济发展状况相似的分成一类,便可针对这一类地区提出一些建议,适合它们发展。
四、模型的假设
(1)收集的数据真实可靠。
(2)一定时期内经济政策不会有较大的调整。
(3)一定时期内不会爆发较大的自然灾害。
第 2 页 共 5 页 五、符号说明
符号 符号的意义
GDP 国内生产总值
Gd 固定资产投资
GY 工业总产值
JC 进出口总额
DYCY 第一产业
DECY 第二产业
DSCY 第三产业
RJ 人均GDP
if 31各地区(1,2,,31i)
iy 标准化值(1,2,,31i)
x 平均值
s 标准差
六、模型的建立和求解
1.数据的处理
在建立模型之前,首先对数据进行分析。所给的所有数据数值过大,单位不同意,会导致在后面的分析结果存在很大的误差,提出错误的建议。为了减小误差,使建议更符合实际,对数据进行标准化处理。
1.1标准化处理
统计学原理告诉我们,要对多组不同量纲的数据进行比较,可以先将它们标准化转化成无量刚的标准数据。而综合评价就是要将多组不同的数据进行综合,因而可以借助于标准化方法来消除数据量纲的影响。标准化(Z-score)公式为:
iixxys
第 3 页 共 6 页 上式中:
11niixxn
2111niisxxn
通过对数据的选取并进行标准化处理,得到处理后的数据见附录一。
2 .因子分析模型
2.1因子分析法简介
因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。
2.2因子分析法的一般步骤
(1)计算kx及ks(,1,2,,kjm),建立基本方程组。
(2)用主成分分析法确定因子载荷阵A。
(3)方差极大正交旋转,对变量系数极值化(尽量趋于0或1)。
(4)得到因子得分函数,计算样本因子得分。
2.3因子分析模型
由于问题的个数较多,不便于分析排序,因此,考虑先做因子分子找出影响各地区经济的共同因子,在计算因子得分,通过因子分析得分来分析各地区评价经济的关键因素。
用SAS软件对九个和经济有关的因素(GDP,固定资产投资,城工业总产值,进出口总额,储蓄总额,第一产业,第二产业,第三产业,人均GDP)的数据进行处理(具体数据见附录一)。
Eigenvalues of the Correlation Matrix: Total = 9 Average = 1
Eigenvalue Difference Proportion Cumulative
1 6.90502074 5.60729656 0.7672 0.7672
2 1.29772417 0.80924975 0.1442 0.9114
3 0.48847442 0.34662689 0.0543 0.9657
4 0.14184753 0.05160472 0.0158 0.9815
5 0.09024281 0.04499835 0.0100 0.9915
6 0.04524446 0.01680478 0.0050 0.9965
7 0.02843968 0.02566622 0.0032 0.9997
8 0.00277346 0.00254074 0.0003 1.0000
9 0.00023272 0.0000 1.0000
第 4 页 共 7 页 2.3.1 特征值(因子贡献率)
运行结果显示了7个因子对应的特征值、因子贡献率等。通常确定因子个数时,要求因子累计贡献率大于80%,结果表明应该选取 2个因子,记为 F1,F2 ,贡献率分别为76.72%,14.42%.
2.3.2确定因子载荷阵系数,得到初始的特征向量。
Factor Pattern
Factor1 Factor2
GDP 0.99702 -0.03229
gd 0.87199 -0.29471
gy 0.98618 -0.10780
jc 0.82571 0.38352
cx 0.94405 0.15058
dycy 0.71909 -0.63930
decy 0.98555 -0.12323
dscy 0.95633 0.18670
rj
0.44951 0.75478
由于对应实际问题,公共因子的实际意义不好解释,因此考虑将指标的系数极值化,即让系数趋于1或0,趋于1说明公共因子与该指标密切相关,趋于0时,说明相关程度很低,由此,要做因子旋转实现系数的极值化。
因子旋转程序运行结果如下:
The FACTOR Procedure
Rotation Method: Varimax
Orthogonal Transformation Matrix
1 2
1 0.83616 0.54848
2 -0.54848 0.83616