作业一1.2 分析2016年经济发展情况排名省gdp 占比累计占比1 广东79512.05 10.30 10.302 江苏76086.2 9.86 20.173 山东67008.2 8.68 28.854 浙江46485 6.02 34.875 河南40160.01 5.20 40.086 四川32680.5 4.24 44.317 湖北32297.9 4.19 48.508 河北31827.9 4.12 52.629 湖南31244.7 4.05 56.6710 福建28519.2 3.70 60.3711 上海27466.2 3.56 63.9312 北京24899.3 3.23 67.1613 安徽24117.9 3.13 70.2814 辽宁22037.88 2.86 73.1415 陕西19165.39 2.48 75.6216 内蒙古18632.6 2.41 78.0417 江西18364.4 2.38 80.4218 广西18245.07 2.36 82.7819 天津17885.4 2.32 85.1020 重庆17558.8 2.28 87.3721 黑龙江15386.09 1.99 89.3722 吉林14886.23 1.93 91.3023 云南14869.95 1.93 93.2224 山西12928.3 1.68 94.9025 贵州11734.43 1.52 96.4226 新疆9550 1.24 97.6627 甘肃7152.04 0.93 98.5928 海南4044.51 0.52 99.1129 宁夏3150.06 0.41 99.5230 青海2572.49 0.33 99.8531 西藏1150.07 0.15 100.00将2016各省的GDP进行排名,可以发现,经济发达的的地区主要集中在东部地区。
西部gdp的占比较小。
作出2016各省的gdp直方图如下:作业二 多元回归分析2.1多元线性回归 2.1.1数据来源《福建省统计年鉴-2017》 年份 商品零售价格指数y 农业生产资料价格指数x1 工业生产价格指数x2 工业生产者购进价格指数x3 固定资产投资价格总指数x4 2000 98.9 97.4 100.5 112.4 100.2 2001 98 98.7 98.1 96.7 99.5 2002 98.3 99.9 97.6 97.6 99.7 2003 99.1 101.8 100.7 106.3 101.4 2004 102.7 112.5 102.6 113.3 103.4 2005 100.6 108.1 100.2 108.1 100.7 2006 100.5 100.9 99.2 103.9 102 2007 104.3 110.3 100.8 104.3 105.9 2008 105.7 123.6 102.7 110.2 105.9 2009 97.9 93.3 95.5 93.2 98 2010 103.4 102.4 103.2 107.7 103.3 2011 104.8 111.8 103.9 108 106.2 2012 101.8 103.3 98.7 97.7 100.3 2013 101.1 99.5 98.4 98.4 100.1 2014 101.1 99.5 98.6 98.3 100.4 2015 99.9 101.4 97 96.1 98.3 2016 100.7100.2 99.198 1002.1.2模型假设商品的零售价格会受很多因素的影响,对于影响零售价格指数y 的影响现在仅考虑农业生产资料指数x1、工业生产价格指数x2、工业生产者购进价格指数x3、固定资产投资的影响x4。
2.1.3模型建立为了大致分析y 与x1、x2、x3、x4,建立y 关于x1、x2、x3、x4的散点图,可以看出y 与X 呈现出较为明显的线性相关关系。
由此可以建立y 关于x 的多元线性回归模型:443322110x a x a x a x a a y ++++=运用MatlabR2017a画y关于x的散点图如下:2.1.4模型求解和分析运用MatlabR2017a进行多元回归分析,使用命令为:[b,bint,r,rint,stats]=regress(y,X,alpha)在这里y是n*1的列向量,x是n*(m+1)的矩阵且第一列向量全是1,alpha 采用默认值0.05。
将Excel的数据导入Matlab运行结果截图如下:由计算结果可得:参数参数估计值置信区间a0 11.84 [-23.7566,47.4395]a1 0.1304 [-0.0041,0.2648]a2 0.5429 [-0.1834,1.2961]a3 -0.1796 [-0.3628,0.0036]a4 0.3945 [-0.1545,0.9432]R2=0.8699 统计量观测值F=20.0540 检验值p=0.0000 误差方差估计=0.9995可知y=11.84+0.1304x1+0.5429x2−0.1796x3+0.3945x4以上结果的置信度为95%,R2=0.8699,F=20.0540,p=0.0000<0.05,可知回归模型成立。
分析其杠杆残差图如下:执行 rcoplot(r,rint)由残差图可以看出,除第二个数据外,其它数据的残差离零点都较近,且残差的置信区间均包含零点,这说明回归模型y=11.84+0.1304x1+0.5429x2−0.1796x3+0.3945x4能较好的符合原始数据,而第二个数据为异常点。
由模型可以看出对商量零售价格影响最大的是工业生产价格指数,工业生产价格指数每上升一个点,商品零售价格指数约上升0.5。
2.1.5逐步回归分析运用Matlab采用逐步回归的方法对数据进行建模分析,命令为stepwise(x,y,inmodel,alpha)这里inmodel采取所有变量,alpha采用默认值,输如命令得到下图:可以看出,四条线均为实线,无需对变量进行剔除,选中四条线,可以得到下图:由图可知,模型结果同2.1.4中的模型,即:y=11.84+0.1304x1+0.5429x2−0.1796x3+0.3945x42.2非线性回归2.2.1数据来源《福建省统计年鉴-2017》年份工业总产值(亿元)能源生产量(万吨标准煤)年份工业总产值(亿元)能源生产量(万吨标准煤)1981 87.76 493 1999 3479.84 1634.161982 95.77 522 2000 3994.86 1654.171983 103.97 609 2001 4398.08 1850.441984 131.11 641 2002 5260.2 1923.41985 173.13 690 2003 6616.61 1816.81986 205.1 724 2004 8544.5 1805.751987 265.87 806 2005 9995.89 2488.471988 388.85 918 2006 11855.68 2668.151989 488.96 950 2007 14425.06 2625.281990 531.49 966.52 2008 17141.44 2989.931991 658.86 854.43 2009 18681.48 2939.481992 915.51 1013.39 2010 23805.32 3260.421993 1522.37 1051.43 2011 30330.59 2802.721994 2128.61 1169.96 2012 32379.94 2989.651995 2638.52 1396.24 2013 36724.66 2739.761996 2840.51 1406.04 2014 41579.84 2924.011997 3066.76 1256.3 2015 43888.84 3566.61998 3218.51 1177 2016 47275.84 4490.82.2.2模型假设工业生产总值会收到很多因素的影响,技术的进步会使得能源的利用率得到提高,假设工业生产总值与能源的生产量存在着非线性关系,作工业生产总值关于能源生产量的散点图如下,运用Matlab作散点图,命令为:scatter(x,y),得到的散点图如下:由散点图可知,工业生产总值y 与能源生产量之间x 存在着非线性关系,设y 与x 存在着指数函数关系,即x b x a y **=。
2.2.3模型建立由于是二维,可运用Matlab 的cftool 拟合工具箱对数据进行拟合,结果如下图所示:由拟合结果可知,R 2为0.8016,拟合效果一般,SSE 为1132000000,RMSE 为5856,模型为:x e y *001086.08.974=作业三主成分分析与聚类分析3.1数据来源《福建省统计年鉴——2017》年份固定资产投资(亿元)GDP(亿元)财政总收入(亿元)工业总产值(亿元)第一产业(%)第二产业(%)第三产业(%)GDP增长率(%)人均GDP(元)社会消费品零售总额(亿元)城镇居民人均可支配收入(元)3.2主成分分析经济发展系统包含11个指标:全社会固定资产投资(亿元)、全部工业总产值(亿元)、GDP总量(亿元)、财政总收入(亿元)主要反应福建省的经济规模和总量;第一产业、第二产业和第三产业比重主要反应福建省的经济结构;GDP增长率、人均GDP(元)、城镇居民恩格尔系数、社会消费品零售总额(亿元)主要反应福建省的经济效益。
主成分分析法是利用降维的思想,把多个指标转换为少数几个综合指标(即主成分),其中每个主成分都能够反应原始数据的大部分信息,且所含信息互不重叠。
这里,运用MatlabR2017a进行主成分分析。
首先,需要对数据进行标准化处理,采用zscore函数,结果如下:调用princomp函数函数对标准化处理后的数据进行主成分分析,由于princomp函数不返回贡献率,需要用协方差矩阵的特征值向量latent来计算,命令为explained = 100*latent/sum(latent)。
为了直观,将处理后的数据储存在元胞数组中,命令如下:处理结果如下:由处理结果可知,第一主成分的贡献率达到78.91%,第二主成分贡献率为14.14%,累计贡献率为93.05%,超过85%,因此,只需提取前两个主成分。
由COEEF第一、二列可知:y1=0.3332x1+0.3386x2+0.3380x30.3384x4+0.3077x5+0.2567x6 +0.1888x7+0.0786x8+0.3387x9+0.3372x10+0.3388x11 y2=0.1332x1+0.0346x2+0.0347x3+0.0126x4+0.3106x5+0.5009x6 +0.3537x7+0.0769x8+0.0222x9+0.0.0822x10+0.0163x113.3聚类分析运用Matlab对数据进行分析,这里采用分部聚类法对福建省2000——2016的经济发展进行分析,对其发展的类型作一个简单的划分。