基于SAS分析市GDP影响因素的研究一、前言是中华人民国的首都、直辖市和国家中心城市,是全国的政治、文化、科教和国际交往中心,是世界著名的古都和现代国际城市。
2011年全年市实现地区生产总值(GDP)16000.4亿元,按可比价格计算,比上年增长8.1%,其中人均GDP达到80394元人民币,按年平均汇率折合12447美元;2011年年末,市常住人口突破2000万大关,达2018.6万人;2011年12月,居民消费价格指数(CPI)同比上涨4.4%。
按2010年世界银行划分世界上不同国家和地区的贫富程度标准来看,实现的人均GDP已处于上中等富裕国家地区的上游,接近富裕国家地区的水平。
2012年市实现地区生产总值17801亿元,按可比价格计算,比上年增长7.7%,增幅比上年略低0.4个百分点。
市人均地区生产总值86024元,折合13686美元。
加快文化创意产业集聚区建设,支持文化企业重组、改造和上市,预计文化创意产业总收入超过9000亿元,增长20%以上。
国外旅游人数达到2.1亿人次,旅游总收入3216.2亿元。
第三产业比重为75.7%。
更新淘汰老旧机动车22.4万辆,新增纯电动车1100辆,单位地区生产总值能耗、水耗和主要污染物排放量继续全面下降。
是综合性产业城市,综合经济实力保持在全国前列,第三产业规模居中国大陆第一。
2012年总部经济发展能力第1名。
初步核算,2013年实现地区生产总值19500.6亿元,比上年增长7.7%。
其中,第一产业增加值161.8亿元,增长3%;第二产业增加值4352.3亿元,增长8.1%;第三产业增加值14986.5亿元,增长7.6%。
按常住人口计算,市人均地区生产总值达到93213元。
三次产业结构由2012年的0.8:22.7:76.5变为0.8:22.3:76.9。
作为首都第一个大规模整体定向开发的金融功能区,进过十几年的发展,金融街已经成为中国的金融决策监管中心、资产管理中心、金融支付结算中心、金融信息中心:金融街集中了中国人民银行、中国银监会、中国证监会、中国保监会等中国最高等金融决策和监管机构,几乎所有有关中国金融的重大决策都在这里酝酿、讨论和最终形成,是中国金融业最具影响力的金融中心区。
二、理论背景为了在更高层次上发展市的经济,关注市GDP 是必要的。
GDP 是按市场价格计算的国生产总值的简称,它是一个国家(地区)所有常住单位在一定时期生产活动的最终成果。
GDP 是国民经济核算的核心指标,也是衡量一个国家或地区经济状况和发展水平的重要指标。
而影响到业GDP 的因素是多方面。
例如,居民消费、政府消费性支出、政府购买、出口、居民收入、投资等。
为了实证对GDP 具体影响因素,以便于我们根据实证结果,提出政策性建议,针对市目前的发展情况,本文选取了1978年到2011年的时序数据作为研究的围,以市GDP 为被解释变量,并选取固定资本形成总额、社会消费品零售总额、出口总额为解释变量。
研究影响GDP 的影响因素可以进一步证实其反映出了人民生活水平,生活质量的提高;也可以反映出市经济的脉象,便于市更好的发展。
三、建立模型本模型是通过对市1978—2011年数据进行研究确定模型所包含的变量,因变量(被解释变量)为GDP (Y 单位:亿元),自变量(被解释变量)有3个,固定资本形成总额(X1单位:亿元)社会消费品零售总额(X2单位:亿元)出口总额(X3单位:亿美元)确定模型的数据形式,我们先假设数学模型为:tX X X Y εββββ++++=3322110四、实验方法本次研究主要是分析自变量和因变量的关系以及找出合适的模型,并且运用时间序列的方法对社会消费品零售总额进行预测分析。
我们先用SAS 对我们假定的模型tX X X Y εββββ++++=3322110对变量X1,X2,X3分析,看看它们与Y 的关系(运用的方法的逐步回归和主成分法)然后在GDP 进行时间序列分析,最后预测未来3年的数据。
五、数据来源1.数据来源于中国知网2.数据引入六、SAS 操作1.逐步回归法逐步回归的基本思想是:首先在待选的M 个变量中选择一个对因变量影响最大的自变量,这可以通过因变量与每一自变量进行回归得到的F 值来判断。
若最大的F 值在给定的显著性水平下是显著的,则该变量被选中,否则选元结束。
第二步,在剩下的M-1个变量中再选择一个变量加入到模型中,这可以通过偏F 检验来判断。
偏F 统计量为: ()()()3,1~,1/11-=N F X X MSE X X SSR F j j其中()()()111,X SSR X X SSR X X SSR j j -=,表示模型已存在变量1X 的条件下新加入变量jX对因变量的贡献。
若最大的偏F 统计量在给定的显著性水平下是显著的,则对应的自变量则被加入到模型中,否则不再加入其它变量,选元结束。
第三步,对已在模型中的每个变量进行显著性检验。
若检验不显著,则去掉该变量,再重复进行第二步和第三步,否则保留该变量,重复进行第二步和第三步,这一过程一直进行到待选的全部自变量根据给定的显著性水平没有一个再能被选入模型或排除出刚构成的回归模型为止。
输入程序:data exp3;input Y X1 X2 X3;cards;82.65 18.55 25.2 8.6593.01 23.91 29.08 12.21103.53 25.56 34.64 15.42107.96 25 38.04 15.37114.11 32.36 39.76 14.24123.42 38.27 44.63 14.27147.53 48.67 52.17 12.34175.78 67.6 64.12 11.53.74 75.89 81.39 12.55220.12 81.63 95.57 15.17259.71 96.85 121.28 16.83283.49 95.43 134.3 16.86310.95 98.03 .88 17.86342.65 144.19 159.44 16.06411.04 185.12 181.2 17.52538.94 246.16 227.42 19.42732.89 345.46 303.37 24.00931.97 417.95 375.64 29.981121.93 491.9 470.04 40.491264.63 556.43 535.02 50.181374.6 640.15 587.12 54.991500.95 631.92 657.28 63.321701.88 695.1 736.63 86.291919.09 805.34 832.7 95.022150.76 926.65 941.36 115.952578.03 1180.54 922.27 143.743110.97 1446.49 1044.78 208.653905.64 1739.4 1190.06 274.154462.74 2087.24 1356.79 335.405252.76 2615.09 1603.74 381.616719.01 3594 2078.7 422.297521.85 5077.89 2430.83 299.859224.46 6468.54 2902.55 375.1711307.3 8069.94 3395.06 444.98;proc reg graphics;model Y=X1 X2 X3/selection=stepwise sls=0.05sle=0.2r;plot student.*p.='*';run;该程序告诉我们先建立一个临时数据集(一般临时的数据集在逻辑库里的work中)名叫EXP3;里面有4个变量Y X1 X2 X3.其中proc reggraphics 是表示回归作图“selection=stepwise”表示逐步回归(选元,并给出回归结果),“sls=0.05”表示变量保留在模型中的显著性水平为0.05,而“sle=0.2”则表示变量选入到模型中的显著性水平为0.2,PLOT语句画标准残差与预测值的残差图。
逐步回归结果图和残差图图1图2图3图4图5图6从图1至图6是对因变量Y 进行逐步回归的结果,第一步(图1),变量X2被加入到模型中,说明三个自变量分别关于Y 回归,其中由X2与Y 回归得到的F 统计量值最大,为3642.82,对应的概率为0.0001,在0.05的显著性水平下通过检验。
第二步,分别把变量X1和X3加入到刚建立的模型中,并分别计算其偏F 检验值,结果表明X1的偏F 统计值大于X3的偏F 统计值,为20.3对应的概率为0.0001,小于进入模型的显著性水平0.20,所以X1被选入到模型中,此时模型中已有EXPEND 和ads 两个变量。
第三步,对X3和X1分别计算其偏F 统计量值及其对应的概率(程序繁多就不一一输出),结果两个变量的偏F 检验对应的概率都小于保留在模型中的显著性水平0.05,因此两个变量都被保留下来。
第四步,重复第二步和第三步,即把最后一个变量加入到由X2和X1对Y 进行回归的模型中,结果两个变量的偏F 检验对应的概率也都小于保留在模型中的显著性水平0.05,因此两个变量也都可以被保留下来。
从残差图(图6)中和逐步回归表中可以得到回归方程如下:32148899.421375.163530.003105.0X X X Y +++-=统计量值: (0) (854.93) (361.21) (624.13)F=41426.4对应概率:(0.9981)(<0.0001) (<0.0001) (<0.0001) (<0.0001) R-Square = 0.9998 and C(p) = 4,MSE=2164.55531,SSR=649371、固定资产形成总额,社会消费品零售总额和出口总额都与GDP 有显著的 关系。
2.固定资产形成总额的系数表明固定资产形成总额没每加1亿元,GDP 将增加0.6353亿元;社会消费品零售总额的系数表明社会消费品零售总额每1亿元,GDP 将增加1.21375亿元,出口总额每增加1亿美元,GDP 将增加4.48899亿元。
2.多重共线性多重共线性是指在多元回归分析中自变量之间存在线性关系,用数学术语来表达就是系数矩阵的秩<P+1,即R()<P+1,换句话说,某一个自变量可以被其它自变量线性表示,此时称自变量之间完全共线。
但实践中,由于系数矩阵来自于样本观测,所以自变量之间的完全共线往往较少,代之的是自变量之间的近似共线性或称为高度共线性。
当回归模型中的自变量存在高度共线性时,虽然参数的OLS 法估计量仍是的BLUE 估计,但其估计量的稳定性却很差,也就是说对于不同的样本得到的参数估计值往往差别很大,从而造成检验失效。