当前位置:文档之家› 多元回归分析案例解析

多元回归分析案例解析

计量经济学案例分析多元回归分析案例学院:数理学院班级:数学092班学号: *********姓名:***摘要:为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,用Eviews 软件对相关数据进行了多元回归分析,得出了相关结论关键词:多元回归分析 ,Evicews 软件, 中国人口自然增长; 一、 建立模型为了全面反映中国“人口自然增长率”的全貌,选择人口自然增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP ”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。

国名总收入,居民消费价格指数增长率,人均GDP 作为解释变量暂不考虑文化程度及人口分布的影响。

通过对表1的数据进行分析,建立模型。

其模型表达式为:i i i i i u X X X Y ++++=332211ββββ (i=1,2,,3)其中Y 表示人口自然增长率,X 1 表示国名总收入,X 2表示居民消费价格指数增长率,X 3表示人均GDP ,根据以往经验和对调查资料的初步分析可知,Y 与X 1,X 2 ,X3呈线性关系,因此建立上述三元线性总体回归模型。

Xi 则表示各解释变量对税收增长的贡献。

µi 表示随机误差项。

通过上式,我们可以了解到,每个解释变量增长1亿元,粮食总产值会如何变化,从而进行财政收入预测。

相关数据: 表1年份人口自然增长率(%。

)Y 国民总收入(亿元)X1居民消费价格指数增长率(CPI )%X2 人均GDP(元)X31988 15.7315037 18.8 1366 1989 15.04 17001 18 1519 1990 14.39 18718 3.1 1644 1991 12.98 21826 3.4 1893 1992 11.6 26937 6.4 2311 1993 11.45 35260 14.7 2998 1994 11.21 48108 24.1 4044 1995 10.55 59811 17.1 5046 1996 10.42 70142 8.3 5846 1997 10.06 78061 2.8 6420 1998 9.14 83024 -0.8 6796 1999 8.18 88479 -1.4 7159 2000 7.58 98000 0.4 7858 2001 6.95 108068 0.7 8622 2002 6.45 119096 -0.8 9398 2003 6.01 135174 1.2 10542 2004 5.87 159587 3.9 12336 2005 5.89 184089 1.8 14040 2006 5.38 213132 1.5 16024 2007 5.24 235367 1.7 17535 20085.452776541.919264二、 参数估计利用上表中的数据,运用eview 软件,采用最小二乘法,对表中的数据进行线性回归,对所建模型进行估计,估计结果见下图。

从估计结果可得模型:321005881.0050364.0000392.077177.15ˆX X X Y -++= Y 关于X 1的散点图:可以看出Y 和X 1成线性相关关系Y 关于X 2的散点图:可以看出Y 和X 2成线性相关关系Y关于X的散点图:3成线性相关关系可以看出Y和X3回归结果三、模型检验:1、经济意义检验模型估计结果说明,在假定其它变量不变的情况下,当年国民总收入每增长1亿元,人口增长率增长0.000392%;在假定其它变量不变的情况下,当年居民消费价格指数增长率每增长 1%,人口增长率增长0.050364%;在假定其它变量不变的情况下,当年人均GDP 没增加一元,人口增长率就会降低0.005881%。

这与理论分析和经验判断相一致。

2、统计检验 (1)、拟合优度检验由于 2TSS Y Y nY '=-, 2ESS X Y nY β∧''=- 所以 2ESS R TSS ==0.941625, 2211(1)1n R R n k -=----=0.930680,可见模型在整体上拟合得非常好。

(2)、F 检验由于 RSS TSS ESS =- 所以 //(1)ESS kF RSS n k =--=86.02977 ,针对0:3210===βββH ,给定显著性水平0.05α=,在F 分布表中查出自由度为k-1=3和n-k-1=16的临界值24.3)16,3(=αF 。

由表 3.4中得到F=86.02977 ,由于F=86.02977 >24.3)16,3(=αF 应拒绝原假设0:3210===βββH ,说明回归方程显著,即“国民总收入”、“居民消费价格指数增长率”、“人均GDP ”等变量联合起来确实对“人口自然增长率”有显著影响。

(3)、t 检验由于=--=--=∑112;2k n e k n e e i σ 0.780038 且=0β S 0.830371,=1β S 8.89415E-05 ,=2β S 0.03196669,=3β S 0.00121009 , 当0010:0,:0H H ββ=≠, ==00βββS t 18.99364在0.05α=时, 2αt (16)=2.120因为t=18.99364>2.120,所以在95%的置信度下拒绝原假设,说明截距项对回归方程影响显著。

当0111:0,:0H H ββ=≠==1011βββS t 4.407392在0.05α=时,2αt (16)=2.120因为t=4.407392>2.120所以在95%的置信度下拒绝原假设,说明X1变量对Y 影响显著。

当0212:0,:0H H ββ=≠==222βββS t 1.575515在0.05α=时,2αt (16)=2.120因为t=1.575515<2.120,所以在95%的置信度下接受原假设,说明X2变量对Y 影响不显著。

当0313:0,:0H H ββ=≠ ==333βββS t - 4.859971在0.05α=时,2αt (16)=2.120因为t=- 4.859971<2.120,所以在95%的置信度下接受原假设,说明X3变量对Y 影响不显著。

(4)、012345,,,,,ββββββ的置信区间0β的置信区间为:0220000t St S ααβββββ∧∧∧∧-<<+,计算得:∈0β(14.01138,17.53216);1β的置信区间为:1221111t S t S ααβββββ∧∧∧∧-<<+,计算得:∈1β(0.000203,0.000581);2β的置信区间为:2222222t S t S ααβββββ∧∧∧∧-<<+,计算得: ∈2β(-0.01741,0.118133);3β的置信区间为:3223333t St S ααβββββ∧∧∧∧-<<+,计算得:; ∈3β(-0.00845,-0.00332)综上所述,模型通过各种检验,符合要求。

四、方差分析(新增解释变量对被解释变量边际贡献显著性的分析) 引入不同解释变量的ESS,RSS,2R首先做Y 对1X 的回归,得到样本回归方程为=Y13.65401-0.00004571X (24.45422) (-9.131990)1ESS =175.8443, =1RSS 37.95517,21R =0.822473;由t 检验可知,1X 对Y 有显著影响。

21R =0.822473表明,对于各种人口自然增长率Y 来说,国民总收入(亿元)1X 只解释了Y 的总离差的82%,还有18%没有解释。

引入第二个解释变量2X 后,样本回归方程为:ˆY =-12.55023-0.00003991X +0.0925042X 12ESS =182.8952, =12RSS 30.90454,212R =0.855451;新引入2X 的方差分析表变差来源 平方和自由度 F 统计量 对1X 回归 1ESS =175.8443 1 对1X 和2X 回归 12ESS =182.8952 2对1X 和2X 回归,2X 新增的部分对1X 和2X 回归的残差12ESS -1ESS =7.05095823RSS =974550.4120-3=17F=50.30362对于给定的显著性水平α=0.05,查F 分布表可得临界值0.05(1,17) 4.45F =,由于F=50.30362>4.45,所以新引入的解释变量2X 是显著的,2X 的引入可以显著的提高对Y 的解释程度,即2X 的边际贡献较大,因此2R 从0.822473提高到0.855451,RSS 从=37.95517降低到30.90454 再引入第三个解释变量3X :ˆY =15.77177+0.0003921X +0.0503642X -0.0058813X 123ESS =201.3198, =123RSS 12.48060,2123R =0.941625;新引入3X 的方差分析表查F 分布表可得临界值0.05(1,16)F =4.49,F=86.02977>4.49,所以新引入的解释变量3X 显著,即3X 的边际贡献较大,因此2R 从0.855451提高到0.941625,RSS 从30.90454下降到12.48060,因此应该引入3X 。

只引入一个解释变量1X ,2X 或3X ;引入两个解释变量1X 和2X ,1X 和3X 或2X 和3X ;以及引入三个变量1X 2X 3X 的ESS,RSS 和2R 的结果如表引入不同解释变量时的ESS ,RSS ,2R由Eviews 可得,只引入一个解释变量1X ,2X ,3X 时的F 统计量分别为1F =83.39325,2F =12.40147,3F =96.53269,由1F ,2F 和3F 都大于临界值0.05(1,18) 4.41F =,所以如果单独用2X ,3X 或4X 作解释变量都显著,如果引入两个解释变量,显然引入1X ,3X 的结果最好,如果引入三个解释变量1X 2X 3X 无论最后引入哪个解释变量结果都显著,因此最后确定引入三个解释变量,相应的回顾方程为 :ˆY =15.77177+0.0003921X +0.0503642X -0.0058813X 2R =0.941625 2R =0.930680模型预测设2009年国民总收入为295267亿元,居民消费价格指数增长率为2.1%,人均GDP 为21427元,将值代入样本回归方程,得到1998年的各项税收总量预测值的点估计值1998ˆY : =2009Y15.77177+0.000392*295267+0.050364*0.021-0.005881*21427(亿元),实际人口自然增长率为5.51%。

相关主题