多元回归分析案例计量经济学案例分析多元回归分析案例学院: 数理学院班级: 数学092班学号: 094131230姓名: 徐冬梅摘要:为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,用Eviews软件对相关数据进行了多元回归分析,得出了相关结论关键词:多元回归分析 ,Evicews软件, 中国人口自然增长;一、建立模型为了全面反映中国“人口自然增长率”的全貌,选择人口自然增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。
国名总收入,居民消费价格指数增长率,人均GDP作为解释变量暂不考虑文化程度及人口分布的影响。
通过对表1的数据进行分析,建立模型。
其模型表达式为:(i=1,2,,3) Y,,,,X,,X,,X,ui11i22i33ii其中Y表示人口自然增长率,X 表示国名总收入,X表示居民消费价格指12 数增长率,X表示人均GDP,根据以往经验和对调查资料的初步分析可知,Y与3X,X,X3呈线性关系,因此建立上述三元线性总体回归模型。
Xi则表示各解12释变量对税收增长的贡献。
µi表示随机误差项。
通过上式,我们可以了解到,每个解释变量增长,亿元,粮食总产值会如何变化,从而进行财政收入预测。
相关数据: 表1国民总收居民消费价人口自然增人均GDP年份入(亿元)格指数增长长率(%。
)Y (元)X3 X1 率(CPI)%X21988 15.73 15037 18.8 13661989 15.04 17001 18 15191990 14.39 18718 3.1 16441991 12.98 21826 3.4 18931992 11.6 26937 6.4 23111993 11.45 35260 14.7 29981994 11.21 48108 24.1 40441995 10.55 59811 17.1 50461996 10.42 70142 8.3 58461997 10.06 78061 2.8 64201998 9.14 83024 -0.8 67961999 8.18 88479 -1.4 71592000 7.58 98000 0.4 78582001 6.95 108068 0.7 86222002 6.45 119096 -0.8 93982003 6.01 135174 1.2 105422004 5.87 159587 3.9 123362005 5.89 184089 1.8 140402006 5.38 213132 1.5 160242007 5.24 235367 1.7 175352008 5.45 277654 1.9 19264二、参数估计利用上表中的数据,运用eview软件,采用最小二乘法,对表中的数据进行线性回归,对所建模型进行估计,估计结果见下图。
从估计结果可得模型:ˆY,15.77177,0.000392X,0.050364X,0.005881X 123Y关于X的散点图: 1 可以看出Y和X成线性相关关系 1Y关于X的散点图: 2可以看出Y和X成线性相关关系 2Y关于X的散点图: 3可以看出Y和X成线性相关关系 3回归结果三、模型检验:1、经济意义检验模型估计结果说明,在假定其它变量不变的情况下,当年国民总收入每增长1亿元,人口增长率增长0.000392%;在假定其它变量不变的情况下,当年居民消费价格指数增长率每增长 1%,人口增长率增长0.050364%;在假定其它变量不变的情况下,当年人均GDP没增加一元,人口增长率就会降低0.005881%。
这与理论分析和经验判断相一致。
2、统计检验(1)、拟合优度检验,22,,,TSSYYnY,, 由于, ESSXYnY,,,ESSn,1222 所以 =0.941625, =0.930680, R,RR,,,1(1)TSSnk,,1可见模型在整体上拟合得非常好。
(2)、F 检验由于 RSSTSSESS,,ESSk/F, 所以 =86.02977 , RSSnk/(1),,,,0.05针对,给定显著性水平,在F分布表中查出自H:,,,,,,00123由度为k-1=3和n-k-1=16的临界值。
由表3.4中得到F(3,16),3.24,F=86.02977 ,由于F=86.02977 >应拒绝原假设F(3,16),3.24,,说明回归方程显著,即“国民总收入”、“居民消费价格指H:,,,,,,00123 数增长率”、“人均GDP”等变量联合起来确实对“人口自然增长率”有显著影响。
(3)、t 检验2;eee:,i2,,,, 由于0.780038 n,k,1n,k,1:::S,S,S, 且0.830371,8.89415E-05 ,0.03196669,,,,012:S,0.00121009 , ,3当, HH:0,:0,,,,0010:,0:t,, 18.99364 ,0:S,0t,,0.05在时, (16)=2.120因为t=18.99364>2.120,所以在95%的置信, 2度下拒绝原假设,说明截距项对回归方程影响显著。
当 HH:0,:0,,,,0111 :,1: 4.407392 ,,t,1:S,10在时,t(16)=2.120因为t=4.407392>2.120所以在95%的置信度,,0.05,2下拒绝原假设,说明X1变量对Y影响显著。
当 HH:0,:0,,,,0212:,2:,,1.575515 t,2:S,2在时,t(16)=2.120因为t=1.575515<2.120,所以在95%的置信度,,0.05, 2下接受原假设,说明X2变量对Y影响不显著。
当 HH:0,:0,,,,0313:,3:t,, - 4.859971 ,3:S,3t在时,(16)=2.120因为t=- 4.859971<2.120,所以在95%的置信,,0.05, 2度下接受原假设,说明X3变量对Y影响不显著。
(4)、的置信区间 ,,,,,,,,,,,012345,,的置信区间为:,计算得: tStS,,,,,,,,,,0,,000,,2200(14.01138,17.53216); ,,0,,的置信区间为:,计算得: tStS,,,,,,,,,,1,,111,,2211(0.000203,0.000581); ,,1,,的置信区间为:tStS,计算得: ,,,,,,,,,,2,,222,,2222(-0.01741,0.118133); ,,2,,的置信区间为:tStS,计算得:; ,,,,,,,,,,3,,333,,2233,,(-0.00845,-0.00332) 3综上所述,模型通过各种检验,符合要求。
四、方差分析(新增解释变量对被解释变量边际贡献显著性的分析)2R引入不同解释变量的ESS,RSS,首先做Y对的回归,得到样本回归方程为 X1:Y,13.65401-0.0000457 X1(24.45422) (-9.131990)2=175.8443, 37.95517,=0.822473; RESSRSS,1112由t检验可知,对Y有显著影响。
=0.822473表明,对于各种人口自然增RX11长率Y来说,国民总收入(亿元)只解释了Y的总离差的82%,还有18%没有X1 解释。
引入第二个解释变量后,样本回归方程为: X2ˆY=-12.55023-0.0000399+0.092504 XX212=182.8952, 30.90454,=0.855451; RESSRSS,121212新引入的方差分析表 X2变差来源平方和自由度 F统计量1 对回归 =175.8443 XESS112 对和回归 XX=182.8952 ESS21121 F=50.30362 对和回归,XX-=7.050958 ESSESS2112120-3=17 新增的部分对X2和回归的残=974550.4 XRSSX2231差对于给定的显著性水平=0.05,查F分布表可得临界值,F(1,17)4.45,,0.05由于F=50.30362>4.45,所以新引入的解释变量是显著的,的引入可以显XX22 2R著的提高对Y的解释程度,即的边际贡献较大,因此从0.822473提高到X20.855451,RSS从=37.95517降低到30.90454 再引入第三个解释变量: X3ˆY=15.77177+0.000392+0.050364-0.005881 XXX3212R=201.3198, 12.48060,=0.941625; ESSRSS,123123123新引入的方差分析表 X3变差来源平方和自由度 F统计量2 对和回归 XX30.90454, RSS,21123 对,和回=201.3198 XXESSX123231归1 F=86.02977 对,和回-=470399 XXESSXESS1232311220-4=16 归,由新增的X3部分对,和12.48060 XRSS,X12321回归的残差 X3查F分布表可得临界值=4.49,F=86.02977>4.49,所以新引入的解释F(1,16)0.052R变量显著,即的边际贡献较大,因此从0.855451提高到0.941625,RSSXX33从30.90454下降到12.48060,因此应该引入。
X3只引入一个解释变量,或;引入两个解释变量和,和或XXXXXXXX23232111 2R和;以及引入三个变量的ESS,RSS和的结果如表 XXXX32312R引入不同解释变量时的ESS,RSS,引入解释变量回归平方和ESS 残差平方和RSS 判定系数2 X=175.8443 37.95517, ESSRSS,=0.822473 R11112 X=87.21383 RSS=126.5859 ESS=0.407923 R22222 X=180.1995 =33.60087 ESSRSSR=0.842840 33332, XX=182.8952 30.90454 ESSRSS,=0.855451 R211212122, =199.3845 14.41684 XESSRSS,XR=0.932569 131331132, =186.1663 =27.63290 XXESSRSSR=0.870753 232323232 XXX=201.3198 12.48060 ESSRSS,R=0.941625 231123123123由Eviews可得,只引入一个解释变量,,时的F统计量分别为XXX231=83.39325,=12.40147,=96.53269,由,和都大于临界值FFFFFF232311,所以如果单独用,或作解释变量都显著,如果引入F(1,18)4.41,XXX0.05234 两个解释变量,显然引入,的结果最好,如果引入三个解释变量XXXXX32311无论最后引入哪个解释变量结果都显著,因此最后确定引入三个解释变量,相应的回顾方程为 :ˆY =15.77177+0.000392+0.050364-0.005881 XXX32122R=0.941625 =0.930680 R模型预测设2009年国民总收入为295267亿元,居民消费价格指数增长率为2.1%,人均GDP为21427元,将值代入样本回归方程,得到1998年的各项税收总量预测值ˆ的点估计值: Y1998:15.77177+0.000392*295267+0.050364*0.021-0.005881*21427 Y,2009(亿元),实际人口自然增长率为5.51%。