计量经济学实验报告实验项目:多元线性回归、自相关、异方差、多重共线性实验目的:掌握多元线性回归模型、自相关模型、异方差模型、多重共线性模型的估计和检验方法和处理方法实验要求:选择方程进行多元线性回归;熟悉图形法检验和掌握D-W检验,理解广义差分法变换和掌握迭代法;掌握Park或Glejser检验,理解同方差性变换;实验原理:普通最小二乘法图形检验法D-W检验广义差分变换加权最小二乘法Park检验等实验步骤:首先:选择数据为了研究影响中国税收收入增长的主要原因,选择国内生产总值(GDP)、财政支出(ED)、商品零售价格指数(RPI)做为解释变量,对税收收入(Y)做多元线性回归。
从《中国统计年鉴》2011中收集1978—2009年各项影响因素的数据。
如下表所示:时间y各项税收(亿元)X1 GDP(亿元)X2 财政支出(亿元)X3 商品零售价格指数(1997=100)1978年519.28 3678.7 1122.09 100.7 1979年537.82 4100.5 1281.79 102.714 1980年571.7 4587.6 1228.83 108.8768 1981年629.89 4935.8 1138.41 111.4899 1982年700.02 5373.4 1229.98 113.6082 1983年775.59 6020.9 1409.52 115.3123 1984年947.35 7278.5 1701.02 118.5411 19852040.79 9098.9 2004.25 128.972719862090.73 10376.2 2204.91 136.711 年19872140.36 12174.6 2262.18 146.6909 年19882390.47 15180.4 2491.21 173.8288 年19892727.4 17179.7 2823.78 204.7703 年19902821.86 18872.9 3083.59 209.0705 年19912990.17 22005.6 3386.62 215.1335 年19923296.91 27194.5 3742.2 226.7507 年19934255.3 35673.2 4642.3 256.6818 年19945126.88 48637.5 5792.62 312.3818 年19956038.04 61339.9 6823.72 358.6143 年19966909.82 71813.6 7937.55 380.4897 年19978234.04 79715 9233.56 383.5336 年19989262.8 85195.5 10798.18 373.5618 年199910682.58 90564.4 13187.67 362.3549 年200012581.51 100280.1 15886.5 356.9196 年200115301.38 110863.1 18902.58 354.0642 年200217636.45 121717.4 22053.15 349.4614 年200320017.31 137422 24649.95 349.1119 年200424165.68 161840.2 28486.89 358.8871 年200528778.54 187318.9 33930.28 361.7582 年200634804.35 219438.5 40422.73 365.3758 年200745621.97 270232.3 49781.35 379.262008年 54223.79 319515.5 62592.66 401.6364 2009年 59521.59 349081.4 76299.93 396.8167 2010年 73210.79 413030.3 89874.16 409.1181 2011年 89738.39 489300.6 109247.8 429.1648 2012年 100614.3 540367.4125953437.7481 2013年 110530.7 595244.4 140212.1 443.8766 2014年119175.3643974 151785.6448.3154实验一:多元线性回归1、将RPI 转换为以1977年为基年的定基数据。
将数据导入eviews8.0后,分别对三个解释变量与被解释变量做散点图,选择两个变量作为group 打开,在数据表“ group ”中点击view/graph/scatter/simple scatter ,出现数据的散点图,分别如下图所示:20,00040,00060,00080,000100,000120,000140,000X1Y20,00040,00060,00080,000100,000120,000140,000X2Y020,00040,00060,00080,000100,000120,000140,000X3Y散点图看,变量间不一定呈现线性关系,可以试着作线性回归。
2、做多元线性回归选中变量作为组打开,在下拉列表“Proc ”中选择“MakeEquation ”Dependent Variable: Y Method: Least Squares Date: 12/05/16 Time: 16:18 Sample: 1978 2014 Included observations: 37Variable Coefficient Std. Error t-Statistic Prob.X3 -16.20679 3.007821 -5.388217 0.0000 X2 0.308921 0.056086 5.507963 0.0000 X1 0.121784 0.014258 8.541749 0.0000 C1958.150494.82413.9572660.0004R-squared 0.999523 Mean dependent var 23827.35 Adjusted R-squared 0.999479 S.D. dependent var 34032.29 S.E. of regression 776.4959 Akaike info criterion 16.24927 Sum squared resid 19897216 Schwarz criterion 16.42342 Log likelihood -296.6114 Hannan-Quinn criter. 16.31066 F-statistic 23039.75 Durbin-Watson stat 1.098482 Prob(F-statistic) 0.000000根据图中数据,模型估计的结果为: Y=1958.15+0.121784x1+0.308921x2-16.20679x3(494.8241) (0.014258)(0.056086)(3.007821) T= (3.957266) (8.541749) (5.507963) (-5.388217)0.999523R 2= 0.999479R 2=- F=23039.75 DF=33模型估计结果说明,在假定其他变量不变的情况下,当年RPI 每增长1%,平均来说税收收入会减少16.20679亿元;当年GDP 每增长1亿元,平均来说税收收入会增长0.121784亿元;当年财政支出每增长1亿元,平均来说税收收入会增长0.308921亿元。
可决系数0.999523R 2=,修正后的可决系数0.999479R 2=-,说明模型的样本的拟合很好。
F 检验的数值很大,可以判定,在给定显著性水平α=0.05的情况下,拒绝原假设。
说明回归方程显著,既“国内生产总值”、“财政支出”、“商品零售价格指数”等变量联合起来确实对“税收收入”有显著影响。
从t 检验的值可以看出,RPI 、GDP 、ED 均对税收收入有显著影响。
实验二:多重共线性1、在前面所做的多元线性回归模型中,回归结果如下:Dependent Variable: Y Method: Least Squares Date: 12/05/16 Time: 16:18 Sample: 1978 2014 Included observations: 37Variable Coefficient Std. Error t-Statistic Prob.X3-16.206793.007821-5.3882170.0000X2 0.308921 0.056086 5.507963 0.0000 X1 0.121784 0.014258 8.541749 0.0000 C1958.150494.82413.9572660.0004R-squared0.999523 Mean dependent var 23827.35 Adjusted R-squared 0.999479 S.D. dependent var 34032.29 S.E. of regression 776.4959 Akaike info criterion 16.24927 Sum squared resid 19897216 Schwarz criterion 16.42342 Log likelihood -296.6114 Hannan-Quinn criter. 16.31066 F-statistic 23039.75 Durbin-Watson stat 1.098482 Prob(F-statistic)0.000000由此可见,该模型可决系数很高,F 值明显显著2、计算各解释变量的相关系数,点“view/correlation ”得相关系数矩阵10.70411106415919350.9991058846794706 0.9970102927635521 0.7041110641591935 1 0.69321865355418180.7531340573105144 0.9991058846794706 0.6932186535541818 1 0.99488591771988330.99701029276355210.75313405731051440.99488591771988331由相关系数矩阵可以看出,各解释变量之间某些相关系数较高,证实存在一定程度的多重共线性。
3、对多重共线性的处理才用逐步回归法,去检验和解决多重共线性问题,分别作Y 对RPI 、GDP 、ED 、的一元回归,结果如下:变量 RPI GDP ED参数估计值 196.6643 0.184990 0.798924 T 统计量 5.866268 76.33596 139.80762R 0.495772 0.994030 0.998213 2R 0.481366 0.993859 0.998131其中,ED 的方程2R 最大,以ED 为基础,顺次加入其它变量逐步回归,结果加入GDP 后,2R =0.996125,加入RPI 后,2R =0.994979,因此,保留GDP 这个影响因素,剔除RPI 这个变量。