当前位置:文档之家› 计量经济学多元线性回归、多重共线性、异方差实验报告概要

计量经济学多元线性回归、多重共线性、异方差实验报告概要

计量经济学实验报告多元线性回归、多重共线性、异方差实验报告一、研究目的和要求:随着经济的发展,人们生活水平的提高,旅游业已经成为中国社会新的经济增长点。

旅游产业是一个关联性很强的综合产业,一次完整的旅游活动包括吃、住、行、游、购、娱六大要素,旅游产业的发展可以直接或者间接推动第三产业、第二产业和第一产业的发展。

尤其是假日旅游,有力刺激了居民消费而拉动内需。

2012年,我国全年国内旅游人数达到30.0亿人次,同比增长13.6%,国内旅游收入2.3万亿元,同比增长19.1%。

旅游业的发展不仅对增加就业和扩大内需起到重要的推动作用,优化产业结构,而且可以增加国家外汇收入,促进国际收支平衡,加强国家、地区间的文化交流。

为了研究影响旅游景区收入增长的主要原因,分析旅游收入增长规律,需要建立计量经济模型。

影响旅游业发展的因素很多,但据分析主要因素可能有国内和国际两个方面,因此在进行旅游景区收入分析模型设定时,引入城镇居民可支配收入和旅游外汇收入为解释变量。

旅游业很大程度上受其产业本身的发展水平和从业人数影响,固定资产和从业人数体现了旅游产业发展规模的内在影响因素,因此引入旅游景区固定资产和旅游业从业人数作为解释变量。

因此选取我国31个省市地区的旅游业相关数据进行定量分析我国旅游业发展的影响因素。

二、模型设定根据以上的分析,建立以下模型Y=β0+β1X1+β2X2+β3X3+β4X4+Ut参数说明:Y ——旅游景区营业收入/万元X1——旅游业从业人员/人X2——旅游景区固定资产/万元X3——旅游外汇收入/万美元X4——城镇居民可支配收入/元收集到的数据如下(见表2.1):表2.1 2011年全国旅游景区营业收入及相关数据(按地区分)数据来源:1.中国统计年鉴2012,2.中国旅游年鉴2012。

三、参数估计利用Eviews6.0做多元线性回归分析步骤如下:1、创建工作文件双击Eviews6.0图标,进入其主页。

在主菜单中依次点击“File\New\Workfile”,出现对话框“Workfile Range”。

本例中是截面数据,在workfile structure type中选择“Unstructured/Undated”,在Date range中填入observations 31,点击ok键,完成工作文件的创建。

2、输入数据在命令框中输入 data Y X1 X2 X3 X4,回车出现“Group”窗口数据编辑框,在对应的Y X1 X2 X3 X4下输入相应数据,关闭对话框将其命名为group01,点击ok,保存。

对数据进行存盘,点击“File/Save As”,出现“Save As”对话框,选择存入路径,并将文件命名,再点“ok”。

3、参数估计在Eviews6.0命令框中键入“LS Y C X1 X2 X3 X4”,按回车键,即出现回归结果。

利用Eviews6.0估计模型参数,最小二乘法的回归结果如下:表3.1 回归结果Dependent Variable: YMethod: Least SquaresDate: 11/14/13 Time: 21:14Sample: 1 31Included observations: 31Coefficient Std. Error t-Statistic Prob.C 32390.83 39569.49 0.818581 0.4205X1 0.603624 0.366112 1.648741 0.1112X2 0.234265 0.041218 5.683583 0.0000X3 0.044632 0.060755 0.734620 0.4691X4 -1.914034 2.098257 -0.912202 0.3700R-squared 0.879720 Mean dependent var 114619.2 Adjusted R-squared 0.861215 S.D. dependent var 112728.1S.E. of regression 41995.55 Akaike info criterion 24.27520Sum squared resid 4.59E+10 Schwarz criterion 24.50649Log likelihood -371.2657 Hannan-Quinn criter. 24.35060F-statistic 47.54049 Durbin-Watson stat 2.007191Prob(F-statistic) 0.000000根据表中的样本数据,模型估计结果为^Y=32390.83+0.603624X1+0.234265X2+0.044632X3-1.914034X4(39569.49)(0.366112)(0.041218)(0.060755)(2.098257)t = (0.818581) (1.648741) (5.683583) (0.734620) (-0.912202)R2=0.879720--R2=0.861215 F=47.54049 DW=2.007191可以看出,可决系数R2=0.879720,修正的可决系数--R2=0.861215。

说明模型的拟合程度还可以。

但是当α=0.05时,X1、X2、X4系数均不能通过检验,且X4的系数为负,与经济意义不符,表明模型很可能存在严重的多重共线性。

四、模型修正1.多重共线性的检验与修正(1)检验选中X1 X2 X3 X4数据,点击右键,选择“Open/as Group”,在出现的对话框中选择“View/Covariance Analysis/correlation”,点击ok,得到相关系数矩阵。

计算各个解释变量的相关系数,得到相关系数矩阵。

表4.1 相关系数矩阵变量X1 X2 X3 X4X1 1.0000000.8097770.8720930.659239X2 0.809777 1.0000000.7583220.641086X3 0.8720930.758322 1.0000000.716374由相关系数矩阵可以看出,解释变量X2、X3之间存在较高的相关系数,证实确实存在严重的多重共线性。

(2)多重共线性修正采用逐步回归的办法,检验和回归多重共线性问题。

分别作Y对X1、X2、X3、X4的一元回归,在命令窗口分别输入LS Y C X1,LS Y C X2,LS Y C X3,LS Y C X4,并保存,整理结果如表4.2所示。

表4.2 一元回归结果 变量 X1 X2 X3 X4 参数估计值 1.978224 0.315120 0.316946 12.54525 t 统计量 8.635111 12.47495 6.922479 4.005547 R 20.719983 0.842924 0.622988 0.356191 -2R0.7103270.8375080.6099880.333991其中,X2的方程-2R 最大,以X2为基础,顺次加入其它变量逐步回归。

在命令窗口中依次输入:LS Y C X2 X1,LS Y C X2 X3, LS Y C X2 X4,并保存结果,整理结果如表4.3所示。

表4.3 加入新变量的回归结果(一)经比较,新加入X1的方程-2R =0.866053,改进最大,而且各个参数的t 检验显著,选择保留X1,再加入其它新变量逐步回归,在命令框中依次输入:LS Y C X2 X1 X3,LS Y C X2 X1 X4,保存结果,整理结果如表4.4所示。

表4.4 加入新变量的回归结果(二) 当加入X3或X4时,-2R 均没有所增加,且其参数是t 检验不显著。

从相关系数可以看出X3、X4与X1、X2之间相关系数较高,这说明X3、X4引起了多重共线性,予以剔除。

当取α=0.05时,t α/2(n-k-1)=2.048,X1、X2的系数t 检验均显著,这是最后消除多重共线性的结果。

修正多重共线性影响后的模型为^Y= 0.711446 X1+0.230304 X2(0.265507)(0.039088)t = (2.679575) (5.891959)R2=0.8749832R=0.866053 F=97.98460 DW=1.893654在确定模型以后,进行参数估计表4.5消除多重共线性后的回归结果Dependent Variable: YMethod: Least SquaresDate: 11/14/13 Time: 21:47Sample: 1 31Included observations: 31Coefficient Std. Error t-Statistic Prob.C -4316.824 12795.42 -0.337373 0.7384X1 0.711446 0.265507 2.679575 0.0122X2 0.230304 0.039088 5.891959 0.0000R-squared 0.874983 Mean dependent var 114619.2 Adjusted R-squared 0.866053 S.D. dependent var 112728.1 S.E. of regression 41257.10 Akaike info criterion 24.18480 Sum squared resid 4.77E+10 Schwarz criterion 24.32357 Log likelihood -371.8644 Hannan-Quinn criter. 24.23004 F-statistic 97.98460 Durbin-Watson stat 1.893654 Prob(F-statistic) 0.000000五、异方差检验在实际的经济问题中经常会出现异方差这种现象,因此建立模型时,必须要注意异方差的检验,否则,在实际中会失去意义。

(1)检验异方差由表 4.5的结果,按路径“View/Residual Tests/Heteroskedasticity Tests”,在出现的对话框中选择Specification:White,点击ok.得到White 检验结果如下。

表5.1 White检验结果Heteroskedasticity Test: WhiteF-statistic 3.676733 Prob. F(5,25) 0.0125Obs*R-squared 13.13613 Prob. Chi-Square(5) 0.0221Scaled explained SS 15.97891 Prob. Chi-Square(5) 0.0069Test Equation:Dependent Variable: RESID^2Method: Least SquaresDate: 11/14/13 Time: 21:48Sample: 1 31Included observations: 31Coefficient Std. Error t-Statistic Prob.C -1.10E+09 1.11E+09 -0.992779 0.3303X1 -12789.36 30151.30 -0.424173 0.6751X1^2 0.420716 0.294332 1.429393 0.1653X1*X2 -0.101814 0.083576 -1.218216 0.2345X2 14604.52 5047.701 2.893301 0.0078X2^2 -0.002489 0.008030 -0.309972 0.7592R-squared 0.423746 Mean dependent var 1.54E+09Adjusted R-squared 0.308495 S.D. dependent var 2.70E+09S.E. of regression 2.24E+09 Akaike info criterion 46.07313Sum squared resid 1.26E+20 Schwarz criterion 46.35068Log likelihood -708.1335 Hannan-Quinn criter. 46.16360F-statistic 3.676733 Durbin-Watson stat 1.542170Prob(F-statistic) 0.012464从上表可以看出,nR2=13.13613,由White检验可知,在α=0.05下,查2χ(5)=11.0705,比较计算的2χ统计量与临界值,因为分布表,得临界值χ2.005(5)=11.0705,所以拒绝原假设,表明模型存在异方差。

相关主题