计量经济学实验报告多元线性回归、多重共线性、异方差实验报告一、研究目的和要求:随着经济的发展,人们生活水平的提高,旅游业已经成为中国社会新的经济增长点。
旅游产业是一个关联性很强的综合产业,一次完整的旅游活动包括吃、住、行、游、购、娱六大要素,旅游产业的发展可以直接或者间接推动第三产业、第二产业和第一产业的发展。
尤其是假日旅游,有力刺激了居民消费而拉动内需。
2012年,我国全年国内旅游人数达到亿人次,同比增长%,国内旅游收入万亿元,同比增长%。
旅游业的发展不仅对增加就业和扩大内需起到重要的推动作用,优化产业结构,而且可以增加国家外汇收入,促进国际收支平衡,加强国家、地区间的文化交流。
为了研究影响旅游景区收入增长的主要原因,分析旅游收入增长规律,需要建立计量经济模型。
影响旅游业发展的因素很多,但据分析主要因素可能有国内和国际两个方面,因此在进行旅游景区收入分析模型设定时,引入城镇居民可支配收入和旅游外汇收入为解释变量。
旅游业很大程度上受其产业本身的发展水平和从业人数影响,固定资产和从业人数体现了旅游产业发展规模的内在影响因素,因此引入旅游景区固定资产和旅游业从业人数作为解释变量。
因此选取我国31个省市地区的旅游业相关数据进行定量分析我国旅游业发展的影响因素。
二、模型设定根据以上的分析,建立以下模型Y=β0+β1X1+β2X2+β3X3+β4X4+Ut参数说明:Y ——旅游景区营业收入/万元X1——旅游业从业人员/人X2——旅游景区固定资产/万元X3——旅游外汇收入/万美元X4——城镇居民可支配收入/元收集到的数据如下(见表):表 2011年全国旅游景区营业收入及相关数据(按地区分)数据来源:1.中国统计年鉴2012,2.中国旅游年鉴2012。
三、参数估计利用做多元线性回归分析步骤如下:1、创建工作文件双击图标,进入其主页。
在主菜单中依次点击“File\New\Workfile”,出现对话框“Workfile Range”。
本例中是截面数据,在workfile structure type 中选择“Unstructured/Undated”,在Date range中填入observations 31,点击ok 键,完成工作文件的创建。
2、输入数据在命令框中输入 data Y X1 X2 X3 X4,回车出现“Group”窗口数据编辑框,在对应的Y X1 X2 X3 X4下输入相应数据,关闭对话框将其命名为group01,点击ok,保存。
对数据进行存盘,点击“File/Save As”,出现“Save As”对话框,选择存入路径,并将文件命名,再点“ok”。
3、参数估计在命令框中键入“LS Y C X1 X2 X3 X4”,按回车键,即出现回归结果。
利用估计模型参数,最小二乘法的回归结果如下:表回归结果Dependent Variable: YMethod: Least SquaresDate: 11/14/13 Time: 21:14Sample: 1 31Included observations: 31Coefficient Std. Error t-Statistic Prob.??CX1X2X3X4R-squared Mean dependent varAdjusted R-squared . dependent var. of regression Akaike info criterionSum squared resid +10 Schwarz criterionLog likelihood Hannan-Quinn criter.F-statistic Durbin-Watson statProb(F-statistic)根据表中的样本数据,模型估计结果为^Y=+1+2+34()()()()()t =R2=--R2= F= DW=可以看出,可决系数R2=,修正的可决系数--R2=。
说明模型的拟合程度还可以。
但是当α=时,X1、X2、X4系数均不能通过检验,且X4的系数为负,与经济意义不符,表明模型很可能存在严重的多重共线性。
四、模型修正1.多重共线性的检验与修正(1)检验选中X1 X2 X3 X4数据,点击右键,选择“Open/as Group”,在出现的对话框中选择“View/Covariance Analysis/correlation”,点击ok,得到相关系数矩阵。
计算各个解释变量的相关系数,得到相关系数矩阵。
表相关系数矩阵变量X1 X2 X3 X4X1X2X3X4由相关系数矩阵可以看出,解释变量X2、X3之间存在较高的相关系数,证实确实存在严重的多重共线性。
(2)多重共线性修正采用逐步回归的办法,检验和回归多重共线性问题。
分别作Y对X1、X2、X3、X4的一元回归,在命令窗口分别输入LS Y C X1,LS Y C X2,LS Y C X3,LS Y C X4,并保存,整理结果如表所示。
表一元回归结果变量X1 X2 X3 X4参数估计值t统计量R2-2R其中,X2的方程-2R最大,以X2为基础,顺次加入其它变量逐步回归。
在命令窗口中依次输入:LS Y C X2 X1,LS Y C X2 X3, LS Y C X2 X4,并保存结果,整理结果如表所示。
表加入新变量的回归结果(一)经比较,新加入X1的方程-2R=,改进最大,而且各个参数的t检验显着,选择保留X1,再加入其它新变量逐步回归,在命令框中依次输入:LS Y C X2 X1 X3,LS Y C X2 X1 X4,保存结果,整理结果如表所示。
表加入新变量的回归结果(二)当加入X3或X4时,-2R均没有所增加,且其参数是t检验不显着。
从相关系数可以看出X3、X4与X1、X2之间相关系数较高,这说明X3、X4引起了多重共线性,予以剔除。
当取α=时,tα/2(n-k-1)=,X1、X2的系数t检验均显着,这是最后消除多重共线性的结果。
修正多重共线性影响后的模型为^Y= X1+ X2()()t =R2=2R=0.866053 F= DW=在确定模型以后,进行参数估计表消除多重共线性后的回归结果Dependent Variable: YMethod: Least SquaresDate: 11/14/13 Time: 21:47Sample: 1 31Included observations: 31Coefficient Std. Error t-Statistic Prob.??CX1X2R-squared Mean dependent varAdjusted R-squared . dependent var. of regression Akaike info criterionSum squared resid +10 Schwarz criterionLog likelihood Hannan-Quinn criter.F-statistic Durbin-Watson statProb(F-statistic)五、异方差检验在实际的经济问题中经常会出现异方差这种现象,因此建立模型时,必须要注意异方差的检验,否则,在实际中会失去意义。
(1)检验异方差由表的结果,按路径“View/Residual Tests/Heteroskedasticity Tests”,在出现的对话框中选择Specification:White,点击ok.得到White检验结果如下。
表White检验结果Heteroskedasticity Test: WhiteF-statistic Prob. F(5,25)Obs*R-squared Prob. Chi-Square(5)Scaled explained SS Prob. Chi-Square(5)Test Equation:Dependent Variable: RESID^2Method: Least SquaresDate: 11/14/13 Time: 21:48Sample: 1 31Included observations: 31Coefficient Std. Error t-Statistic Prob.??C +09 +09X1X1^2X1*X2X2X2^2R-squared Mean dependent var +09Adjusted R-squared . dependent var +09. of regression +09 Akaike info criterionSum squared resid +20 Schwarz criterionLog likelihood Hannan-Quinn criter.F-statistic Durbin-Watson statProb(F-statistic)从上表可以看出,nR2=,由White检验可知,在α=下,查2χ分布表,得临界值χ205.0(5)=,比较计算的2χ统计量与临界值,因为nR2=>χ205.0(5)=,所以拒绝原假设,表明模型存在异方差。
(2)异方差的修正①用WLS估计:选择权重w=1/e1^2,其中e1=resid。
在命令窗口中输入 genr e1= resid,点回车键。
在消除多重共线性后的回归结果(表的回归结果)对话框中点击Estimate/Options/Weithted LS/TSLS,并在Weight中输入1/e1^2,点确定,得到如下回归结果。
表用权数1/e1^2的回归结果Dependent Variable: YMethod: Least SquaresDate: 11/14/13 Time: 21:49Included observations: 31Weighting series: 1/E1^2Coefficient Std. Error t-Statistic Prob.??CX1X2Weighted StatisticsR-squared Mean dependent varAdjusted R-squared . dependent var. of regression Akaike info criterionSum squared resid Schwarz criterionLog likelihood Hannan-Quinn criter.F-statistic Durbin-Watson statProb(F-statistic)Unweighted StatisticsR-squared Mean dependent varAdjusted R-squared . dependent var. of regression Sum squared resid +10Durbin-Watson stat②修正后的White检验为在表的回归结果中,按路径“View/Residual Tests/Heteroskedasticity Tests”,在出现的对话框中选择Specification:White,点击ok.得到White 检验结果如下。