经典线性回归模型经典回归模型在涉及到时间序列时,通常存在以下三个问题:1)非平稳性→ ADF单位根检验→ n阶单整→取原数据序列的n阶差分(化为平稳序列)2)序列相关性→D.W.检验/相关图/Q检验/LM检验→n阶自相关→自回归ar(p)模型修正3)多重共线性→相关系数矩阵→逐步回归修正注:以上三个问题中,前两个比较重要。
整体回归模型的思路:1)确定解释变量和被解释变量,找到相关数据。
数据选择的时候样本量最好多一点,做出来的模型结果也精确一些。
2)把EXCEL里的数据组导入到Eviews里。
3)对每个数据序列做ADF单位根检验。
4)对回归的数据组做序列相关性检验。
5)对所有解释变量做多重共线性检验。
6)根据上述结果,修正原先的回归模型。
7)进行模型回归,得到结论。
Eviews具体步骤和操作如下。
一、数据导入1)在EXCEL中输入数据,如下:除去第一行,一共2394个样本。
2)Eviews中创建数据库:File\new\workfile, 接下来就是这个界面(2394就是根据EXCEL里的样本数据来),OK3)建立子数据序列程序:Data x1再enter键就出来一个序列,空的,把EXCEL里对应的序列复制过来,一个子集就建立好了。
X1是回归方程中的一个解释变量,也可以取原来的名字,比如lnFDI,把方程中所有的解释变量、被解释变量都建立起子序列。
二、ADF单位根检验1)趋势。
打开一个子数据序列,先判断趋势:view\graph,出现一个界面,OK。
得到类似的图,下图就是有趋势的时间序列。
X1.4.2.0-.2-.4-.6-.8100020003000400050002)ADF检验。
直接在图形的界面上进行操作,view\unit root test,出现如下界面。
在第二个方框内根据时序的趋势选择,Intercept指截距,Trend为趋势,有趋势的时序选择第二个,OK,得到结果。
上述结果中,ADF值为-3.657113,t统计值小于5%,即拒绝原假设,故不存在单位根。
若大于5%,则存在单位根。
按照这个做法将所有的序列都操作一遍。
3)修正。
倘若原序列存在单位根,就对原序列进行一阶差分。
程序:genr dx1=D(x1)Enter键后,Eviews里会自动生成子序列dx1,x1只是解释变量,可以自己命名。
再对该一阶差分序列进行ADF检验,若所得均显著,即为一阶单整序列,此序列不存在单位根。
按照一阶单整序列建立模型,模型的数据序列是平稳的。
三、模型回归程序:data y x1 x2Y是模型的被解释变量,后面的解释变量随模型的具体情况而定。
Enter键,出来一个数据组合,我这里DX11做为被解释变量。
接下来是回归的操作。
点击Proc/make equation,出来界面,直接点确定。
其中,dx11是被解释变量,其余都为解释变量。
得到结果,形式如下。
结果说明:coefficient是每个解释变量对应的系数,第四列是t统计值,最后一列是伴随概率。
R-squared是拟合优度,下面那个是调整的拟合优度。
分析时遵循下列原则:<1>模型总体拟合优度R2,一般而言50%以上就很好。
这个说明的是方程解释变量总体对被解释变量的解释力度好,即你的模型建立的比较正确。
F值和此类似,判断方法和t统计值的一样,看伴随概率。
<2>系数。
看t值和伴随概率,如果伴随概率小于自己设定的显著性水平(1%、5%、10%),则拒绝原假设,说明该一个解释变量对被解释变量有显著的贡献度。
注:R2看的是整体(所有解释变量),t注重的是单个解释变量的贡献度。
四、序列相关性检验序列相关性指的是模型回归后产生的残差序列(resid序列)具有自相关性,即前一个时间段的残差对现今的残差有影响,因此需要进行修正。
方法有下列4种:D.W.统计量检验,相关图,Q检验,LM检验。
可随机选一种,但要注意:D.W.检验法方便但比较粗糙,而且只能针对一阶自回归,无法进行高阶自回归的验证和模型自带滞后项的验证。
LM检验能克服以上问题。
另外,相关图和Q检验也较常用。
1)D.W.检验——只针对一阶自相关DW值直接在模型回归结果中显示,下述红色值。
Sample (adjusted): 2 5957Included observations: 5956 after adjustmentsVariable Coefficient Std. Error t-Statistic Prob.DX1 0.963865 0.006527 147.6794 0.0000DX2 0.006964 0.001868 3.727361 0.0002DX3 0.002006 0.001365 1.469924 0.1416DX13 0.004876 0.001101 4.430584 0.0000DX4 0.024139 0.006576 3.670863 0.0002C 1.01E-06 4.96E-06 0.203737 0.8386R-squared 0.994890 Mean dependent var 6.02E-05Adjusted R-squared 0.994886 S.D. dependent var 0.005341S.E. of regression 0.000382 Akaike info criterion -12.90144Sum squared resid 0.000868 Schwarz criterion -12.89470Log likelihood 38426.50 Hannan-Quinn criter. -12.89910F-statistic 231679.7 Durbin-Watson stat 2.398212Prob(F-statistic) 0.0000002)相关图与Q检验在模型回归后的界面上进行操作,view\Residual Diagnostics\Correlogram-Q-statistics弹出对话框后直接OK,出现下述结果。
AC代表自相关系数,PAC表示偏自相关系数,判断模型是几阶自相关,看其AC和PAC 图形有多少超出区域,图中有临界值线,这张图不是很清楚。
也可以观察Q值和伴随概率,若小于5%就显著,拒绝原假设。
但是,这个方法在一些模型结果中不太明显,所以不清楚的时候进行LM检验比较直观。
3)LM统计量检验同样,在回归结果界面操作,view\Residual Diagnostics\Serial Correlation LM test 弹出对话框,意在选择阶数,在不确定具体是几阶自相关时,可以一步一步来。
这是一阶的检验,结果中会给出RESID(-1)的结果,且t统计值的伴随概率Prob小于5%,即拒绝原假设(不存在自相关性),说明该模型存在自相关性。
继续进行二阶的检验,重复上述操作,在对话框输入2,得到结果。
仍然拒绝假设,再进行操作,直到RESID(-n)的t值不显著。
当进行到6阶的时候,RESID(-6)的t值不显著,故该模型的自相关阶数为5阶。
4)修正。
对于自相关模型的修正,也有一系列方法,但是建立自回归模型ar(p)比较简单。
操作如下,在原模型数据组界面进行操作,即进行简单回归的界面。
点击Proc/make equation,出来界面,根据模型自相关阶数,进行修改如下。
在出来的结果中,可以看到模型的拟合优度R2有所提高,且模型的DW值接近2。
一般而言,DW值为2时说明该模型不存在自相关性。
(可与上面的结果比较)Dependent Variable: DX5Method: Least SquaresDate: 04/29/15 Time: 18:26Sample (adjusted): 7 5957Included observations: 5951 after adjustmentsConvergence achieved after 4 iterationsVariable Coefficient Std. Error t-Statistic Prob.DX1 0.960615 0.006150 156.1974 0.0000DX2 0.006804 0.001632 4.168534 0.0000DX3 0.002038 0.001244 1.638556 0.1014DX13 0.003691 0.000967 3.815573 0.0001DX4 0.028310 0.006244 4.533668 0.0000C 1.25E-06 2.96E-06 0.422018 0.6730AR(1) -0.249123 0.012972 -19.20470 0.0000AR(2) -0.196537 0.013365 -14.70575 0.0000AR(3) -0.084137 0.013549 -6.209773 0.0000AR(4) -0.048747 0.013350 -3.651427 0.0003AR(5) -0.041069 0.012971 -3.166196 0.0016R-squared 0.995270 Mean dependent var 6.04E-05Adjusted R-squared 0.995262 S.D. dependent var 0.005342S.E. of regression 0.000368 Akaike info criterion -12.97650Sum squared resid 0.000803 Schwarz criterion -12.96413Log likelihood 38622.56 Hannan-Quinn criter. -12.97220F-statistic 124979.4 Durbin-Watson stat 2.000095Prob(F-statistic) 0.000000Inverted AR Roots .32+.43i .32-.43i -.20+.50i -.20-.50i-.49这样回归出来的结果就自动进行了序列相关性的修正。
做分析结果时,直接按照上述结果的系数就可以,不存在系数不可信的问题。
五、多重共线性检验多变量的线性回归模型可能存在多重共线性问题,即模型的解释变量之间存在相关性,可通过相关系数矩阵进行检验。
1)相关系数矩阵建立解释变量的数据组,程序:data dx1 dx2 dx3 dx13 dx4Enter键,跳出数据组。
其中,dx1 dx2 dx3 dx13 dx4是我模型中的解释变量,其他模型视具体情况而定。
点击Quick\Group Statistics\Correlations在弹出的对话框内输入需要进行相关关系检验的解释变量:dx1 dx2 dx3 dx13 dx4,OK 在弹出的对话框中点击YES,出现结果。