第六章 自相关性本章教学要求:本章是违背古典假定情况下线性回归描写的参数估计的又一问题。
通过本章的学习应达到:掌握自相关的基本概念,产生自相关的背景;自相关出现对模型影响的后果;诊断自相关存在的方法和修正自相关的方法。
能够运用本章的知识独立解决模型中的自相关问题。
经过第四、五、六章的学习,要求自行选择一个实际经济问题,建立模型,并判断和解决上述可能存在的问题。
第一节 自相关性的概念一、一个例子研究中国城镇居民消费函数,其中选取了两个变量,城镇家庭商品性支出(现价)和城镇家庭可支配收入(现价),分别记为CSJTZC 和CSJTSR ,时间从1978年到1997年,n=20。
但为了剔除物价的影响,分别对CSJTZC 和CSJTSR 除以物价(用CPI 表示),这里CPI 为城镇居民消费物价指数(以1990年为100%),经过扣除价格因素以后,记CPICSJTSRX CPICSJTZCY ==即如下表回归以后得到的残差为Dependent Variable: YMethod: Least SquaresDate: 10/27/04 Time: 09:39Sample: 1978 1997Included observations: 20Std. Error t-Statistic Prob.Variable CoefficientC-103.369278.80739-1.3116690.2061X0.9235510.01603357.603880.00003939.341 R-squared0.994605Mean dependentvarAdjusted R-squared0.994305S.D. dependent var2124.467S.E. of regression160.3247Akaike info criterion13.08692Sum squared resid462671.9Schwarz criterion13.18649Log likelihood -128.8692 F-statistic 3318.207 Durbin-Watson stat1.208037 Prob(F-statistic)0.000000二、什么是自相关性在引出自相关性的概念之前,根据建立中国城镇居民储蓄函数,经用最小二乘法估计出参数后,得到残差序列,由此画出残差图(残差序列自身的关系),从图形上看存在t e 对1 t e 的线性关系,残差的这种现象说明了什么?下面给出序列自相关的定义。
1、如果模型中的随机误差项i u ,满足以下关系式 s t u u Cov s t ≠≠,0),( 则随机误差项i u 之间存在自相关性。
2、一阶线性自相关。
在s t u u Cov s t ≠≠,0),(中,如果1s t =-,则 ,0),(1≠-t t u u Cov并且t u 与1-t u 之间为线性关系,即t t t u u ερ+=-1,其中t ε满足古典假定,即ρεεσεεε,,0)(,)(,0)(22s t E E E s t t t ≠===<1。
将t u 与1-t u 的这种线性关系称为一阶线性自相关(或一阶线性自回归),简称一阶自相关(或一阶自回归)。
3、一阶线性自回归的数学性质。
设一元线性模型为t t t u X Y ++=21ββ并且,t t t u u ερ+=-1,其中t ε满足ρεεσεεε,,0)(,)(,0)(22s t E E E s t t t ≠===<1。
设总体一阶序列自相关系数为 )var()var(),cov(11--=t t t t u u u u ρ按照样本相关系数计算公式,样本序列自相关系数为ˆe eρ=另一方面,对一阶线性自回归t t t u u ερ+=-1,求参数ρ的最小二乘估计,即12212ˆnt t t nt t e eeρ-=-='=∑∑在大样本下,有ˆˆρρ'≈。
因此,通常可用ˆρ'表示ρˆ。
t u 的数学特性:(1)0)(=t u E 事实上,.,,,)1(1211r t r t r t t t t t t t u u u u u u -+------+=+=+=ερερερΛ将递推关系逐一代入,并注意当0→r 时,0→-r t r u ρ,则∑∞=------------=++++===+++=++=++=+=0332211232122121)()(r rt r t t t t t t t t t t t t t t t t t u u u u u ερερερρεεερεερρερερεερρερΛΛ0()()()()0,(()0)rrr t t r t r t r t r r r E u E E E E ρερερεε∞∞∞---========∑∑∑(2)2221)var(σρσε=-=t u[]2222221112222211222()()()()(2)()()()(()0)()1t t t t t t t t t t t t t t t t Var u E u E u E u E u E u u E u E Var u E u Var u εερερρεερερσεσσρ-----=-==+=++=+=+===-在t ε满足22()0,(),()0,,t t t s E E E t s εεεσεε===≠t ε服从正态分布,且ρ<1。
有23123231232222322223()()()()()()(1)1t t t t t t t t t Var u Var Var Var Var Var εεεεεεερερερεερερερεσρσρσρσσσρρρρ------=++++=++++=++++=++++=-L L LL LL L(3)2),cov(σρs s t t u u =-按照协方差的定义,可类似推出上述结果。
三、自相关产生的原因1、经济变量大多存在惯性的作用。
如经济变量随时间运动往往存在趋势的作用,使得变量在变化中具有惯性特征。
2、许多经济变量具有滞后性的表现。
3、一些随机偶然因素的干扰或影响。
4、设定偏倚。
与异方差性情况类似。
5、蛛网现象模型。
这是农产品与农产品价格所固有的一种关系,即当期农产品的产出量与前期的农产品价格有关,用公式表示为)(1-=t s t p f Q 6、时间序列更易产生自相关性。
第二节 自相关性的后果从统计意义上讲,并参考异方差性的情况,自相关性对模型的影响主要有以下几方面。
一、在自相关存在的前提下,参数估计的统计特性 1、参数估计仍是无偏的。
设线性回归模型为t t t u X Y ++=21ββ其样本回归函数中参数的最小二乘估计分别为21ˆ,ˆββ,有 11)ˆ(ββ=E 22)ˆ(ββ=E其证明可参见在第五章中异方差存在的条件下,参数估计仍是无偏的。
2、参数估计不再具有方差最小性。
在自相关下,由第五章异方差对参数估计影响的说明,有[]()∑∑∑∑∑∑∑∑∑∑∑∑∑∑=+=+=⎪⎪⎪⎭⎫ ⎝⎛+=⎪⎪⎭⎫ ⎝⎛=⎪⎪⎭⎫ ⎝⎛-+=-=-=≠=≠=≠222222222222222222222222222*2)ˆ()()(2)()(2)()(2ˆ)ˆ(ˆ)ˆ(iiji j i j i i i j i ji j i j i i i i j i j i j i j i i i i i i i i i xVar x u u E x x x x u u E x x u E x x u u x x u x E x u x E x u x E E E E Var σβσβββββββ在无自相关下,有比较上述两式,可以很明显看到,如果随机误差序列存在正的自相关,则)ˆ(*2βVar >)ˆ(2βVar 。
三、2ˆσ严重低估了2σ。
四、参数的显著性检验失效。
五、预测精度降低。
需要注意的问题,比较多重共线性与异方差、自相关在预测应用中有不同的情况。
如果模型中存在多重共线性,但变量符合经济意义,并且线性结构保持不变,则这个时候可以利用模型进行预测;如果模型中存在的是异方差和自相关问题,则不能利用模型进行预测(为什么?)。
第三节 自相关的检验一、图示法。
1、利用t e 对1-t e 的散点图进行判断。
(1)当散点大部分落在一、三象限时,则表明随机误差存在正自相关。
(2)当散点大部分落在二、四象限时,则表明随机误差存在负自相关。
2、利用t e 对时间t 的折线图进行判断。
(1)当t e 随t 逐次而变动时,t e 开始为正,随后几个也为正;t e 出现负值,随后几个也出现负值,则随机误差存在正自相关。
(2)当t e 随t 逐次而变动时,t e 不断地改变符号,则随机误差存在负自相关。
二、D-W 检验法该方法为Durbin J 和Watson G S (1951)基于残差序列t e 与1-t e 之间的相关系数ρˆ提出检验ρ的D-W 统计量。
1、D-W 检验的适用条件。
(1) 解释变量非随机。
(2)t u ~t t t u u ερ+=-1,且t ε满足基本假定。
(3)线性回归模型不存在如下形式 t t t t u Y X Y +++=-1321βββ如果出现这种情况,应用Durbin-H 检验,将在第七章介绍。
2、D-W 统计量的构成。
(1)提出假设:0:;0:10≠=ρρH H(2)构造D-W 检验统计量,记为d ,即∑∑--=-≈211ˆ),ˆ1(2t t t eee d ρρ其中。
推导过程见教科书。
3、运用D-W 检验判断一阶自相关的区域。
(1)当0ˆ=ρ时,d=2,则t u 无一阶自相关。
(2)当1ˆ=ρ时,d=0,则t u 有完全一阶正自相关。
(3)当1ˆ-=ρ时,d=4,则t u 有完全一阶负自相关。
(4)通常情况下,当ρˆ<1时,有0<d <4。
当d 落在0到4范围内时,有如下判断区域:当0<d <d L 时,存在一阶正自相关; 当d L <d <d U 时,不能判定存在自相关; 当d U <d <4-d U 时,不存在一阶自相关; 当4-d U <d <4-d L 时,不能判定存在自相关; 当4-d L <d <4时,存在一阶负自相关。
4、运用D-W 检验应注意的问题。
(1)由教科书上的图形可知,在d=2的附近,有一个较大的无自相关区域,所以通常当d 在2的左右时,可以不用查表就判断出随机误差不存在自相关。
(2)D-W 检验存在不能判定区域,这时可以用扩大样本容量或改用其它检验方法(如D-W 检验的修正方法,参见教材第167页)。
(3)要求样本容量至少为15,否则很难对自相关的存在作出准确判断。