第六章(自相关)
(5)扰动项自身特性引起自相关(真实自相关)
某些偶然因素如灾害、政治因素的长期影响、蛛网现象等
第二节 自相关的后果
一、对参数估计的影响 1. 参数的OLS估计式仍然是无偏的
(无偏性证明中未涉及自相关)
2. 用OLS估计的参数的方差不再具有最小方差
(可以找到比OLS更小方差的估计式)
存在自相关时仍用经典假定下公式可能严重低估真实方差
自相关程度的度量 自相关系数
u u
t 2 n t 2
n
t t 1 n
2 2 u u t t 1 t 2
自相关的形式
如果 Cov(ut , ut 1 ) 0 称 u t 序列存在一阶自相关 如果 u t 的自相关形式为:
E ( t ) 0 Var ( t ) 2
et 1
et
O
t
O
et 1
(b)负序列相关(负自相关)
二、德宾—沃森D检验(Durbin—Watson检验)
将 ei 视为对 u i 的估计,寻求适当的检验统计量 H0 : 0 原假设: H1 : 0
建立 DW 统计量(也称d统计量):
1. 基本思想:
d
(e
2
n
t n
et 1 )
E (ut ) k E ( t k ) 0
k 0
方差
Var (ut ) Var ( t k ) 2 kVar ( t k )
2 u k t 0 t 0 2 2 (1 2 4 ) 2 1
n
t t 1 n
在样本容量大时有
2 2 u u t t1
2 2 u u t t 1 t 2
(回归系数公式) (相关系数公式)
u t 也可能是二阶自回归形式,可记为 AR(2) ut 1ut 1 2ut 2 t u t 的K阶自回归形式,可记为 AR(k )
t t 1 2 t
ˆ) ) 2(1
uu ˆ u
t t 1 2 t
ee e
t t 1 2 t
可见,对ρ=0的检验等价于对 d=2 的检验
2. 德宾—沃森DW检验的假定条件:
(1)解释变量非随机
(2)模型包括截距项(不是通过原点的回归)
(3)解释变量中不含滞后被解释变量,如 Yt 1
u2
k xt xt k t 1 k 1
n 1 n 1
x
2 t
]
E ( e )
2 i
2
XX [(n 2) (2 X
t
u t 的真实方差,因为证明见教材p160(6.20)
t 1 2 t
2
2
X X X
t
t 2 2 t
2
n 1
X X X
x
2 u 2 t
u2
2 i
2 xt xt k k u2
t 1 k 1
n 1 n 1
( x )
t t 1 2 t
2 2 t
2 u2 [ 2 2 x x t t
u2
x
2 t
]
xx {1 2 x x
t 1
n 1
2
2 t 1
第六章 自相关
本章讨论四个问题: ●自相关的概念和产生的原因 ●自相关的后果 ●自相关的检验方法
●自相关的补救方法
第一节 自相关的概念
一、什么是自相关 一般概念:自相关是指以时间和空间为顺序的观测值 序列中各部分之间的相关关系,也称序列相关。 计量经济学中的概念:特指随机扰动项逐次观测值 相互之间的相关关系。 (i j ) 一般表示为:Cov(ui , u j ) E(uiu j ) 0
2 i
会低估
k 0 , k 为偶数时 k 0 , 0 ●如果 ,k 为奇数时
量的真实方差,但对OLS估计量方差的估计也是有偏的。
xi2
u2
也可能高估OLS估计
真实方差 :
2 e 用 i 还会低估
2 2 u ˆ ) Var ( [ 2 2 2 x x t t
2
2 e t 1
关键是设法确定D的分布 。
可以证明:
d
大样本时:
2 ( e e ) t t 1 2
n
e
1
n
2 t
e e 2 e e e
2 t 2 t 1 2 t
2 t
t t 1
e
2 t 1
e
(只差一次观测的
e
2 ) i
ee d 2(1 e
(4) u i 的自相关是一阶自回归形式,即
ut ut 1 t
(5)无缺损数据
3. 具体作法
(1) 进行OLS回归得剩余 e i (2) 计算统计量
d
2 ( e e ) t t 1 2 2 e t 1 n
n
(3) 确定d 的概率分布:它与 X i 、样本容量 n 、解释变量个 数 k 都有关,具体确定其分布性质很困难。 但D-W给出了d统计量有价值的临界值(d统计量表) (4) 给定显著性水平α,查D—W 的d统计量表,得与样本容
x x x
n2
t t 2 2 t
2
n 1
x1 xn } 2 xt
真实方差 :
2 2 u ˆ ) Var ( [ 2 2 2 x x t t
u2
k xt xt k t 1 k 1
n 1 n 1
x
2 tΒιβλιοθήκη ]●存在自相关时 0 ,在经济问题中常见的是 0 ,
影响预测精度的两个因素都可能因自相关的存在而加 大不确定性,使预测的置信区间不可靠,从而降低预 测的精度。
第三节 自相关的检验
一、图解法
用样本回归剩余 e i 代替u i,绘制以 ei 为纵坐标,以 ei 1 或时间顺序 t 为横坐标的坐标图,观测是否存在自相关, e et 如
t
O
O
t
(a)正序列相关(正自相关)
ut ut 1 t
C ov( t , s ) 0
其中: t 满足OLS基本假定:
(t s)
称 u t 呈现一阶自回归形式
因为
称为一阶自回归系数,近似于一阶自相关系数 1
ˆ
u u
t 2 n
n
t t 1 2 t 1
u
t 2
u u
t 2 n t 2
且解释变量经常正自相关,交叉项 xt xt k 为正,大多数经济
应用中
t 1 k 1
n 1 n 1
k
ˆ ) xt xt k 为正。通常只用 Var ( 2
OLS估计量的真实方差。
k xt xt k 的符号难以断定,用 t 1 k 1 n 1 n 1
x
u2
由于方差标准误差的估计是有偏的,或被过低估计, 区间估计不可信,变得无意义。
3、对模型预测的影响
模型预测的精度决定于:◆抽样误差◆ u i 的方差 2
ˆ 的估计,存在自相关时, ◆抽样误差来自于对 j ˆ ) 变大,会影响抽样误差。 OLS估计的 Var ( j
ˆ 2 ei2 / n k 对 2 的 ◆在自相关情形下,用 估计也会不可靠。
ˆ ) 是经典假定下公式计算的方差 其中 Var ( 2
2 e 3. 用 i 估计
ˆ ) Var( ˆ* ) Var ( 2 2
ˆ * ) 是存在自相关时所估计参数的真实方差 Var ( 2
(可以证明)
u i 的方差,会低估 u i 的真实方差 ˆ 2 ei2 (n k ) 将低估真实的 2
2 2 x E ( u i i)
( x )
2
2 2 i
( xi2 )2
2 2 x i i
ˆ Var (2 )
2 x i
2 xi x j E (uiu j )
i j
( xi2 )2
ˆ ) 的估计出现困难 由于 E(uiu j ) ? 未知,Var ( 2 2 因为 Cov(ut , ut k ) E (ut ut k ) k 2 k u2 1
( ut 3 t 2 ) t 1 t
2
3 ( ut 4 t 3 ) 2 t 2 t 1 t
k u u 一般关系: t t k t 1 t k 0
期望
t 2 t
n
)]
只用
2 ˆ 这样,将会进一步低估 2 的真实方差,因为在低估 u 的
2 2 e ( n 2 ) 会过低估计 i u 。
经济问题中自相关时通常为正值
ˆ ) 2 基础上 用 Var( 2 u
2 x i 可能更加过低估计参数真实方差。
结论:在大多数经济应用中,存在自相关时将使OLS估计
k 2时
二、自相关产生的原因
( 1)经济变量本身的惯性作用
经济变量与前几个时期的数值往往有关,如本期消费常与 前期消费有关
(2)经济行为本身的滞后性
如本期消费还依赖于前期收入,而前期收入未纳入模型
(3)设定偏倚
如省略重要解释变量、不正确的函数形式可引起自相关
(4)数据的加工引起自相关
如数据修匀平滑, 用内插和外推取得数据
(1.8690) (0.0055) t= (14.9343) (64.2069) R 2 0.9966 F=4122.531
检验结果:回归系数标准误差非常小,t统计量较大,说明居 民收入X对居民储蓄存款Y的影响非常显著。同时可决系数 也非常高,F统计量=4122.531,也表明模型异常的显著。 但若有人说此估计结果有可能是虚假的,t统计量和F统计量 都被虚假地夸大了,因此所得结果是不可信的。为什么呢?