统计学中的自相关
28 24 20 16 12 8 4 X 0 0.0 0.2 0.4 0.6 0.8 1.0 1.2 Y YF1 YF2
4 3 2 1 0 -1 -2 -3 78 80 82 84 86 88 90 92 94 96 98 00 02 RESID 0
因此,由于vt= b2Xt2+ut, ,包含了产出
E (un u2 )
E (u1un ) 2 E (u2 un ) E (u2 u1 ) = 2 E (un ) E (un u1 )
E (u1u2 ) 2
E (un u2 )
E (u1un ) E (u2 u n ) 2
X3=牛肉价格。
如果模型设定为 Yt=b0+b1X1t+b2X2t+vt 那么该式中的随机误差项实际上是:vt= b3X3t+ut 于是在牛肉价格影响猪肉消费量的情况下,这种模型设定 的偏误往往导致随机项中有一个重要的系统性影响因素,使 其呈序列相关性。
(3) 设定偏误:不正确的函数形式
例如:如果边际成本模型应为: Yt= b0+b1Xt+b2Xt2+ut 其中:Y=边际成本,X=产出。 但建模时设立了如下模型: Yt= b0+b1Xt+vt
• 当DW值落在“不确定”区域时,有两种处理方法:
① 加大样本容量或重新选取样本,重作DW检验。
有时DW值会离开不确定区。 ② 选用其它检验方法。
• DW检验临界值与三个参数有关(附表4):
① 检验水平 ② 样本容量T ③ 原回归模型中解释变量个数k(不包括常数项)。
§6.3.3 LM检验(BG检验)法
的平方对随机项的系统性影响,随机项也呈现序列相关性。
800 600 400 200 0 -200 -400 -600 -800 82 RESID 84 86 88 90 92 94 96 98
10000 GDP 8000
1500 1000 500 0
6000
-500 -1000
4000
-1500
FDI 2000 0 100 200 300 400 500
u t u t 1
。
T
u t 1 2
t =2
ˆ 若把 ut, u t-1 看作两个变量,则它们的相关系数是 =
u t u t 1
t =2
T
。
u t 1 2
t =2 T
ut
t =2
T
2
对于充分大的样本显然有
ˆ ut 2 u t 1 2 。代入上式得 t =T2
(第2版第159页) (第3版第135页)
covui , u j 0 u的协方差矩阵的非对角 线元素不全为 0
u1 u ] = E 2 E[uu un
E (u12 ) E (u2 u1 ) = E (un u1 )
i=1,2,…,n
随机误差项互不相关的基本假定为: Cov(ui, uj) = 0 i≠j,i, j=1,2,…,n
如果对于不同的样本点,随机误差项之间不再是独立的,
而是存在某种相关性,则认为出现了序列相关性(serial
correlation),也称为自相关,此时: Cov(ui, uj) ≠ 0
§6.2 自相关的后果
回归系数的OLS估计量虽然是无偏的、一致的, 但不再是有效的
t 检验和F 检验是不准确的
回归系数OLS估计量的方差估计不再是无偏
的,一般而言会低估实际的方差,从而使得系数
的显著性检验容易被通过,而实际上该系数是不 显著的。 预测失效
1、参数估计量非有效 • OLS参数估计量仍具无偏性
150 RESID 100 50 0 -50 -100 -150 78 80 82 84 86 88 90 92 94 96 98 00
§6.3.2
DW(Durbin-Watson)检验法
DW检验法的适用条件 (1) 误差项ut的自相关为一阶自回归形式 (2) 因变量的滞后值yt-1不能在回归模型中作解释变量 (3) 样本容量应充分大(T 15)
DW统计量的构造
H0: = 0 (ut 不存在一阶自相关);
H1: 0 (ut 存在一阶自相关) 用残差值计算统计量DW:
ˆ (u
T t
ˆ u t 1 ) 2 ˆ2 ut
DW =
=0 =1 = -1 0<<1 -1 < < 0
t =2
t =1
T
ˆ ≈ 2 (1- )
2 u1 u2 u1 = E un u1
(u , u , , u ) n 1 2
u1u2
2 u2
u1u2
u1un u1un 2 un
E (u1u2 )
2 E (u 2 )
DW检验法与LM检验法的比较: DW统计量只适用于一阶自相关检验,而对于
• BG检验是通过一个辅助回归式完成的,以多元回归模型为例:
yt = b0+b1xt1+b2 xt2+…+b k –1 x k-1 t + ut (a) 考虑误差项为n阶自回归形式: ut = 1 ut-1 + … + n ut - n + vt (b) 其中vt 为随机项,符合各种假定条件。BG检验的具体步骤如下: (1) 提出误差项不存在n 阶自相关的假设条件: H0: 1 = 2 = …= n = 0 (2) 用OLS估计式(a)得到的残差建立辅助回归式, 估计此辅助回归式的可决系数R2 (3) 构造LM统计量, LM = TR2 2(n) (其中n为(b)式中自回归阶数) (4) 判别规则 若LM = T R2 2(n),接受H0,认为不存在n 阶自相关; 若LM = T R2 > 2(n),拒绝H0;认为存在n 阶自相关。
Hale Waihona Puke • OLS估计量不具有有效性
• 在大样本情况下,参数估计量仍然不具有渐近 有效性,这就是说参数估计量不具有一致性
2、变量的显著性检验失去意义
在关于变量的显著性检验中,当存在序列相关
时,误差项的实际方差增大,但OLS有可能低估误
差项的方差(估计小了),因此估计的 t 值变大,
从而拒绝原假设bi=0的可能性增大, 检验失去意义。
DW =
t =2
t =1
T
(3) 根据样本容量n和解释变量数目k查DW分布表,得到临界值dL和dU (4) 按照下列准则考察计算得到的DW值,以判断模型的自相关状态: ① 若DW取值在(0, dL)之间,拒绝原假设H0 ,认为ut 存在一阶正自相关。 ② 若DW取值在(4 - dL , 4)之间,拒绝原假设H0 ,认为ut 存在一阶负自相关。 ③ 若DW取值在(dU, 4- dU)之间,接受原假设H0 ,认为ut 非自相关。 ④若DW取值在(dL, dU)或(4- dU, 4 - dL)之间,这种检验无法判别。
基本思路
序列相关性检验方法有多种,但基本思路是相同 的。
首先采用普通最小二乘法估计模型,以求得随机 误差项的“近似估计量”:
ˆ ui = yi ( yi )OLS
然后,通过分析 之间的相关性,以达到判断随 ui 机误差项是否具有序列相关性的目的。
§6.3.1 图示法
如果随机误差项通过序列相关,必然会有 残差项反映出来。 因此,可以利用残差项的变化图形来判断 随机项的序列相关性。
第六章 自相关
Autocorrelation §6.1 §6.2 §6.3 §6.4 §6.5 基本概念、类型及来源 自相关的后果 自相关的检验 自相关的修正 案例
§6.1 自相关的概念
1. 基本概念
对于模型
Yi = b 0 + b 1 X 1i + b 2 X 2i +… + b k X ki + u i
3、模型的预测失效 区间预测与参数估计量的方差有关,在方差 有偏误的情况下,使得预测估计不准确,预测精 度降低。所以,当模型出现序列相关性时,它的 预测功能失效。
§6.3 自相关的检验
§6.3.1 图示法 §6.3.2 DW(Durbin-Watson)检验法 §6.3.3 LM检验(亦称BG检验)法 §6.3.4 回归检验法
-2000 82
RESID 84 86 88 90 92 94 96 98
(4) 蛛网现象
例如,农产品供给对价格的反映本身存在一个滞后期: 供给t= b0+b1价格t-1+ut 这意味着,农民由于在年度t的过量生产(使该期价 格下降)很可能导致在年度t+1时削减产量,因此不能期 望随机干扰项是随机的,往往产生一种蛛网模式。
= 2 Ω 2 I
如果仅存在
E ( i i +1 ) 0
i=1,2,…,n-1
(2.5.2)
称为一阶序列相关,或自相关(autocorrelation)。 这是最常见的一种序列相关问题。 自相关往往可写成如下形式:
t = t 1 + t
1 1
(2.5.3)
4-dL< DW < 4 dU < DW < 4- dU 4- dU < DW < 4- dL
DW检验的具体步骤:
(1) H0: = 0 (ut 不存在一阶自相关); H1: 0 (ut 存在一阶自相关)
(2) 用残差值计算统计量DW的值:
ˆ (u
T t
ˆ u t 1 ) 2 ˆ2 ut
ut的表现 ut 非自相关 ut完全正自相关