第八章 单位根检验由于非平稳过程可能存在严重的伪回归问题,所以在对序列进行估计之前,需要检验序列的平稳性。
本章介绍了严格的平稳性的统计检验方法--单位根检验。
在简要介绍四种主要的非平稳随机过程以产输出单位根检验原理之后,文章主要介绍ADF 检验及PP 检验法,以及介结构突变和单位根检验。
8.1 四种典型非平稳过程简介前面我们知道,若一个时间序列含有某种变动趋势,即该序列的均值或自协方差函数随时间而改变,则称该序列为非平稳序列。
下面介绍四种典型的非平稳过程。
8.1.1随机游走过程t t t y y ξ+=-1,t=1,2,... (8.11)若}{t ξ为独立随机分布,即()0=t E ξ,()∞<=2σξt D 。
则称}{t y 为随机游走过程(Random Walk Process )。
随机游动过程是单位根过程的特例。
在现实经济社会中,如股票价格的走势便是随机游走序列。
下图是t t t y y ξ+=-1,()1,0∈t ξ生成的序列。
图8.11 随机游走过程t t t y y ξ+=-1,()1,0∈t ξ生成的序列图8.1.2随机趋势过程t t t y y ξα++=-1,),0(2σξIID t ∈, (8.12)其中α称为漂移项,由于序列一阶差分后便趋于平稳,又称随机趋势过程为差分平稳过程。
图8.12 t t t y y ξ++=-11.0,()1,0∈t ξ生成的序列8.1.3趋势平稳过程t t t y ξβα++= ,其中t t t νρξξ+=-1,1<ρ,),0(2σν∈t (8.13)由于t t t y ξαβ+=-,即当减去退势后为平稳过程,故趋势平稳过程又称为退势平稳过程。
由t t t y ξβα++=,t t t νρξξ+=-1知:11)1(--+-+=t t t y ξβα (8.14)将(4)两边同时乘以ρ,与(3)两边同时相减,整理可得:t t t y t y νρβα+++=-1'' , ),0(2σν∈t (8.15)其中,ρβρααα+-=',ρβρβ-=' 这样便得出趋势平稳过程的另一种形式。
图8.13t t t y t y ν+++=-101.001.0,),0(2σν∈t 生成的序列8.1.4趋势非平稳过程t t t y t y ξβα+++=-1,),0(2σξIID t ∈ (8.16)其中α称为漂移项,t β称为趋势项。
这种过程在实际经济中很少见。
8.2 单位根检验 8.2.1 DF 检验考虑AR(1)回归模型,),0(2σξIID t ∈ (8.21)(1) 如果 -1< β <1,则}{t y 平稳。
(2) 如果β=1,t y 序列是非平稳序列。
(8.21)式可写成:t t y ξ=∆显然t y 的差分序列是平稳的。
(3) 如果 ρ 的绝对值大于1,(8.21)式可写成: 。
序列发散,且其差分序列是非平稳的。
因此,判断一个序列是否平稳,可以通过检验β是否严格小于1来实现。
t t t y y ξβ+=-1tt t y y ξβ+-=∆)1(生成随机游走过程:t t t y y ξ+=-1,00=y ,),0(2σξIID t ∈, OLS 估计式为:t t t y y ξβ+=-1零假设和备择假设分别为1:;1:10<=ββH H得到β的估计值βˆ,并对其进行显著性检验的方法,构造检验βˆ显著性的 t 统计量。
但是,Dickey-Fuller 研究了这个t 统计量在原假设下已经不再服从t 分布,它依赖于回归的形式(是否引进了常数项和趋势项) 和样本长度T 。
构造DF 统计量∑=--=-=Tt t ys s DF 221/)(1ˆ)ˆ(1ˆξβββ, ∑=-=T T t T s 22ˆ11)(ξξ (8.22)Mackinnon 进行了大规模的模拟,给出了不同回归模型、不同样本数以及不同显著性水平下的临界值,如表8.21。
8.21DF 分布百分位数表模型(a ):数据生成过程:t t t y y ξ+=-1,00=y ,),0(~2σξIID t OLS 估计式:t t t y y ξβ+=-1 1:0=βH ;1:1<βH模型(b ):数据生成过程:t t t y y ξ+=-1,00=y ,),0(~2σξIID t OLS 估计式:t t t y y ξβα++=-1 10:0==βα;H ;11:1<≠βα;H模型(c ):数据生成过程:t t t y y ξα++=-1,00=y ,),0(~2σξIID t OLS 估计式:t t t y y ξγβα+++=-t 101:00===γβαα,;H ;01:00≠<≠γβαα,;H这样,就可以根据需要,选择适当的显著性水平,通过t 统计量来决定能否拒绝原假设。
这一检验被称为Dickey-Fuller 检验(DF 检验)根据Mackinnon 给出的临界值,若用样本计算的DF>临界值,则接受原假设,t y 非平稳;若DF<临界值,则拒绝原假设,接受备择假设。
2.ADF 检验(Augmented Dickey-Fuller Test) 关于AR(p)过程,t=1,2,…. (8.23) 上式存在p 阶序列相关,用p 阶自回归过程来修正,在上式两端减去1-t y ,通过添项和减项的方法,可得(8.24)其中 , 。
零假设和备择假设为:1:0=βH ;1:1<βH 。
原假设为至少存在一个单位根;备选假设为:序列不存在单位根。
序列t y 可能还包含常数项和时间趋势项。
判断φ的估计值φˆ是接受原假设或者接受备选假设,进而判断一个高阶自相关序t p i i t i t t y y y ξηβα+++=∑-=--111Δ∑==pi i 1ββ∑+=-=pi j ji 1βηt p t p t t t y y y y ξβββα+++++=--- 2211列AR(p) 过程是否存在单位根。
类似于DF检验,Mackinnon通过模拟也得出了不同回归模型、不同样本数以及不同显著性水平下的临界值。
这使我们能够很方便的在设定的显著性水平下判断高阶自相关序列是否存在单位根。
并且,Said-Dickey(1984)证明(8.24)式中的β的DF统计量的分布与(8.11)式中β的DF统计量相似。
当(8.24)式中分别加入漂移项和趋势项后,其β的DF统计量的分布分别与(8.12)式和(8.13)式中β的DF统计量相似。
这样,DF和ADF检验法可以共用一个DF 分布百分位数表,作为临界值的参考。
在进行ADF检验时,必须注意以下两个实际问题:第一,必须为回归定义合理的滞后阶数,通常采用AIC准则来确定给定时间序列模型的滞后阶数。
在实际应用中,还需要兼顾其他的因素,如系统的稳定性、模型的拟合优度等。
第二,选择哪种形式很重要,检验显著性水平的t统计量在原假设下的渐近分布依赖是否存在常数项、趋势项,对应临界值也不同。
若原序列中不存在单位根,则检验回归形式选择含有常数,意味着所检验的序列的均值不为0;若原序列中存在单位根,则检验回归形式选择含有常数,意味着所检验的序列具有线性趋势,一个简单易行的办法是画出检验序列的曲线图,通过图形观察原序列是否在一个偏离0的位置随机变动或具有一个线性趋势,进而决定是否在检验时添加常数项。
若原序列中不存在单位根,则检验回归形式选择含有常数和趋势,意味着所检验的序列具有线性趋势;若原序列中存在单位根,则检验回归形式选择含有常数和趋势,意味着所检验的序列具有二次趋势。
同样,决定是否在检验中添加时间趋势项,也可以通过画出原序列的曲线图来观察。
如果图形中大致显示了被检验序列的波动趋势呈非线性变化,那么便可以添加时间趋势项。
8.3.PP 检验Phillips 和Perron 构建了PP 统计量p p t ,检验一阶自回归AR (1)的平稳性,对于(8.31)方程原假设和备择假设为接受原假设,则存在单位根;拒绝原假设则不存在单位根。
PP 统计量具体构造形式如下:σγγφφˆ2)()(210ˆ00210ˆ,f s f T f t t p p --= (8.82)式中,0f 是频率为零时的残差谱密度估计值,φˆt 是φˆ的t 统计量,σˆ是回归残差的标准差,0γ是回归残差的一致估计量。
同ADF 检验的t 统计量一样,通过模拟可以给出PP 统计量在不同显著水平下的临界值。
PP 检验中的滞后阶数可以有AIC 准则等方法确定。
8.3结构突变与单位根检验 8.31三种形式的结构突变首先从理论上分析三种突变情况。
第一,均值突变的随机游走过程和均值突变的退势平稳过程;第二,斜率突变的随机游走过程和斜率突变的退势平稳过程;tt t y y ξβ+=-1⎩⎨⎧<=1:1:10ββH H第三,均值、斜率双突变的随机游走过程和均值斜率双突变的退势平稳过程。
以样本容量T为200,突变点发生在t=100为例定义三种类型的虚拟变量如下:1)脉冲式虚拟变量101t101t1≠=⎩⎨⎧=,DP,如下图:图8.31脉冲式虚拟变量2)阶跃式虚拟变量100t100t1≤>⎩⎨⎧=,DL,如下图:图8.32 阶跃式虚拟变量3)累进式虚拟变量12t t 2101121t i i t t i i i i i t t t t t t DT <≥<≤⎪⎩⎪⎨⎧--=,,如下图:图8.33 累进式虚拟变量8.32三种外生结构突变模型Perron (1990)给出了结构突变点已知条件下的单位根检验方法。
结构突变点已知时,称其为外生性结构突变点。
假定发生结构突变的时点已知为b t 。
模型1:原假设:t y 为均值突变(水平)的单位根过程;备择假设:t y 为含有一个均值突变点(水平)的退势平稳过程。
H10:t y 为均值突变(水平)的单位根过程,即t y 在b t +1期发生脉冲式突变,表达式为:t t t DP y y t ξρα+++=-1 (8.31)其中t DP 代表脉冲虚拟变量。
定义为:1+ t t 1t t 01t b b ≠+=⎩⎨⎧=,DP其中b t +1表示突变发生时点。
因为模型是动态,一个时刻的脉冲式信息冲击要扩散到序列的以后各个时期。
(8.31)可以写为:⎪⎩⎪⎨⎧∑∑++=+++=tt tt y t y t ξαξρα00y y bb t t t t ≤>,, (8.32)H11:t y 为含有一个均值突变点(水平)的退势平稳过程,表达式为t t DL y t ξρβα+++=t (8.33)其中t DL 是阶跃式虚拟变量,定义为:bbt t t DL ≤>⎩⎨⎧=t t 01,模型2:原假设:t y 为结构突变的单位根过程;备择假设:t y 为斜率突变的退势平稳过程。