第八章、非平稳时间序列分析很多时间序列表现出非平稳的特性:随机变量的数学期望和方差随时间的变化而变化。
宏观经济数据形成的时间序列中有很多是非平稳时间序列。
非平稳时间序列与平稳时间序列具有截然不同的特征,研究的方法也很不一样。
因此,在对时间序列建立模型时,必须首先进行平稳性检验,对于平稳时间序列,可采用第七章的方法进行分析,对于非平稳时间序列,可以将采用差分方法得到平稳时间序列,然后采用平稳时间序列方法对差分数据进行研究,对于多个非平稳时间序列则可以采用协整方法对其关系进行研究。
8.1 随机游动和单位根8.1.1随机游动和单位根如果时间序列t y 满足模型t t t y y ε+=-1 (8.1)其中t ε为独立同分布的白噪声序列, ,2,1,)(2==t Var t σε,则称t y 为标准随机游动(standard random walk )。
随机游动表明,时间序列在t 处的值等于1-t 时的值加上一个新息。
如果将t y 看作一个质点在直线上的位置,当前位置为1-t y ,则下一个时刻质点将向那个方向运动、运动多少(t ε)是完全随机的,既与当前所处的位置无关(t ε与1-t y 不相关),也与以前的运动历史无关(t ε与 ,,32--t t y y 不相关),由质点的运动历史和当前位置不能得出下一步运动方向的任何信息。
这便是 “随机游动”的由来。
随机游动时间序列是典型的非平稳时间序列。
将(8.1)进行递归,可以得出010211y y y y t s s t t t t t t t +==++=+=∑-=----εεεε (8.2)。
如果初始值0y 已知,则可以计算出t y 的方差为2)(σt y Var t =。
由此看出随机游动在不同时点的方差与时间t 成正比,不是常数,因此随机游动是非平稳时间序列。
下图给出了随12机游动时间序列图:图8.1 随机游动时间序列图将随机游动(8.1)用滞后算子表示为t t y L ε=-)1( (8.3),滞后多项式为L L -=Φ1)(。
显然1=L 是滞后多项式的根,因此随机游动是一个单位根过程(unit root process )。
随机游动是最简单的单位根过程。
随机游动的概念可以进行推广。
如果时间序列t y 满足t t t y c y ε++=-1 (8.4),其中t ε为白噪声序列,c 为常数,称t y 为带漂移项的随机游动,c 称为漂移参数。
将(8.4)进行递归,得出012112y ct y c y c y t s s t t t t t t t ++==+++=++=∑-=----εεεε,设∑-=-+=100t s s t t y w ε,则t w 为标准随机游动,且t t w ct y += (8.5)。
由此看出,带漂移的随机游动可以表示为标准随机游动加上一个时间t 的线性函数ct 。
ct 称为时间序列的趋势项(trend )。
由于ct Ew ct Ey t t =+=,由此看出,带漂移项的随机游动不仅方差是随时间变化的,数学期望也是随时间变化的。
下图给出的是带漂移随机游动t t t y y ε++=-15.0的时间序列图:102030405060147101316192225283134374043464952555861646770737679828588图8.2 带漂移随机游动时间序列图 将图8.2和图8.1相比可以看出,带漂移随机游动具有明显的时间趋势。
8.1.2 伪回归伪回归(spurious regression )是指对事实上不存在任何相关关系的两个变量进行回归得出的能够通过显著性检验的回归模型。
在对两个非平稳时间序列变量进行回归时,便会出现伪回归。
下面通过简单的例子说明伪回归的表现形式及其发生的原因。
设t x 和t y 是完全独立的时间序列,并且均为随机游动,为非平稳时间序列。
现将y 对x 进行回归,回归模型为t t t v x y ++=10ββ (8.6),t v 为误差项。
由于y 和x 没有任何相关关系,回归系数1β等于0。
如果采用OLS 方法对(8.6)进行估计,估计量1ˆβ应该接近0,相应的t 检验也应该不显著。
但实际回归结果却常常相反:t 检验表明1ˆβ显著不为0,回归拟合优度2R 也不接近0,即使在样本量很大时仍然如此。
如果仅从一般的检验判断,会得出y 和x 有显著线性关系的错误结论。
造成伪回归的原因有很多,主要是时间序列本身的高度自相关造成的。
在(8.6)中,1β的实际值等于0,误差项t v 等于t y 减去常数项0β,t y 为随机游动,存在高度自相关,因此t v 也存在高度自相关,不符合OLS 回归误差项的不相关假设,t 检验不再有效。
需要特别注意的是,伪回归是指当时间序列存在单位根时,采用传统的t 检验方法来判断1β是否的等于0的结果是“伪”的,并不是说采用OLS 估计得出的1β的估计量1ˆβ是“伪”的。
实际上,此时的1ˆβ不仅仍然是1β的一致估计,而且是超一致估计(super-consistent estimation ),因此1ˆβ收敛到1β的速度比平稳情况下的收敛速度高一个阶数,由此计算的1ˆβ的标准误将随样本量的增加迅速较小,采用原来的t 检验统计量计算方法会得出很大的t 值,而此时的统计量已经不服从(或者渐进服从)t 分布,以t 分布的临界值得出的检验结果也是错误的。
这才是伪回归中“伪”的真正含义。
大量的研究表明,不仅非平稳时间序列会出现伪回归,就连平稳时间序列之间也会出现伪回归,并且时间序列自相关程度越高,伪回归出现的可能性越大。
因此,在对时间序列进行回归时,要十分小心。
首先对时间序列进行单位根检验,如果不能拒绝单位根过程,则对数据进行差分,直到数据平稳,然后用差分数据进行回归。
如果能够拒绝单位根过程,但回归的D-W 值很小,则回归结果仍然不可信。
此时不宜用Cochrane-Orcutt 广义差分法来降低残差中的自相关,正确的方法是将解释变量和被解释变量的滞后变量引入模型,形成滞后模型进行回归,对不同滞后阶数的模型进行尝试,直到回归残差为白噪声为止。
8.2 时间序列的趋势和去势许多时间序列数据,尤其是宏观经济数据,常常表现出明显的时间趋势(time trend ),即序列的期望值是时间t 的函数。
这种趋势会导致时间序列的非平稳性。
去掉序列中时间趋势的过程和方法称为去势(de-trend )。
时间序列进行去势后可以进行有关的统计分析。
时间趋势可以分为带趋势项平稳序列中的时间趋势和带漂移项单位根序列中的时间趋势。
带趋势项的平稳时间序列可以表示为1||,1<+++=-ρερδt t t y t c y (8.8),其中t ε为白噪声。
显然,带趋势项的时间序列的数学期望随时间t 的变化而变化,是不平稳时间序列。
但是由于1||<ρ,去掉趋势项t δ后,时间序列t t t y c y ερ++=-1是平稳的。
这样的趋势称为确定性趋势(deterministic trend )。
如果能够确认时间序列中的趋势为确定性趋势,可以将序列对时间t (或者t 的多项式)进行回归,回归残差便是去势后的平稳时间序列。
另一种时间趋势是带漂移的单位根中的趋势,即形如(8.4)模型中隐含的趋势,亦即(8.6)中的趋势项ct ,这种趋势是由单位根序列的漂移项积累而形成的。
尽管两种时间趋势形式上是一样的,并且在数据上的表现也很相似,但含有不同时间趋势的时间序列的统计性质却大不相同,处理方法也不一样。
对带确定趋势的时间序列,经去势后成为平稳时间序列,可以采用平稳时间序列的方法进行研究,而带漂移项的单位根是真正的非平稳时间序列,要么进行差分转换为平稳时间序列进行研究,要么采用其他方法(例如协整)进行研究。
由此看出,严格区分两种序列十分重要。
下图给出了具有两种不同趋势时间序列图:图8.3 带趋势平稳时间序列y1和带漂移随机游动时间序列y2从图中可以看出,y2序列y1序列都表现出明显的时间趋势,y1序列的波动比y2序列要剧烈一些,除此之外,另个序列的变化规律十分接近。
因此,仅凭图形直觉很难确定实际数据到底符合哪个模型,必须进行严格的统计检验。
从表面上看,对模型(8.8)可以通过检验假设0:,0:10≠=δδH H (8.9)确定时间序列是否含有确定性趋势:对模型(8.8)进行回归,对参数估计δˆ进行t 检验。
在不能确定时间序列是否平稳的情况下,这种做法是不合适的,如果序列是非平稳的单位根过程,用OLS 进行回归很容易出现伪回归,对应的检验也没有任何意义。
因此,要确定时间序列是否包含趋势,包含哪种类型的趋势,首先要对序列进行单位根检验,以确定是否平稳。
如果序列平稳,则可以采用t 检验确定是否包含确定性趋势,若包含则可用OLS 回归进行去势。
8.3 单位根检验8.3.1 单位根假设从上面的分析知道,确定性趋势和单位根过程都可以使时间序列成为非平稳序列,因此,在检验单位根时要考虑如下两种情况:t t t y y ερ+=-1 (8.10)和t t t y c y ερ++=-1 (8.11)。
在(8.10)中时间序列t y 的均值为0,检验的内容是ρ是否等于1,如果等于1,则为单位根序列,否则为平稳序列。
在(8.11)中,如果1||<ρ,则t y 为平稳序列,均值为常数,如果1=ρ,则t y 为带漂移的单位根序列,期望值随t 的变化而变化。
由(8.10)生成和由(8.11)生成的数据,检验单位根的统计量具有不同的分布,因此对单位根的检验分下面四种情况进行。
情况一(既不带常数项也不带时间趋势项):假设数据由t t t y y ερ+=-1生成,对模型进行回归,检验假设1:;1:10<=ρρH H 。
情况二(带常数项但不带时间趋势项):假设数据由t t t y y ερ+=-1生成,对模型t t t y c y ερ++=-1进行回归,检验假设 0,1:;0,1:10≠<==c H c H ρρ。
情况三(带常数项但不带时间趋势项):假设数据由t t t y c y ερ++=-1生成,对模型t t t y c y ερ++=-1进行回归,检验假设1:;1:10<=ρρH H 。
情况四(既带常数项又带时间趋势项):假设数据由t t t y c y ερ++=-1生成,对模型t t t t y c y εδρ+++=-1进行回归,检验假设0,1:;0,1:10≠<==δρδρH H 。
情况一和情况二适合没有明显趋势的数据。
情况一适合均值明显为0的数据,因为在原假设和备选假设下,t y 的数学期望都是0。
情况二适合均值是否为0不很明显的数据,如果原假设成立,则为标准单位根过程,均值为0,如果备选假设成立,则为平稳过程,均值不为0。