第11章
OLS 用于时间序列数据的其他问题11.1复习笔记
一、平稳和弱相关时间序列
1.平稳和非平稳时间序列
平稳时间序列过程,就是概率分布在如下意义上跨时期稳定的时间序列过程:如果从这个序列中任取一个随机变量集,并把这个序列向前移动h 个时期,那么其联合概率分布仍然保持不变。
(1)平稳随机过程
对于随机过程{ 1 2 }t x t =:,,…,如果对于每一个时间指标集121m t t t ≤<<⋅⋅⋅<和任意整数h≥1,()12m t t t x x x ⋅⋅⋅,,,的联合分布都与()
12 m t h t h t h x x x ++⋅⋅⋅+,,,的联合分布相同,那么这个随机过程就是平稳的。
这种平稳经常称为严平稳,它是从概率分布的角度去定义的。
其含义之一是(取m=1和t 1=1):对所有t=2,3,…,x 1与x t 都有相同的分布。
序列{ 1 2 }t x t =:,,…是同分布的。
不平稳的随机过程称为非平稳过程。
因为平稳性是潜在随机过程而非其某单个实现的性质,所以很难判断所搜集到的数据是否由一个平稳过程生成。
但是,要指出某些序列不是平稳的却很容易。
(2)协方差平稳过程(宽平稳,弱平稳)
对于一个具有有限二阶矩()2t E x ⎡⎤∞⎣⎦<的随机过程{ 1 2 }t x t =:,
,…,若:(i)E(x t )为常数;(ii)Var(x t )为常数;(iii)对任何t,h≥1,Cov(x t ,x t+h )仅取决于h,而不取决于t,那它就是协方差平稳的。
协方差平稳只考虑随机过程的前两阶矩:这个过程的均值和方差不随着时间而变化,而且,x t 和x t+h 的协方差只取决于这两项之间的距离h,与起始时期t 的位置无关。
由此立即可知x t 与x t+h 之间的相关性也只取决于h。
如果一个平稳过程具有有限二阶矩,那么它一定是协方差平稳的,但反过来未必正确。
由于严平稳的条件比较苛刻,在实际中从概率分布的角度去验证是无法实现的,所以在实际运用中所指的平稳都是指宽平稳,即协方差平稳。
一个时间序列是严平稳的不一定是宽平稳,只有当它的二阶矩存在时,才是宽平稳。
2.弱相关时间序列
(1)弱相关
对于一个平稳时间序列过程{ 1 2 }t x t =:,,…,若随着h 无限增大,x t 和x t+h “近乎独立”,则称之为弱相关的。
对于协方差平稳序列,可以用相关系数来刻画弱相关:如果随着h →∞,x t 和x t+h 之间的相关系数“足够快”地趋于0,这个协方差平稳的时间序列就是弱相关的。
换言之,随着变量在时间上的距离变大,它们之间的相关系数变得越来越小。
随着h →∞,()Corr 0t t h x x →+,的协方差平稳序列被称为渐近无关的。
(2)弱相关对回归分析重要的原因
本质上,它取代了能使大数定律(LLN)和中心极限定理(CLT)成立的随机抽样假定。
对于时间序列数据,中心极限定理要求平稳性和某种形式的弱相关,因此,在多元回归分析中使用平稳而又弱相关的时间序列最为理想。
(3)弱相关时间序列的例子
①独立同分布序列:一个独立序列无疑是弱相关序列。
②弱相关的例子是:MA(1)过程
11 1 2 t t t x e e t α-=+=,,,…
其中,()0 1 t e t =:,
,…是均值为0和方差为2e σ的独立同分布序列。
过程{}t x 被称为一阶移动平均过程[movingaverageprocessoforderone,MA(1)]:x t 是e t 和e t-1的一个加权平均;在下一期,去掉e t-1,x t+1便取决于e t+1和e t 。
MA(1)过程是弱相关的原因是序列中相邻两项之间是相关的:因为
111t t t
x e e α++=+()()2
111Cov Var t t t e x x e αασ+==,又因为
()()22
1Var 1t e x ασ=+所以
()()
2111Corr /1t t x x αα+=+,但是序列中距离在两期和两期以上的变量时,因为它们是相互独立的,所以显然无关。
因此,MA(1)是平稳弱相关的。
③AR(1)过程:
11 1 2 t t t y y e t ρ=+⋯
-,=,,序列的初始点是y 0(t=0),且(e t :t=1,2,…)是均值为0和方差为2e σ的独立同分布序列。
假定e t 独立于y 0和E(y 0)=0。
上式被称为一阶自回归过程[AR(1)]。
将上式进行迭代得到:
21111211211111111()........t h t h t h t h t h t h t h t h t h
h h t t t h t h
y y e y e e y e e y e e e ρρρρρρρρ++-++-+-++-+-+-++-+=+=++=++==++++
因为E(y t )=0,所以:
()()()()()()2122
11111,....h h h h t t h t t h t t t t t h t y Cov y y E y y E y E y e E y e E y ρρρρσ-++++==+++==y t 和y t+h 的相关系数为:
()()()1,,/h
t t h t t h y y Corr y y Cov y y σσρ++==AR (1)过程弱相关的一个关键假定是稳定性条件11ρ<。
一旦条件满足,随着h →∞,10h ρ→,称{)t y 是一个稳定的AR(1)过程,是弱相关的。
若一个序列是弱相关的,而且围绕着其时间趋势是平稳的,则可以称为趋势—平稳过程。
二、OLS 的渐近性质
1.假定TS.1'(线性与弱相关)
除了增加假定(){}1 2t t x y t =⋯,:,
是平稳和弱相关的芝外,假定TS.1'和假定TS.1完全相同。
具体而言,大数定律和中心极限定理可适用于样本均值。
线性于参数的要求意味着可以把模型写成:
011t t k tk t
y x x u βββ=++⋅⋅⋅++其中j β是待估参数,x tj 可以包含滞后因变量与解释变量的滞后项。
2.假定TS.2'(无完全共线性)
在样本中(并因而在潜在的时间序列过程中),没有任何自变量是恒定不变的,或者是其他自变量的一个完全线性组合。
3.假定TS.3'(零条件均值)
解释变量()12 t t t tk X x x x =⋯,
,,是同期外生的:()|0t t E u X =。
4.定理11.1(OLS 的一致性)
在假定TS.1'、TS.2'和TS.3'成立时,OLS 估计量是一致的:ˆplim j j
ββ=,0 1 j k =⋯,,,。
定理10.1和定理11.1之间有一些关键的区别:
(1)在定理11.1中,得到OLS 估计量的一致性结论,但并不一定是无偏的。
(2)在定理11.1中,弱化了解释变量必须外生的假定,转而要求潜在的时间序列是弱相关的。
5.假定TS.4'(同方差)
误差是同期同方差的,即对所有的t,都有
()2
Var |t t u x σ=6.假定TS.5'(无序列相关)
对所有的t s ≠,有
()|,0
t s t s E u u x x =7.定理11.2(OLS 的渐近正态性)
在假定TS.1'~TS.5'下,OLS 估计量是渐近正态分布的。
而且,通常的OLS 标准误、
t 统计量、F 统计量和LM 统计量是渐近确当的。
即使经典线性模型假定不成立,OLS 依然是一致的,通常的推断程序也是确当的。
它的前提是假定TS.1'~TS.5'都成立。
三、回归分析中使用高度持续性时间序列
1.高度持续性时间序列
(1)随机游走
①定义
在简单的AR(1)模型11 1 2 t t t y y e t ρ=+=⋅⋅⋅-,,,中,假定11ρ<能保证序列的是弱相关和平稳的。
事实表明,许多经济时间序列最好用11ρ=的AR(1)模型来刻画。
这时,可以写成:
1 1
2 t t t y y e t =+=⋅⋅⋅
-,,,假定()1 2 t e t =⋯:,
,是均值为0和方差为2e σ的独立同分布序列。
假定初始值y 0是独立于e t (t≥1)的。
上式的过程被称为一个随机游走。
在这个过程中,t 时期的y 等于上一期值y t-1加上一个独立于y t-1的零均值随机变量。
②随机游走的期望值
利用反复迭代很容易得到:
110
t t t y e e e y =++⋅⋅⋅++-两边取期望值,便得到:
()()()()()()11001
t t t E y E e E e E e E y E y t =++⋅⋅⋅++=∀≥-,因此,随机游走的期望值不取决于t 0。