第2篇时间序列数据的回归分析
第10章时间序列数据的基本回归分析
10.1 复习笔记
一、时间序列数据的性质
时间序列数据与横截面数据的区别:
1.时间序列数据集是按照时间顺序排列。
2.时间序列数据与横截面数据被视为随机结果的原因不同
(1)横截面数据应该被视为随机结果,因为从总体中抽取不同的样本,通常会得到自变量和因变量的不同取值。
因此,通过不同的随机样本计算出来的OLS估计值通常也有所不同,这就是OLS统计量是随机变量的原因。
(2)经济时间序列满足作为随机变量结果所要求的直观条件。
变量的结果都无法事先预料,它们当然应该被视为随机变量。
一个标有时间脚标的随机变量序列被称为一个随机过程或时间序列过程。
搜集到一个时间序列数据集时,便得到该随机过程的一个可能结果或实现。
因为不能让时间倒转重新开始这个过程,所以只能看到一个实现。
如果特定历史条件有所不同,通常会得到这个随机过程的另一种不同的实现,这正是时间序列数据被看成随机变量之结果的原因。
3.一个时间序列过程的所有可能的实现集,便相当于横截面分析中的总体。
时间序列数据集的样本容量就是所观察变量的时期数。
二、时间序列回归模型的例子
1.静态模型
假使有两个变量的时间序列数据,并对y t和z t标注相同的时期。
把y和z联系起来的一个静态模型(static model)为:
y t=β0+β1z t+u t,t=1,2,…,n
“静态模型”的名称来源于正在模型化y和z同期关系的事实。
一个静态模型的例子是静态菲利普斯曲线。
在一个静态回归模型中也可以有几个解释变量。
2.有限分布滞后模型
(1)分布滞后模型
在有限分布滞后模型(finite distributed lag model,FDL)中,容许一个或多个变量对y的影响有一定时滞。
考察如下模型:
y t=α0+δ0z t+δ1z t-1+δ2z t-2+u t
它是一个二阶FDL。
为集中研究其他条件不变情况下z对y的影响,设每个时期的误差项均为0。
那么,
y t-1=α0+δ0c+δ1c+δ2c
y t=α0+δ0(c+1)+δ1c+δ2c
y t+1=α0+δ0c+δ1(c+1)+δ2c
y t+2=α0+δ0c+δ1c+δ2(c+1)
y t+3=α0+δ0c+δ1c+δ2c
从前两个方程得到y t-y t-1=δ0,它表明δ0是z在t时期提高一个单位所引起Y的即期变化。
δ0通常被y称作冲击倾向(impact propensity)或冲击乘数(impact multiplier)。
如果把δj作为j的函数作图,便得到滞后分布(1ag distribution),它概括了z的一个暂
时变化对y的动态影响。
(2)分布滞后的长期乘数
如果把y的初始值标准化为y t-1=0,这个滞后分布就描绘出z暂时提高一个单位所导致y的随后所有取值。
在t期之前,z等于常数c。
从第t期起,z永久性地提高为c+1。
即当s<t时,z s=c;当s≥t时,z s=c+1。
再次把误差都设为0,便得到:
y t-1=α0+δ0c+δ1c+δ2c
y t=α0+δ0(c+1)+δ1c+δ2c
y t+1=α0+δ0(c+1)+δ1(c+1)+δ2c
y t+2=α0+δ0(c+1)+δ1(c+1)+δ2(c+1)
随着z从第t期开始永久性提高,一期后y提高了δ0+δ1,两期后y提高了δ0+δ1+δ2。
两个时期以后,y没有进一步变化。
这表明,z的当期和滞后系数之和δ0+δ1+δ2,等于z的永久性提高导致y的长期变化,它被称为长期倾向或长期乘数。
LRP是在分布滞后模型中人们经常关注的问题。
(3)q阶有限分布滞后模型
y t=α0+δ0z t+δ1z t-1+…+δq z t-q+u t
估计一个分布滞后模型的主要目的是检验z是否对y有滞后影响。
冲击倾向总是同期z 的系数δ0。
从方程中把z t省略掉,这样,冲击倾向便为0,滞后分布又被描绘成j的函数δj。
长期倾向便是所有变量z t-j的系数之和:
LRP=δ0+δ1+…+δq
3.标注时间的惯例
当模型中含有滞后解释变量时,对初始观测的处理容易产生混乱。
惯例是:既然它们是
样本中的初始值,就从t =1开始标注时间。
三、经典假设下OLS 的有限样本性质
1.OLS 的无偏性
第一个假定说明时间序列过程服从一个线性于参数的模型。
(1)假定TS.1(线性于参数)
随机过程
{(x t1,x t2,…,x tk ,y t ):t =1,2,…,n }服从线性模型:
y t =β0+β1x t1+…+βk x tk +u t
其中,{u t :t =1,2,…,n }是误差或干扰序列。
其中,n 是观测次数(时期数)。
(2)假定TS.2(无完全共线性)
在样本中(并因而在潜在的时间序列过程中),没有任何自变量是恒定不变的,或者是其他自变量的一个完全线性组合。
(3)假定TS.3(零条件均值)
()0,1,2,,t E u X t n ==L
这是一个关键假定,假定TS.3意味着,t 时期的误差项u t 与每个时期的任何解释变量都无关。
如果u t 独立于x 且E (u t )=0,那么假定TS.3自动成立。
①同期外生性。
在时间序列的情况下需要u t 与时间下标为t 的解释变量不相关:用条件均值表示,即:
()(),,0t ti tk t t E u x x E u X ==L
当上式成立时,称x tj 是同期外生的,意味着u t 和同时期的解释变量无关:Corr (x ij ,u t )=0,对所有的j 都成立。
②变量严格外生 假定TS.3不仅仅要求同期外生性:解释变量必须是外生的。
因此,当TS.3成立时,称解释变量严格外生。
能导致t 时期的无法观测因素与任何时期任一解释变量相关的情况,都会致使假定TS.3不成立。
导致无效的两个主要情形是遗漏变量和对某些回归元的测量误差。
(4)定理10.1(OLS 的无偏性)
在假定TS.1、TS.2和TS.3下,以X 为条件,OLS 估计量是无偏的,并因此下式也无条件地成立:
()
ˆ,0,1,,j j
E ββj k ==L 2.OLS 估计量的方差和高斯-马尔可夫定理
(1)高斯-马尔可夫定理成立还需要的两个假定
①假定TS.4(同方差性)
以X 为条件,在所有时期t ,u t 的方差都相等: ()()2,1,2,,t t Var u X Var u σt n ===L
这个假定意味着,()t Var u X 不能依赖于X ,而且,Var (u t
)在所有时期都保持不变。
当假定TS.4不成立时,称误差是异方差的。
②假定TS.5(无序列相关)
以X 为条件,任意两个不同时期的误差都不相关:
(),0,t s Corr u u X t s =∀≠
(2)定理10.2(OLS 的样本方差)
在时间序列高斯-马尔可夫假定TS.1~TS.5下,以X 为条件,ˆj
β的条件方差为:
()()
22ˆ/1,1,,j j j Var βX σSST R j k ⎡⎤=-=⎣
⎦L 其中,SST j 是x ij 的总平方和,2j R 为由x j 对所有其他自变量回归得到的R 2。
在假定TS.1~TS.5下,通常的误差方差估计量也是无偏的,而且高斯-马尔可夫定理成立。
(3)定理10.3(σ2的无偏估计) 在假定TS.1~TS.5下,估计量2
ˆ/σ
SSR df =是σ2的一个无偏估计量,其中df =n -k -1。
(4)定理10.4(高斯-马尔可夫定理)
在假定TS.1~TS.5下,以X 为条件,OLS 估计量是最优线性无偏估计量。
3.经典线性模型假定下的推断
(1)假定TS.6(正态性)
误差u t 独立于X ,且具有独立同分布Normal (0,δ2)。
假定TS.6蕴涵了假定TS.3、TS.4和TS.5,但它更强,因为它还假定了独立性和正态性。
(2)定理10.5(正态抽样分布)
在时间序列的CLM 假定TS.1~TS.6下,以X 为条件,OLS 估计量遵循正态分布。
而且,在虚拟假设下,每个t 统计量服从t 分布,F 统计量服从F 分布,通常构造的置信区间也是确当的。
定理10.5意味着,当假定TS.1~TS.6成立时,横截面回归估计与推断的全部结论都可以直接应用到时间序列回归中。