当前位置:
文档之家› 复旦大学 经济学院 谢识予 计量经济学第十章 伪回归和单位根
复旦大学 经济学院 谢识予 计量经济学第十章 伪回归和单位根
30
在给定 Yt −1 的前提下 Yt 的条件期望 E(Yt Yt −1) =η +Yt −1 不是与t 无关的常数,而且因为
Yt = ε t + η + Yt −1 = ε t + ε t −1 + 2η + Yt − 2
= ε t + ε t −1 + L + tη + Y0
t i =1
= Y0 + tη + ∑ ε i
32
首先检验时间序列是否属于最基本的单位根过 程,也称为随机游走过程 Yt = Yt −1 + ε t ,其中 ε t 为白噪声过程。 如果自回归模型 Yt = δYt −1 + ε t 中δ = 1,或者变换 成的回归模型 ∆Yt = λYt −1 + ε t中的 λ = 0 ,那么 时间序列{ Yt }就是最基本的单位根过程——随 机游走过程,肯定是非平稳的。 因此上述差分模型中 λ 的显著性检验,就是检 验时间序列是否存在上述单位根问题。
23
图10.3 趋势平稳时间序列
1000
800
600
400
200
0 36 38 40 42 44 46 48 50 52 54
CAPAR
24
这个问题可以通过对平稳性概念的扩展解决。 方法是把数据的趋势部分看成先分离出来,然 后根据分离趋势后的纯随机部分判定平稳性。 例如一个时间序列t 时刻的随机变量可以表示 为 Yt = α + β t + ε t ,其中ε t 是一个平稳序列, 那么该序列去掉时间趋势 α + β t 之后的部分就 是平稳的,称为“趋势平稳” 。 趋势平稳时间序列中的时间趋势既可以是线性, 也可以是非线性的。
16
如果把非平稳的时间序列当作平稳序列, 事实上会破坏古典线性回归模型的基本 假设,用这样的模型进行回归,得到的 统计量都是失效的,分析、检验和预测 结果都是无效的,对计量回归分析的有 效性有很大的影响。
17
非平稳时间序列的另一个问题是,虽然 这种时间序列事实上会破坏经典回归分 析的基础和有效性,但根据分析结果并 不一定能发现问题。 事实上,有时即使时间序列严重非平稳, R2 分析结果完全无效,t、F、 等指标却 仍然很正常,模型的显著性和拟合程度 看起来都很好。这种问题通常称为“伪 回归” 问题。
12
严平稳性一般情况下强于弱平稳性,但也不一 定隐含弱平稳,因为严平稳过程各随机变量的 一、二阶矩并不一定存在。 平稳的时间序列有稳定的趋势(期望)、波动 性(方差)和横向联系(协方差),可以用时 间序列的样本均值和方差推断各时点随机变量 的分布特征。 因此运用平稳时间序列数据的经典回归分析是 有效的,以往时间序列数据的计量回归分析实 际上隐含假设数据是平稳的。
4
所谓随机过程就是一系列具有顺序性和内在联 系的随机变量的集合。 随机过程一般定义为随机变量族 {X (t ), t ∈ T } , 其中T 是给定的实数集,对应每个 t ∈ T 的 X (t ) 是随机变量。 当进一步明确参数t代表时间,T 是整数集合时, {X (t ), t = 0,±1,±称为“时间 2,L} 离散型随机过程 序列”。
第十章 伪回归和单位根
1
本章结构
第一节 时间序列及其平稳性 第二节 时间序列平稳性检验 第三节 时间序列的单积和协积
2
第一节 时间序列及其平稳性
一、时间序列数据和随机过程 二、经典计量分析和时间序列的平稳性 三、时间序列非平稳和伪回归
3
一、时间序列数据和随机过程
计量经济分析中的截面数据是在同一时点抽样 统计得到的,可以理解为一个随机变量反复抽 样的结果。 时间序列数据则是在不同时间观测或统计的数 据,不能看作同一个随机变量生成的,不能看 作与截面数据一样的同一个随机变量的反复抽 样,而应该看作不同随机变量生成的,看作是 一个随机过程的一个实现。
21
如图10.2 ,该时间序列数据基本上是平稳的。
4
2
0
-2
-4 200 400 Z2 600 800 1000
22
多数经济时间序列有上升或下降的趋势性,而 不是围绕不变水平波动。 例如图10.3中的时间序列数据CAPAR就是有明 10.3 CAPAR 显的上升趋势的时间序列数据。 不符合平稳性定义,但围绕稳定上升趋势的形 态与平稳数据是相似的,预测作用也相似。把 这种数据排除在平稳序列之外,平稳序列的应 用价值必然受到很大限制。
13
三、时间序列非平稳和伪回归
时间序列的平稳性并不总是有保证的,许多常 用的经济时间序列,如GDP、物价指数、股票 价格等,都有非平稳的特性。 例如下面图10.1中INVGM和GER两个时间序列 数据的连线图,就是经济时间序列的典型图形。 根据这两个图形很容易看出,这两个时间序列 都不符合平稳时间序列要求的稳定均值的特征, GER的图形也不满足稳定方差的基本特征,因 此这两个时间序列都是非平稳的。
8
其实并不是以时间序列数据为基础的计 量分析都会存在问题。 只要所使用的时间序列数据是平稳的, 以时间序列数据为基础的计量经济分析 就是有效的。 所谓平稳时间序列数据就是由平稳随机 过程生成的时间序列数据。
9
随机过程的平稳性包括严平稳和弱平稳两种情 况。 严平稳即随机过程{Yt , t = 0, ±1, ±2,L 在任意时 } 点概率分布的特性不受时间原点改变的影响, 可以用任意m个时刻 t1 , t 2 ,L, tm 观测值Yt1 ,Yt2 ,L,Ytm 的联合概率分布,与 t1 + k , t2 + k ,L, tm + k 时刻 观测值Yt1 + k , Yt 2 + k ,L, Yt m + k 的联合概率分布相同 P (Yt1 , Yt 2 ,L, Yt m ) = P(Yt +k ,Yt +k ,L,Yt +k ) 表示。 1 2 m
25
二、自相关图检验
原理:平稳时间序列过程的自协方差,或由协 方差计算的自相关函数,应该很小、很快趋向 于0,具有截尾或拖尾特征 。这些特征正是判 断时间序列平稳性的重要依据。 由于自相关是相对量指标,方便横向比较和建 立一般标准,因此通常利用自相关函数进行判 断。 利用自相关函数判断时间序列平稳性的首要问 题是计算自相关函数。
7
当计量分析使用的数据是时间序列数据时,情 况就会有所不同。 因为时间序列并不是一个随机变量的反复抽样, 而是随机过程的一个实现,每个数据都是特定 时间随机变量的唯一实现值,时间序列样本均 值和方差的含义与截面数据也不同,这样以随 机变量总体均值和方差的推断为基础的计量经 济分析的基础就会出现问题。
34
为了区别起见,把上述模型回归分析计算的t 统计量改称为τ 统计量。 把上述回归模型计算到的τ 统计量与DF 临界值 τ 表中查到的临界值τα 比较, < τ α 时拒绝 λ = 0 的假设,认为 λ具有显著性,时间序列不服从 上述单位根过程,时间序列是平稳的。 反之则认为λ 不显著,认为时间序列服从上述 单位根过程,时间序列是非平稳的。 上述单位根检验方法就称为“迪基-富勒检验”, 简称“DF 检验”。 35
11
现实应用中常采用另一种相对较弱的,使用 比较方便,比较符合计量经济分析要求的弱 平稳性或协方差平稳性。 弱平稳性即满足下列三条要求: (1)E (Yt ) = µ ; (2) (Yt ) = E (Yt − µ ) 2 = σ 2; Var (3)Cov(Yt , Yt + k ) = E[(Yt − µ )(Yt + k − µ )] = γ k。
10
严平稳性隐含任意时刻随机变量的概率分布相 同,意味着各个时点随机变量均值和方差(存 在且有限时)都相同,即 E (Yt ) = µ 和 Var(Yt ) = σ 2 都与t无关,两个随机变量的协方差: Cov(Yt , Yt + k ) = E[(Yt − µ )(Yt + k − µ )] = γ k 与时间t无关,只与时间间隔k有关。 对可能存在的高阶矩也同样。 严平稳性要求是相当高的,比较难满足和证明。
5
因为时间序列数据每个时点的观测统计 值,都相当于该时点生成变量水平的一 个随机变量的一个实现值,因此整个时 间序列数据就是由各个时点的随机变量 构成的随机过程的“一个实现”。
6
二、经典计量分析和时间序列的平稳性
计量经济回归分析的参数估计及相关推断检验, 都是建立在随机变量总体均值、方差推断基础 上的。 如果使用的是截面数据,那么因为截面数据是 一个随机变量的抽样结果,因此根据中心极限 定理等,可以用截面数据的样本均值和方差推 断随机变量的总体均值和方差,以此为基础的 计量回归分析和预测是有效的。
14
图10.1 非平稳时间序列数据连线图
1600 1400 1200 1000 800 600 400 200 36 38 40 42 44 46 INVGM 48 50 52 54
15
4.0 3.5 3.0 2.5 2.0 1.5 1.0 1000 2000 3000 GER 4000 5000 6000
29
三、单位根检验
定义:如果随机过程中随机变量满足关系式: Yt = η + Yt −1 + ε t 或∆Yt = η + ε t 。其中 ε 是服从 t η 白噪声过程的修正项, 是常数,则称该随机 过程为一个“单位根过程” 。 上述单位根过程只是单位根过程的基本形式, 单位根过程还可以扩展到包含时间趋势项等的 多种情况。
27
自相关函数最好的估计方法是样本自相关函数: γˆk ˆ ρk = γˆ0 其中:
γˆk =
∑ (Y − Y )(Y
t =1 t
n
t+k
−Y )
n
γˆ0 =