4.2 序列相关王中昭制作§违反了随机扰动项之间相互独立的假定,称为序列相关。
●学习内容:王中昭制作•一、序列相关定义及其类型•二、实际经济问题中的序列相关性•三、序列相关性的后果•四、序列相关性的检验•五、序列相关性的修正王中昭制作•1、序列相关(或称自相关)的定义:•在线性回归模型基本假定4中,我们假设随机扰动项序列的各项之间不相关,如果这一假定不满足,则称之为序列相关。
即用符号表示为:ji E Cov j i j i ≠≠=当 0)(),(μμμμ一、序列相关定义及其类型王中昭制作•称为一阶序列相关,即μi =ρμi-1+εi ,,i=1,2,…,n,-1<ρ<1•其中ρ称为自协方差系数或者一阶自相关系数。
这是常见的序列相关,除此之外统称为高阶序列相关。
如:μi =ρ1μi-1+ρ2μi-2+εi ,称为二阶序列相关。
1,2,1 0)(1-=≠+n i E i i μμ如果仅存在●2、类型王中昭制作•1、经济发展的惯性•2、模型设定偏误•3、滞后效应•4、对数据的处理可能会导致序列相关•5、由随机扰动项本身特性所决定●二、实际经济问题中的序列相关性●1、经济发展的惯性王中昭制作•大多数经济时间序列都有一个明显的特点,就是它的惯性。
表现在时间序列数据不同时间的前后关联上。
众所周知,GDP、价格指数、生产、消费、就业和失业等时间序列都呈现周期循环。
相继的观测值很可能是相互依赖的。
这样就导致经济变量的前后期(或前后若干期)出现相关,从而使随机误差项相关。
•这是最常见的序列相关现象。
王中昭制作•从而造成v 自相关。
原因是替代品的价格对牛肉销量有重要影响。
tt t t t X X X Y μββββ++++=3322110tt t t v X X Y +++=22110βββtt t X v μβ+=33例如,如果真实的回归方程形式为,其中,被解释变量Y 表示牛肉需求量,解释变量分别为牛肉价格X 1、消费者收入X 2和替代品的价格X 3。
但是在作回归时用的是:那么,随机扰动项就会出现系统性模式:●2、模型设定偏误(如应含而未含变量的情形或者模型函数形式有偏误)王中昭制作•例如:在消费支出C 对收入I 的时间序列分析中,当期的消费支出除了依赖于收入I 等其它变量外,还依赖前期的消费支出.•如:C t =β1+β2I t +β3C t-1+μt ,•则C t-1=β1+β2I t-1+β3C t-2+μt-1•从上式可知因为μt 与μt-1分别为C t 与C t-1的模型的随机误差项,如果C t 与C t-1相关,会导致μt 与μt-1相关。
这种现象常出现在农产品供给函数中,使得模型中随机误差项产生序列相关。
例如农产品(粮食)供给函数为:tt t P S μββ++=-121是蛛网理论啊●3、滞后效应王中昭制作•在经验分析中,许多数据是经过加工而成的。
例如,在用到季度数据的时间序列回归中,季度数据通常由月度数据加总而成。
这种平均的计算减弱了每月的波动而引进了数据的匀滑性,导致数据的前后期相关。
•另外,在对原始数据进行移动平均等处理后,再用它来建立模型,这时这些数据也会存在前后若干期的相关性。
, (11)Y Y Y Y N t t t t +--+++=.ˆ,ˆ54相关Y Y ⇒3ˆ:21--++=t t t t Y Y Y Y 如,3ˆ,3ˆ34552344Y Y Y Y Y Y Y Y ++=++=如●4、对数据的处理可能会导致序列相关●5、由随机扰动项本身特性所决定王中昭制作•在许多情况下,真实的随机扰动项的各项值是相关的,例如:旱涝、地震、战争、罢工等纯随机因素所产生的影响将会延续一段时期,从而导致随机扰动项序列相关。
•因为被解释变量与随机误差项具有相同的分布(只有数学期望不同而已)。
•可以证明:如果因变量观测值之间如果存在相关性,则随机扰动项之间也就存在相关性。
王中昭制作•(1)、参数估计量非有效性:OLS 估计得到的参数值虽然仍为线性、无偏估计量,但不具有有效性(即最小方差性)。
•(2)、变量的显著性检验失效:可以证明在序列存在相关的情况下,参数估计值的方差可能变小(或者变大),从而使回归系数的t 统计量变大(或者变小)。
这样会使t 检验失去意义。
)ˆvar( ˆi i S ββ=如果i S t ii ββˆˆ =则●三、序列相关性的后果王中昭制作(3)模型预测失效因为如果存在序列相关则使模型不具有优良性,从而它的预测功能降低。
故此时计算预测区间可能没有意义的。
?返回王中昭制作•序列相关性的检验方法有许多,如:冯诺曼比检验法、回归检验法、D.W 检验等。
•这些检验方法的共同思路是:首先采用OLS 估计模型,以求得随机干扰项的“近似估计量e i ”,然后通过分析这些e i 之间的相关性以达到判断随机干扰项是否具有序列相关的目的。
•下面只讲4种常用方法:•1、图形法•2、回归检验法•3、D.W 检验(Durbin-Watson)•4、拉格朗日乘数(LM )检验。
●四、序列相关性的检验王中昭制作例4.2.1, (P132),用例2.6.2的数据(文件d3p56.dta)。
中国国民消费函数,检验是否序列相关.方法1:首先估计模型,然后得到残差residual (记为e t )。
用模型残差e t 与滞后一期e t-1的相关图。
●1、图形法有两种表示方式王中昭制作reg y xpredict et,residual //记残差变量名为etgen et_1=L.et //产生滞后1期变量存在正的一阶序列相关(因为大多数点落在第一和第三象限中),如果大多数点落在第二和第四象限中,则存在负的一阶序列相关,如果点均匀地分布在原点周围,则不存在一阶序列相关.-3-2-112Residuals-2000-1000010002000residuals滞后一期王中昭制作图形法的方法2•由于上述的检验只能检验一阶序列相关。
因此图形法可以用下面第二种方法来处理:•自相关系数图和偏自相关系数图。
•滞后k 阶的自相关系数公式见下式,自相关系数体现了残差当前期与滞后各期的相关性。
在stata 中用ac 来计算和作图。
)var()var(),(k t t k t t k COV --⨯=μμμμρ王中昭制作•偏自相关系数的含义:•求出滞后k 自相关系数ρk 时,实际上得到并不是μt 与μt-k 之间单纯的相关关系。
因为μt 同时还会受到中间k-1个随机变量μt-1, μt-2, ……μt-k+1, 的影响,而这k-1个随机变量又都和μt-k 具有相关关系,所以自相关系数ρk 里实际掺杂了其他变量对μt , 和μt-k 的影响。
•为了能单纯测度μt-k 对μt 的影响,引进偏自相关系数的概念。
•对于时间序列{μt },所谓滞后k 偏自相关系数指在给定中间k-1个随机变量μt-1, μt-2, ……μt-k+1的条件下,或者说,在剔除了中间k-1个随机变量μt-1, μt-2, ……μt-k+1的干扰之后,μt-k 对μt 影响的相关程度。
•计算公式为下式,具体计算就用μt 与μt-1, μt-2, ……μt-k 回归后,其系数就是μt 偏自相关系数。
)var(*)var(/)),...((11k t t k t k t t t k E COV pac --+--=μμμμμμ王中昭制作•在stata中用ac (auto-correlation cofficient)和pac(partial auto-correlation cofficient)命令来计算自相关系数和偏自相关系数及其图形。
王中昭制作•用ac et命令后的结果,灰色区域为95%的置信区间,表明残差的滞后1阶自相关系数较大,一般地在置信区间以外就可认为存在1阶序列相关。
-1.-.5..51.051015LagBartlett's formula for MA(q) 95% confidence bands王中昭制作•用pac et 命令后的结果,灰色区域为95%的置信区间。
-1.00-0.500.000.501.00051015Lag 95% Confidence bands [se = 1/sqrt(n)]•表明残差的滞后1、2阶偏自相关系数超出置信区间,存在1阶和2阶序列相关。
王中昭制作•如果想看具体数值可用:•corrgram et,lags(10)•其中Q 值为检验自相关显著性的一个统计量王中昭制作2、回归检验法(Wooldridge 书中提出的方法)•以为被解释变量,以各种可能的相关量,如等作为解释变量建立各种方程:t e 2121,,t t t e e e ---1112233, t 2,3,...,n, t 4,5......,nt t t t t t t t e e e e e e ρερρρε----=+==+++=对各种方程进行统计检验,如果存在某一种函数形式通过检验,则说明原模型存在序列相关。
回归检验法不仅能知道序列相关是否存在,而且还知道自相关的形式,适合于任何类型的序列相关性问题的检验。
王中昭制作以例4.2.1为例(文件d3p56.dta,P132),经过筛选在各种回归模型中结果较好的模型为:•容易看出模型通过统计检验(注意不用考虑经济意义检验),故存在序列相关,而且从模型可知至少是二阶以上的序列相关。
et=1.658561e t-1-0.8642281e t-2王中昭制作D.W 检验是检验自相关的最著名、最常用的方法。
此法是由J.Durbin 和G.S.Watson 于1951年提出一种适合于大样本的检验方法。
•内容有:•(1)、适用条件•(2)、检验步骤●3、D.W 检验(Durbin-Watson)王中昭制作(1)、适用条件•(a) 解释变量是非随机的(即自变量与随机扰动项不相关);•(b)随机扰动项是一阶自相关:μt =ρμt-1+vt;•(c)回归模型解释变量中不包含滞后因变量;•(d)样本容量较大(如n>25).王中昭制作(2)、检验步骤•(a )提出假设•H 0:ρ=0,即不存在一阶自相关;(μt =ρμt-1+v t )•H 1:ρ≠0,即存在一阶自相关。
•(b )构造统计量D.W21221()ˆ.,ntt t t t tntt e ed DWe Y Y e-==-===-∑∑其中王中昭制作ρ的估计量ρ^与d=D.W 的关系211222211()2(1)nntt tt t t nnttt t ee e ed ee--====-=≈-∑∑∑∑1221ˆntt t ntt e eeρ-===∑∑)ˆ1(2ρ-≈d 22122,,nnt t t t n e e-==∑∑当较大时,大致相等定义•(为样本的一阶自相关系数)作为ρ的估计量。