自相关函数与偏自相关函数上一节介绍了随机过程的几种模型。
实际中单凭对时间序列的观察很难确定其属于哪一种模型,而自相关函数和偏自相关函数是分析随机过程和识别模型的有力工具。
1、自相关函数定义在给出自相关函数定义之前先介绍自协方差函数概念。
由第一节知随机过程{t x }中的每一个元素t x ,t = 1, 2, … 都是随机变量。
对于平稳的随机过程,其期望为常数,用μ表示,即()t E x μ=,1,2,t =L随机过程的取值将以 μ 为中心上下变动。
平稳随机过程的方差也是一个常量2()t x Var x σ=,1,2,t =L2x σ用来度量随机过程取值对其均值μ的离散程度。
相隔k 期的两个随机变量t x 与t k x -的协方差即滞后k 期的自协方差,定义为:(,)[()()]k t t k t t k Cov x x E x x γμμ--==--自协方差序列:k γ,0,1,2,k =L称为随机过程{t x }的自协方差函数。
当k = 0 时,20()t x Var x γσ==。
自相关系数定义:k ρ=因为对于一个平稳过程有:2()()t t k x Var x Var x σ-==所以220(,)t t k k kk x x Cov x x γγρσσγ-===,当 k = 0 时,有01ρ=。
以滞后期k 为变量的自相关系数列k ρ(0,1,2,k =L )称为自相关函数。
因为k k ρρ-=,即(,)t k t Cov x x -= (,)t t k Cov x x +,自相关函数是零对称的,所以实际研究中只给出自相关函数的正半部分即可。
2、自回归过程的自相关函数 (1)平稳AR(1)过程的自相关函数 AR(1) 过程:11t t t x x u φ-=+,|φ1| < 1。
已知()0t E x =(why?)。
用t k x -同乘上式两侧t x t k x -11t t k t t k x x u x φ---=+上式两侧同取期望:k γ11k φγ-=其中()0t t k E u x -=(why?)(由于x t = u t + φ1 u t -1 + φ12 u t -2 +… ,所以x t-k = u t-k + φ1 u t-k-1 +φ12 u t-k-2 +…,而u t 是白噪音与其t - k 期及以前各项都不相关)。
两侧同除 γ0 得:2111210kk k k ρφρφρφρ--====L因为ρo = 1,所以有k ρ=1kφ(0k ≥)对于平稳序列有 | φ1| < 1。
所以当 φ1为正时,自相关函数按指数衰减至零;当 φ1为负时,自相关函数正负交错地指数衰减至零。
见下图。
因为对于经济时间序列,φ1一般为正,所以第一种情形常见。
指数衰减至零的表现形式说明随着时间间隔的加长,变量之间的关系变得越来越弱。
1> φ1 > 0 -1<φ1 < 0图 AR(1) 过程的自相关函数同理,对于φ1 =1和φ1 >1情形即非平稳和强非平稳过程的自相关函数如下图。
φ1 = 1.1(强非平稳过程) φ1 = 1(随机游走过程)(2)AR(p ) 过程的自相关函数用t k x -(k > 0) 同乘平稳的 p 阶自回归过程1122t t t p t p t x x x x u φφφ---=++++L 的两侧,得:1122t k t t k t t k t p t k t p t k t x x x x x x x x x u φφφ--------=++++L对上式两侧分别求期望得:k γ1122k k p k p φγφγφγ---=+++L ,k > 0 用 γ0分别除上式的两侧得Yule-Walker 方程:ρk = φ1 ρk -1 + φ2 ρk -2 + … + φp ρk -p , k > 0令2121()1(1- )ppp ii L L L L G L φφφ=Φ=----=∏L ,其中L 为k 的滞后算子,这里1i G -,i = 1, 2, …, p 是特征方程()0L Φ=的根。
为保证随机过程的平稳性,要求1i G <。
则:121210p i i p i G G G φφφ-------=L ,也即1212k k k k p i i i p i G G G G φφφ---=+++L 。
可证:1122k k kk p p AG A G A G ρ=+++L (*)其中A i , i = 1, … ,p 为待定常数。
(提示:可把(*)式代入到Yule-Walker 方程中证明) 由(*)式知道会遇到如下几种情形。
① 当i G 为实数时,(*)式中的ki i AG 将随着k 的增加而几何衰减至零,称为指数衰减。
② 当i G 和j G 表示一对共轭复数时,设i G a bi =+,j G a bi =-,22b a += R ,则i G ,j G 的极座标形式是:(cos sin )i G R i θθ=+ (cos sin )j G R i θθ=-若AR(p ) 过程平稳,则1i G <,所以必有R <1。
那么随着k 的增加,(cos sin )k k i G R k i k θθ=+(cos sin )k k j G R k i k θθ=-自相关函数(*)式中的相应项ki G , k j G 将按正弦振荡形式衰减。
注意:实际中的平稳自回归过程的自相关函数常是由指数衰减和正弦衰减两部分混合而成。
③ 从(*)式可以看出,当特征方程的根取值远离单位圆时,k 不必很大,自相关函数就会衰减至零。
④ 有一个实数根接近1时,自相关函数将衰减的很慢,近似于线性衰减。
当有两个以上的根取值接近1时,自相关函数同样会衰减的很慢。
两个特征根为实根 两个特征根为共轭复根图AR(2) 过程的自相关函数3、移动平均过程的自相关函数 (1)MA(1) 过程的自相关函数。
对于MA(1)过程11t t t x u u θ-=+,有:1111()[()()]k t t k t t t k t k E x x E u u u u γθθ-----==++当k = 0时,01111()[()()]t t t t t t E x x E u u u u γθθ--==++22111(2)t t t t E u u u u θ--=++221(1)θσ=+当k = 1时,1111112()[()()]t t t t t t E x x E u u u u γθθ----==++2211112112()t t t t t t t E u u u u u u u θθθ-----=+++21θσ=当 k > 1 时,1111()[()()]k t t k t t t k t k E x x E u u u u γθθ-----==++21111111()t t k t t k t t k t t k E u u u u u u u u θθθ--------=+++0=综合以上三种情形,MA(1)过程自相关函数为ρk = 0γγk= 121, 110, 1k k θθ⎧=⎪+⎨⎪>θ1 > 0 θ1 < 0图 MA(1)过程的自相关函数可见MA(1) 过程的自相关函数具有截尾特征。
当k > 1时,ρk = 0。
(2) MA(q ) 过程的自相关函数 MA(q ) 过程的自相关函数是ρk = 112222212...,1,2,,1...0,k k k q k qq k q k q θθθθθθθθθθ++-++++⎧=⎪++++⎨⎪>⎩L 当k > q 时,ρk = 0,说明 ρk , k = 0, 1, … 具有截尾特征。
例如,对于MA(2) 过程,自相关函数是ρ1=22212111θθθθθ+++, ρ2=222121θθθ++, ρk = 0, k > 2。
4、 ARMA (1, 1) 过程的自相关函数ARMA (1, 1) 过程的自相关函数ρk 从 ρ1开始指数衰减。
ρ1的大小取决于 φ1和 θ1, ρ1的符号取决于 (φ1 -θ1 )。
若 φ1 > 0,指数衰减是平滑的,或正或负。
若 φ1 < 0,相关函数为正负交替式指数衰减。
对于ARMA (p , q ) 过程,p , q ≥ 2时,自相关函数的表现形式比较复杂,可能是指数衰减、正弦衰减或二者的混合衰减。
5、相关图(correlogram ,或估计的自相关函数,样本自相关函数) 对于一个有限时间序列(x 1, x 2, …, x T )用样本平均数x =T1∑=Tt tx1估计总体均值 μ,用样本方差s 2 =21)(1∑=-Tt tx xT估计总体方差σx 2。
当用样本矩估计随机过程的自相关函数,则称其为相关图或估计的自相关函数,记为 r k =C C k, k = 0, 1 , 2, …, K , ( K < T ) . r k 是对ρk 的估计。
其中C k =1T k-1()(),T k tt kt x x xx -+=--∑ k = 0, 1, 2, …, K ,是对γk 的估计。
C 0 =21)(1∑=-Tt tx xT是对γ0的估计。
T 是时间序列数据的样本容量。
实际中T 不应太小,最好能大于60。
注意:C k 为有偏估计量。
但在小样本条件下更有效。
相关图是对自相关函数的估计。
由于MA 过程和ARMA 过程中的MA 分量的自相关函数具有截尾特性,所以通过相关图可以估计MA 过程的阶数q 。
相关图是识别MA 过程阶数和ARMA 过程中MA 分量阶数的一个重要方法。
对于年度时间序列数据,相关图一般取k = 15就足够了。
k r 的方差近似为1T -。
所以在观察相关图时,若k r 的绝对值超过21T -(2个标准差),就被认为是显著地不为零。
当T 充分大时,近似有:1(0)k r T --=k r 12T ~ N (0, 1)第五节 偏自相关函数偏自相关函数是描述随机过程结构特征的另一种方法。
用 φkj 表示k 阶自回归过程中第j 个回归系数,则k 阶自回归模型表示为:1122t k t k t kk t k t x x x x u φφφ---=++++L其中kk φ是最后一个回归系数。
若把kk φ看作是滞后期k 的函数,则称kk φ,1,2,k =L 为偏自相关函数。
它由下式中的红项组成。
1111t t t x x u φ-=+2112222t t t t x x x u φφ--=++L1122t k t k t kk t k kt x x x x u φφφ---=++++L因偏自相关函数中每一个回归系数kk φ恰好表示t x 与t k x -在排除了其中间变量1t x -,2t x -,L ,1t k x -+ 影响之后的相关系数,112211t k t k t kk t k kk t k kt x x x x x u φφφφ----+-----=+L所以偏自相关函数由此得名。