第四次作业第1题 已知某地区每年常驻人口数量近似服从MA (3) 模型(单位:万人)3212.06.08.0100----+-+=t t t t t Y εεεε,()25,0~N iid t ε。
2002—2004 年的常驻人口数量及1步预测数量下表。
(1)计算此模型的均值函数t Y E 和自相关函数k ρ。
(2)预测未来5年该地区常驻人口数量的95%的置信区间。
第2题 一个销售序列的拟合ARIMA (1, 1, 0)模型为)2,0(IID ~,)1)(43.01(N a a Z B B t t t =--。
已知观测值9.33,4.335049==Z Z 。
计算535251,,Z Z Z 的预报值,以及它们的90%置信的预报区间。
第3题 基于样本100,,2,1y y y 估计模型(c2),得到)0698.0()1543.0()214.7(19013.0188.026.13t u t Y t t Y +-++=. 在通常的检验水平上(=α10%,5%,1%)检验该模型是否存在单位根。
◆ 自回归求和移动平均(ARIMA )过程的预测(实际问题中常用到的补充内容,教材没有。
期末必考一题)回忆在教材的第二章第二节我们学习过ARIMA(p,d,q)过程。
定义 设1≥d 为整数。
对时间序列{}Z t t X ∈,,如果它的d 次向后 差分序列tX d L t Y )1(:-=是因果平稳的ARMA(p,q)过程,则称{}t X 是ARIMA(p,d,q)过程,即满足模型)2,0(~)(0)1)(()(σφWN tu t u L t X d L L t X L Θ+=-Φ=*Φ。
其中011)(=---=Φpx px x φφ 的p 个根都在单位圆1||=z 以外,并且0)(=Φx 与011)(=+++=Θqx q x x θθ 没有公共根。
由于方程0)1)(()(=-Φ=*Φd x x x 有d 重单位根1=x 位于单位圆1||=z 上,称{}t X 是单位根过程,它必然不能是平稳的(既不是因果平稳的,也不是非因果平稳的)。
而ARIMA(p,d,q)过程存在是否可逆的问题。
回忆时间序列可逆性的定义。
定义 称(可以是平稳的或非平稳的)时间序列{}Z t t X ∈,是可逆的,如果存在数列{}0,≥j j π满足∞<∑∞=|0|jj π以及常数λ,使得).(0s m j jt X j t u ∑∞=-+=πλ 是白噪声)2,0(σWN 。
可逆性是与因果平稳性没有关联的性质。
由于以上ARIMA(p,d,q)过程可以看作是ARMA(p+d,q)过程)2,0(~)(0)(σφWN tu tuL t X L Θ+=*Φ,因此可以通过ARMA 过程可逆性的判定定理去判别ARIMA(p,d,q)过程的可逆性。
补充推论 以上ARIMA(p,d,q)过程{}t X 是可逆的,当且仅当方程011)(=+++=Θqx q x x θθ 的q 个根都在单位圆1||=z 以外。
此时{}tX 有唯一的逆转形式.).(0)(s m j jt X j t X L t u ∑∞=-+=*∏+=πλλ,其中∑=+-=Θ-=q j j110)1(0θφφλ,∑∞=*=*∏0)(j j x j x π满足10=*π和∞<∑∞=*0||j j π,由)()1)(()()()(x d x x x x x Θ-Φ=Θ*Φ=*∏唯一确定。
还注意到由于0)1()11)(1(0)1(=Θ-Φ=∑∞=*=*∏d j j π,且10=*π,因此有101-=*-=∑∞=*ππj j 。
注解 设)(t f 是至多1-d 次确定性的(非随机的)多项式。
则对以上ARIMA(p,d,q)过程{}t X ,有tuL t X d L L t f d L t X d L L t f t X d L L )(0)1)(()]()1()1)[(()]([)1)((Θ+=-Φ=-+-Φ=+-Φφ,因为0)()1(=-t f d L 。
例如,0]2210[3)1(=++-t t L βββ。
所以,ARIMA(p,d,q)过程可以表示带有确定性多项式趋势的序列,{}tX 不能被tu L t X d L L )(0)1)((Θ+=-Φφ唯一确定。
注解 对ARIMA(p,d,q)过程{}tX 的建模可以先对它进行d 次差分,然后对差分序列tX d L t Y )1(:-=建立因果平稳的ARMA(p,q)过程,经过初步识别、参数估计、用信息准则定阶、诊断式检验的完整步骤。
现在我们开始讨论ARIMA(p,d,q)过程的预测问题。
设有ARIMA(p,d,q)过程{}t X 满足模型)2,0(~)(0)1)(()(σφIID tu tu L t X d L L t X L Θ+=-Φ=*Φ(加强为独立同分布的白噪声)。
其中011)(=---=Φpx px x φφ 与011)(=+++=Θqx qx x θθ 的根都在单位圆1||=z 以外,且没有公共根。
则以上补充推论说{}t X 是可逆的,并且有唯一的逆转形式(见推论中形式)。
由逆转形式可以看出:对∞<≤t 1,如果给定了 ,1,-t XtX (到无穷远过去)的值,则也给定了 ,1,-t ut u (到无穷远过去)的值。
但是反之不然,因为序列{}t X 不能被模型tu L t X d L L )(0)1)((Θ+=-Φφ唯一确定。
当时间原点在t 时,记条件期望⎥⎦⎤⎢⎣⎡-⋅=⋅到无穷远过去)(,1,:)( t X t X E t E 。
我们首先介绍ARIMA(p,d,q)过程的递推预测方法。
记dp x dp x dx p x px d x x x +*+--*-=----=-Φ=*Φφφφφ 11)1)(11()1)(()(为d p +次多项式。
将原模型tu L t X d L L t X L )(0)1)(()(Θ+=-Φ=*Φφ改写为q t uq t u t u d p t X d p t X t X -++-++--*++-*+=θθφφφ 11110。
设时间原点在∞<≤t 1。
对任何1≥l ,在ql t u q l t u l t u d p l t Xd p l t X l t X-+++-++++--+*++-+*+=+θθφφφ 11110式中各项取条件期望)(⋅tE ,并利用t u 的独立性而得到提前l 期的最小均方误差“近似预测”的递推公式⎪⎪⎩⎪⎪⎨⎧+≥--+*+++-+*+≤≤-++++--+*+++-+*+=+1)()1(101)()1(10)(q l d p l t X t E d p l t X t E q l q l t u q t u l d p l t X t E d p l t X t E lt X t E φφφθθφφφ 其中⎪⎩⎪⎨⎧≤+≥+=+01)()(j j t X j j t X t E j t X t E ,⎪⎩⎪⎨⎧≤+-+-+=+≥=+0)(110)(j j t X j t E j t X jt u j jt u t E 差)(等于提前一期预测误。
我们还需要给出预测误差及其方差的表示式,以便给出预测区间。
回忆有单位根的ARIMA(p,d,q)过程是非平稳的,并没有收敛的传递形 式∑∞=-*+=0j jt uj t X ψμ。
设时间原点在∞<≤t 1。
对任何1≥l ,此时lt X +可以写成截断的传递形式1)()(≥+=+l l tC l t I l t X, 其中∑-=-+*=10)(l j jl t uj l t I ψ 只是未来冲击(新息)lt u t u ++,,1 的线性函数。
回忆前面d p +次多形式)(x *Φ的展开式。
则幂级数∑∞=*=*ψ0)(j j x j x ψ的系数10=*ψ和*j ψ(1≥j )可由等式)()()(x x x Θ=*ψ*Φ,即qx qx x x d p x d p x θθψψφφ+++=+*+*++*+--*- 11]2211][11[唯一确定。
比较等式两端系数,这些系数*jψ满足递推关系式12211≥+*--*+++*-*+*-*=*j jd p j d p j j j θψφψφψφψ ,其中规定10=*ψ,0=*jψ对0<j ,0=jθ对1+≥q j 。
特别地,满足常系数齐次线性差分方程)11()1)(()(=*+*+--*-=*-Φ=**Φjd p L d p L jd L L j L ψφφψψ 当{}1,max ++≥q d p j 时。
这里一步滞后算子L 作用在*jψ的下标j 上。
而)(l tC 只是序列值到无穷远过去)(,1, -t XtX 的非线性函数。
所以由条件期望的性质,我们有)(0))(())(()(l tC l t C t E l t I t E l t X t E +=+=+。
从而到提前l 期预测的误差为[]∑-=-+*==-+=+-+=10)()()()()()(l j j l t uj l tI l tC l t C l t I l t X t E l t X l t e ψ。
由于)2,0(~σIID tu ,显然0)]([=l e E t ,即预测是无偏的。
而预测误差的方差为∑-=*=102)(2)]([l j jl t e Var ψσ。
lt X+(1≥l )的2倍标准差预测区间为∑-=*±+=±+102)(2)()]([2)(l j jl t X t E l t e Var l t X t E ψσ。
例题 考虑常见的ARIMA(1,1,1)过程的预测。
)2,0(~11)21(101σθφφIID tu t u t u t X t X t X t X -++---+=--。
其中1|1|<φ,1|1|<θ且11φθ-≠。
设时间原点在∞<≤t 1。
对任何1≥l ,在11211)11(0-++++-+--+++=+l t ul t u l t X l t X l t X θφφφ 式中各项取条件期望)(⋅tE 。
当1=l : tu t X t X t X t E 1011)11(0)1(θφφφ++--++=+。
当2=l : 01)1()11(0)2(+-+++=+tX t X t E t X t E φφφ。
当3≥l : )2(1)1()11(0)(-+--+++=+l t X t E l t X t E l t XtE φφφ。
为计算预测区间,我们需要得到截断的传递形式中的jψ权。
此时,21)11(1)1)(11()1)(()(x x x x x x x φφφ++-=--=-Φ=*Φ。