当前位置:文档之家› 季节ARIMA模型

季节ARIMA模型

2.8 季节时间序列模型在某些时间序列中,存在明显的周期性变化。

这种周期是由于季节性变化(包括季度、月度、周度等变化)或其他一些固有因素引起的。

这类序列称为季节性序列。

比如一个地区的气温值序列(每隔一小时取一个观测值)中除了含有以天为周期的变化,还含有以年为周期的变化。

在经济领域中,季节性序列更是随处可见。

如季度时间序列、月度时间序列、周度时间序列等。

处理季节性时间序列只用以上介绍的方法是不够的。

描述这类序列的模型之一是季节时间序列模型(seasonal ARIMA model),用SARIMA表示。

较早文献也称其为乘积季节模型(multiplicative seasonal model)。

设季节性序列(月度、季度、周度等序列都包括其中)的变化周期为s,即时间间隔为s的观测值有相似之处。

首先用季节差分的方法消除周期性变化。

季节差分算子定义为,∆s = 1- L s若季节性时间序列用y t表示,则一次季节差分表示为∆s y t = (1- L s) y t = y t- y t - s对于非平稳季节性时间序列,有时需要进行D次季节差分之后才能转换为平稳的序列。

在此基础上可以建立关于周期为s的P阶自回归Q阶移动平均季节时间序列模型(注意P、Q 等于2时,滞后算子应为(L s)2 = L2s。

A P (L s) ∆s D y t =B Q(L s) u t(2.60)对于上述模型,相当于假定u t是平稳的、非自相关的。

当u t非平稳且存在ARMA成分时,则可以把u t描述为Φp (L)∆d u t = Θq (L) v t(2.61)其中v t为白噪声过程,p, q分别表示非季节自回归、移动平均算子的最大阶数,d表示u t的一阶(非季节)差分次数。

由上式得u t = Φp-1(L)∆-dΘq (L) v t(2.62)把(2.62) 式代入(2.60) 式,于是得到季节时间序列模型的一般表达式。

Φp(L) A P(L s) (∆d∆s D y t) = Θq(L) B Q(L s) v t(2.63)其中下标P, Q, p, q分别表示季节与非季节自回归、移动平均算子的最大滞后阶数,d, D分别表示非季节和季节性差分次数。

上式称作(p, d, q) ⨯ (P, D, Q)s阶季节时间序列模型或乘积季节模型。

保证(∆d∆s D y t)具有平稳性的条件是Φp(L)A P(L s) = 0的根在单位圆外;保证(∆d∆s D y t)具有可逆性的条件是Θq (L)B Q(L s) = 0的根在单位圆外。

当P = D = Q = 0时,SARIMA模型退化为ARIMA模型;从这个意义上说,ARIMA模型是SARIMA模型的特例。

当P = D = Q = p = q = d = 0时,SARIMA模型退化为白噪声模型。

(1, 1, 1) ⨯ (1, 1, 1)12阶月度SARIMA模型表达为(1- φ1 L) (1- α1 L12) ∆∆12y t = (1+θ1 L) (1+β1 L12) v t∆∆12y t具有平稳性的条件是|φ1 | < 1,|α1 | < 1,∆∆12y t具有可逆性的条件是|θ1 | < 1,|β1 | < 1。

设log(Y t) = y t,变量∆∆12y t在EViews中用DLOG(Y,1,12)表示(这样表示的好处是EViews 可以直接预测到Y),上式的EViews估计命令是DLOG(Y,1,12) AR(1) SAR(12) MA(1) SMA(12)(0, 1, 1) ⨯ (0, 1, 1)12阶月度SARIMA模型表达为∆∆12y t = (1+ θ1 L) (1+ β1 L12) v t(2.64)(2.64) 式的EViews估计命令是DLOG(Y,1,12) MA(1) SMA(12)由(2.64) 式得∆∆12y t = (1+θ1 L) (1+β1 L12) v t = v t +θ1 L v t +β1 L12v t+ θ1 β1 L13v t= v t +θ1 v t–1 +β1 v t– 12 + θ1 β1v t– 13上式对应的EViews估计命令是DLOG(Y,1,12) MA(1) MA(12) MA(13)模型表达式是∆∆12y t = v t +θ1 v t–1 +θ12 v t– 12 + θ13v t– 13这是一个非季节模型表达式。

以上两个EViews估计命令是等价的,都是估计MA(13)模型。

注意:唯一不同点是上式对v t–13的系数没有约束,而对季节模型来说,相当于增加了一个约束条件,θ13=θ1 β1。

进一步化简∆(y t–y t - 12) = v t +θ1 v t–1 +β1 v t– 12 + θ1 β1 v t– 13∆ y t–∆ y t - 12 = v t +θ1 v t–1 +β1 v t– 12 + θ1 β1 v t– 13用于预测的模型型式是y t = y t -1 + y t - 12– y t – 13 + v t +θ1 v t–1 +β1 v t– 12 + θ1 β1 v t– 13(2.65) 从上式可以看出SARIMA模型可以展开为ARIMA模型。

对乘积季节模型的季节阶数,即周期长度s的识别可以通过对实际问题的分析、时间序列图以及时间序列的相关图和偏相关图分析得到。

以相关图和偏相关图为例,如果相关图和偏相关图不是呈线性衰减趋势,而是在变化周期的整倍数时点上出现绝对值相当大的峰值并呈振荡式变化,就可以认为该时间序列可以用SARIMA模型描述。

建立SARIMA模型,(1)首先要确定d, D。

通过差分和季节差分把原序列变换为一个平稳的序列。

令x t = ∆d∆s D y t(2)然后用x t 建立Φp (L) A P (L s) x t = Θq (L) B Q(L s) v t模型。

注意:(1)用对数的季节时间序列数据建模时通常D不会大于1,P和Q不会大于3。

(2)乘积季节模型参数的估计、检验与前面介绍的估计、检验方法相同。

利用乘积季节模型预测也与上面介绍的预测方法类似。

2.9 季节时间序列建模案例案例1:(文件名:b2c3,5b2c3)北京市1978:1~1989:12社会商品零售额月度数据(y t,单位:亿元人民币)曲线见图2.32,数据见表2.3。

y t与时间呈指数关系且存在递增型异方差。

对数的社会商品零售额月度数据(Ln y t)曲线见图2.33。

Lny t与时间近似呈线性关系(异方差问题也得到抑制)。

02004006008001000787980818283848586878889Y4.55.05.56.06.57.0787980818283848586878889LNY图2.32 y t图2.33 Lny t通过Lny t 的相关图和偏相关图(见图2.34)可以看到Lny t 是一个非平稳序列(相关图衰减很慢)且Lny t 与其12倍数的滞后期存在自回归关系。

图2.34 Lny t 的相关图(下)和偏相关图(上)对Lny t 进行一阶差分,得∆Lny t (图2.35)。

图2.36是对Lny t 进行2次一阶差分的结果,序列∆2Ln y t 是过度差分序列。

从 ∆Lny t 的相关图和偏相关图(图2.37)可以看到,通过差分 ∆Lny t 的平稳性得到很大改进,但与其12倍数的滞后期存在显著的自相关关系。

-0.4-0.20.00.20.4787980818283848586878889DLN Y-0.4-0.20.00.20.4787980818283848586878889D2LN Y图2.35 ∆Ln y t 图2.36 ∆2Ln y t图2.37 ∆Lny t 的相关图(下)和偏相关图(上)对Lny t 进行一次季节性差分(或12阶差分),得 ∆12 Lny t (图2.38)。

从 ∆12 Lny t 的相关图和偏相关图(图2.39)可以看到 ∆12 Lny t 仍然是非平稳的。

-0.4-0.20.00.20.4787980818283848586878889SD LNY图2.38 ∆12 Lny t ,(EViews :DLOG(Y ,0,12))图2.39 ∆12 Lny t 的相关图(下)和偏相关图(上)对Lny t 进行一阶差分和一阶季节性差分,得∆∆12 Lny t (见图2.40)。

从x t 的相关图和偏相关图(见图2.41)可以看到∆∆12 Lny t 近似为一个平稳过程。

-0.4-0.20.00.20.4787980818283848586878889D SD LN Y图2.40 ∆ ∆12 Lny t = x t ,(EViews :DLOG(Y ,1,12))图2.41 ∆∆12 Lny t 的相关图(下)和偏相关图(上)用1978:1~1989:11期间数据,估计y t 的 (1, 1, 1) ⨯ (1, 1, 0)12阶季节时间序列模型,得结果如下:(1+ 0.5924 L ) (1 + 0.4093 L 12) ∆∆12Lny t = (1+0.4734 L ) v t (2.66)(4.5) (5.4) (1.9)R 2 = 0.33, s.e. = 0.146, Q 36 = 15.5, χ20.05(36-2-1) = 44 EViews 估计命令是DLOG(Y ,1,12) AR(1) SAR(12) MA(1)EViews 输出结果见图2.42。

注意:(1)仔细对照(2.66)式和图2.42输出结果,不要把自回归系数估计值的符号写错。

通过自回归特征根倒数-0.59可知,把表达式中的算子写作(1+ 0.5924 L )是正确的。

通过移动平均特征根倒数-0.47可知,把表达式中的算子写作(1+0.4734 L ) 是正确的。

(2)表达式中,季节和非季节因子(特征多项式)之间是相乘关系。

(3)在EViews 估计命令中把变量写作DLOG(Y ,1,12)的好处是可以直接对y t 和∆∆12 Lny t 预测。

模型残差序列的相关与偏相关图如图2.43。

图2.42 EViews估计结果图2.43模型残差序列的相关与偏相关图对于∆∆12Lny t来,模型参数全部有显著性,Q36 = 15.5 < χ20.05(36-2-1) = 44。

两种检验通过。

见输出结果(2.42),对于∆∆12Lny t,模型共有14个特征根。

图2.44 D12DLny t的实际与预测序列图2.45 y t的实际与预测序列对1989年第12月份y t进行样本外1期预测,结果如图2.46。

相关主题