当前位置:文档之家› ARMAARIMA模型介绍及案例分析

ARMAARIMA模型介绍及案例分析

BOX-JENKINS 预测法
1 适用于平稳时序的三种基本模型
(1) AR( p) 模型(Auto regression Model)——自回归模型 p 阶自回归模型:
式中, 为时间序列第 时刻的观察值,即为因变量或称被解释变量; ,
为时序 的滞后序列,这里作为自变量或称为解释变量; 是随
机误差项; , , ,
4.4 建立 ARIMA 模型
4.4.1 ARIMA(3,1,3)模型 Step1:菜单栏:分析——预测——创建模型
在变量栏中,将农村居民收入移入因变量框中;方法选择 ARIMA 模型,点 击右侧“条件”,输入自回归,差分和移动平均数的值。 Step2:确定输出的统计量和相关信息。
其中拟合值和置信区间可备选,根据需要选择。 如果需要预测下一年的数据值,必须要在变量栏中的时间变量下再加入一个 年份值,否则不会显示预测值,如下图。
4.1 数据准备
年份 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991
某城市农村居民收入数据(1980-2015 年)
数据
年份 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003
模型
AR( p)
MA(q )
ARMA( p, q)
拖尾
拖尾
自相关函数
指数衰减和(或) 截尾
指数衰减和(或)
正弦衰减
正弦衰减
拖尾
拖尾
偏自相关函数
截尾(阶)
指数衰减和(或) 指数衰减和(或)
正弦衰减
正弦衰减
关于 p, q 的取值 当不包括时滞 k 12(或 4),24(或 8), p 取落入随机区间之外的偏相关系
数 PACF 的个数或与 0 有显著差异的 PACF 的个数,q 取落入随机区间之外的自
相关系数 ACF 的个数或与 0 有显著差异的 ACF 的个数。 当仅观察时滞 k 12 (或 4),24(或 8), p 取显著不为 0 的 PACF 的个数,
q 取显著不为 0 的季节自相关数目。
4 案例分析
(1) ARIMA( p, d, q) 模型 这里的 d 是对原时序进行逐期差分的阶数,差分的目的是为了让某些非平稳 (具有一定趋势的)序列变换为平稳的,通常来说 d 的取值一般为 0,1,2。 对于具有趋势性非平稳时序,不能直接建立 ARMA模型,只能对经过平稳化 处理,而后对新的平稳时序建立 ARMA( p, q) 模型。这里的平文化处理可以是差 分处理,也可以是对数变换,也可以是两者相结合,先对数变换再进行差分处理。 (2) ARIMA( p, d, q)(P, D,Q)s 模型 对于具有季节性的非平稳时序(如冰箱的销售量,羽绒服的销售量),也同 样需要进行季节差分,从而得到平稳时序。这里的 D 即为进行季节差分的阶数; P,Q 分别是季节性自回归阶数和季节性移动平均阶数;S 为季节周期的长度,如
3.1 自相关函数
自相关是时间序列Y1,Y2, Yt 诸项之间的简单相关。它的含义与相关分析中变 量之间的简单相关一样,只不过它所涉及的是同一序列自身,因而称作自相关。 自相关程度的大小,用自相关系数 rk 度量。
nk
( yt y)( ytk y)
rk t1 n
( yt y)2
t 1
式中, n 为样本数据的个数; k 为滞后期; y 为样本数据平均值。 自相关系数 rk ,可看作自变量 k 的函数,即自相关函数。它表示时间序列滞 后 k 个时间段的两项之间相关的程度。如 r1 表示每相邻两项间的相关程度; r2 表 示每隔一项的两个观察值得相关程度。 随机序列自相关系数的抽样分布,近似于以 0 为均值,1 n 为标准差的正态 分布。自相关系数的 95%置信区间为 (1.96 ,1.96 ) ,此处 1 n 。如果一个 时间序列的自相关系数全部落入这个区间,则认为该序列是纯随机序列。 将时间序列的自相关系数绘制成图,并标出一定的置信区间(通常采用 2 倍 标准差作为置信区间的两个端点),被称作自相关分析图。 中的操作 1. 输入变量数据;定义时间序列日期(数据 定义日期) 2. 分析 预测 自相关(如下);将要分析的变量从左侧移入右侧变量框中
3.3 ARIMA 模型的参数确定
Step1:判断时序是否平稳,若不平稳,经过若干次逐期差分或季节差分使其 平稳,则可确定 d 和 D 。对于社会经济现状,一般 d 和 D 的数值取 0,1 或 2。
若自相关系数 ACF 随着滞后期(一般设为 16)增大,而迅速趋于 0,则认 为该时序是平稳的。
若自相关系数 ACF 随着滞后期增大,自相关系数 ACF 不趋于 0,则认为该 时序是非平稳的。更具体地说,若随着时滞 k 的增大,自相关系数 ACF 缓慢减 小,说明随着序列两项间隔的提前,相关程度变弱,则序列具有趋势性;若对于 季度数据或月度数据,当滞后期为 4(或 12),8(24)等时,自相关系数 ACF 显著地部位 0,即在随机区间之外,则意味着该时序具有季节性。如果时序具有 趋势性,那么需要进行逐期差分,由逐期差分的次数决定 d 的取值;如果序列具 有季节性,那么要进行季节差分,由季节差分次数决定 D 的值。
4.3 差分平稳化
对时间序列进行差分平稳,并绘制相关系数图和偏自相关系数图如下。 操作为:分析——预测——自相关(勾选:1 阶差分)
从右侧图形可以看出,在滞后期 k=3 之后,自相关函数衰减,并且均在置信 区间范围之内,因此可以认为该序列平稳了。
再观察变换后的序列的偏自相关函数图,如下图。
其中33 =较大,其他并没有明显趋于 0,可以认为在 K=3 后拖尾,而自相关 函数可以看做是 K=3 后截尾,也可以看做为拖尾。(自拖,偏拖)——ARIMA 模 型,(自截,偏拖)——MA 模型,因此,经过一阶差分变换后的农村居民收入 所选定的模型为 ARIMA(3,1,3) 或 ARIMA(0,1,3) 。分别对两个模型进行拟合和预 测,比较其精度。
Step3:绘制其时序图,观察其是否平稳。分析——预测——序列图
此时可以看出该曲线有明显上升趋势,为非平稳序列,需要进行差分平稳化。 同时,也可以绘制自相关图形(操作:分析——预测——自相关)来观察其 趋势,如下图。
由上面自相关系数图可知,随着延迟数目的增加,系数并没有显著的趋近于 0,且许多数值较大的系数落在了置信区间之外,说明该时间序列并非平稳的。
yt c 1 yt1 2 yt2 p yt p et 1et1 2et2 qetq 显然, ARMA( p, q) 模型为自回归模型和移动平均模型的混合模型。当 q =0, 时,退化为纯自回归模型 AR( p) ;当 p =0 时,退化为移动平均模型 MA(q) 。
2 改进的 ARMA 模型
j 1
rk j
k 1 k 2,3,
偏自相关系数kk ,可看作自变量 k 的函数,即偏自相关函数, 1 kk 1。 它用以测量当剔除其他滞后期( t 1, 2,3, , k 1)的干扰的条件下,Yt 与Ytk 之 间相关的程度。与自相关系数类似,同样可以采用偏自相关分析图来对模型进行
识别。
数据
年份 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015
单位:元
数据
对 36 年农村居民收入建立 B-J 模型,并预测 2016 年的收入情况。
4.2 时序分析
Step1:将数据输入到中,并定义变量的精度为小数点后两位; Step2:定义日期。数据——定义日期——输入“1980” 因为本次数据没有季节性,所以只需要选择年份为 1980 年,如下图。
为待估的自回归参数。
(2) MA(q) 模型(Moving Average Model)——移动平均模型 q 阶移动平均模型:
yt et 1et1 2et2 qetq 式中, 为时间序列的平均数,但当{yt}序列在 0 上下变动时,显然 =0, 可删除此项; et , et1 ,et2 ,…, etq 为模型在第 t 期,第 t 1期,…,第 t q 期 的误差;1 ,2 ,…, q 为待估的移动平均参数。 ( 3 ) ARMA( p, q) 模 型 — — 自回归 移动 平均模 型( Auto regression Moving Average Model) 模型的形式为:
3.2 偏自相关函数
偏自相关函数是时间序列 Yt ,在给定了 Yt1,Yt2 , Ytk1 的条件下,Yt 与Ytk 之 间的条件相关。由于它需要考虑排除其他滞后期的效应,因而被称为偏自相关。
偏自相关系数kk 计算公式如下。
r1
k 1
kk
rk
k 1, j
j 1
rk j
k 1
1
k 1, j
3 模型的识别
模型的识别的本质是确定 ARIMA( p, d, q)(P, D,Q)s 中的 p, d, q 以及 P, D,Q 与 S 的取值。借助于自相关函数(Auto correlation Function, ACF)以及自相关分析 图和偏自相关函数(Partial Correlation Function, PACF)以及偏自相关分析图来 识别时序特性,并进一步确定 p 、 q 、 P 、 Q 。
3. 勾选自相关、偏自相关,转换暂时不选(如果为非平稳序列,可勾选差分/ 自然对数转换,其中差分的阶数需要根据自相关图形来确定,通常为 0,1,2)
未进行差分处理,由图可知几乎一半的自相 关系数未进入置信区间,说明该序列非平稳,此时需要ቤተ መጻሕፍቲ ባይዱ行差分处理,即在重复 第 2 步时,差分选项选择 1 或 2。
左侧图形为未经过差分处理的某城市农村居民收入的 ACF 图,可以看出自
相关系数并未迅速趋于 0,说明该时序是非平稳的。右侧为该序列的线性图,也
相关主题