实验二 ARIMA 模型的建立一、实验目的熟悉ARIMA 模型,掌握利用ARIMA 模型建模过程,学会利用自相关系数和偏自相关系数对ARIMA 模型进行识别,利用最小二乘法等方法对ARIMA 模型进行估计,利用信息准则对估计的ARIMA 模型进行诊断,以及学会利用ARIMA 模型进行预测。
掌握在实证研究如何运用Eviews 软件进行ARIMA 模型的识别、诊断、估计和预测。
二、基本概念ARIMA 模型,即将非平稳时间序列转化为平稳时间序列,然后将平稳的时间序列建立ARMA 模型。
ARIMA 模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA )、自回归过程(AR )、自回归移动平均过程(ARMA )以及ARIMA 过程。
在ARIMA 模型的识别过程中,主要用到两个工具:自相关函数ACF ,偏自相关函数PACF 以及它们各自的相关图。
对于一个序列{}t X 而言,它的第j 阶自相关系数j ρ为它的j 阶自协方差除以方差,即j ρ=j 0γ ,它是关于滞后期j 的函数,因此我们也称之为自相关函数,通常记ACF(j )。
偏自相关函数PACF(j )度量了消除中间滞后项影响后两滞后变量之间的相关关系。
三、实验内容(1)根据时序图的形状,采用相应的方法把非平稳序列平稳化;(2)对经过平稳化后的2000年1月到2011年10月美国的失业率数据建立ARIMA (,,p d q )模型,并利用此模型进行失业率的预测。
四、实验要求:了解ARIMA 模型的特点和建模过程,了解AR ,MA 和ARIMA 模型三者之间的区别与联系,掌握如何利用自相关系数和偏自相关系数对ARIMA 模型进行识别,利用最小二乘法等方法对ARIMA 模型进行估计,利用信息准则对估计的ARIMA 模型进行诊断,以及如何利用ARIMA 模型进行预测。
五、实验步骤(1) 输入原始数据打开Eviews 软件,选择“File ”菜单中的“New--Workfile ”选项,在“Workfile structure type ”栏中选择“Dated-regular frequency ”,在“Frequency ”栏中选择“Monthly ”,分别在起始月输入1991.01,终止月输入2010.12,点击ok ,见图1。
再建立一个New object ,将选取的x 的月度数据复制进去 。
图一(2)做出时序图并判断做出该序列的时序图2,看出该序列呈一定的上升趋势,周期性不是很明显。
直观来看,显著非平稳。
图2:时序图进一步考察其自相关图和偏自相关图,如图3图3:x的自相关图和偏自相关图自相关系数可以看出,衰减到零的速度非常缓慢,所以断定x 序列非平稳。
为了证实这个结论,进一步对其做ADF检验,结果见图4,可以看出在显著性水平0.05下,接受存在一个单位根的原假设,进一步验证了原序列不平稳。
图4:序列x的ADF检验(3)原始数据的差分处理由于数据有上升趋势,先对其进行一阶差分处理来消除趋势。
点击“Generate Series”在“Generate Series by Equation”对话框中输入相应的命令“x1=D(x)”以消除趋势项,其时序图见图5。
图5:x1的时序图由图5可以粗略的判断序列x1平稳,可见,趋势项以明显消除,但是明显看到出现了以年为周期的季节效应,所以对x做一阶12步差分来提取原序列的趋势效应和季节效应,点击“Generate Series”在“Generate Series by Equation”对话框中输入相应的命令“x12=D(x1,12)”其时序图见图6,图6:x12的时序图周期性得以部分消除,下面进一步考察x12的自相关和偏自相关图,如图7图7:x12的自相关和偏自相关图由图7可以看出,自相关系数3阶截尾,但在5阶和12阶处大于两倍标准差,偏自相关系数3阶截尾,在12阶和24阶处大于两倍标准差且具有一定的周期性。
Q统计量的P值有小于0.05的情况,因此序列为平稳非白噪声序列。
再进一步对其做ADF检验,结果见图8。
可以看出在显著性水平0.05下,拒绝存在一个单位根的原假设,进一步验证了x12序列平稳。
图8:x12的ADF检验(4)模型尝试:在序列工作文件窗口点击View/Descriptive Statistics/Histogram and States 对x12序列做描述统计分析见图9,图9:x12序列描述统计分析可见序列均值非0,需要在原序列基础上生成一个新的0均值序列。
点击Generate Series,在对话框中输入y12=x12+0.008571,并对y12做描述统计分析见图10可见序列均值为0。
图10:y12序列描述统计分析由图7的自相关和偏自相关图可知:自相关和偏自相关系数3阶显著,所以先尝试拟合ARMA(3,3)模型,在主窗口输入:ls y12 ar(1) ar(2) ar(3) ma(1) ma(2)ma(3),得下图:图11:ar(3)的拟合结果由图12可知,存在不显著的解释变量,剔除不显著的解释变量并进行进一步的尝试,得到最优的模型为ARMA((1,2),3),结果如图12图12:y12的ar(3)模型拟合图由图12可知,模型的拟合效果不佳,下面考察模型拟合后的残差,如图13图13:残差图由图13可知,残差不是白噪声序列,模型的信息提取不充分,模型不理想。
考虑到该序列既具有短期相关性又具有季节效应,短期相关性和季节效应不能简单地、可加性地提取,因而估计该序列的季节效应和短期相关性之间具有复杂的关联性。
这时通常假定短期相关性和季节效应之间具有乘积关系,尝试使用乘积模型来拟合序列的发展:由图9,序列a可看作偏自相关系数3阶截尾,自相关系数3阶截尾。
故先尝试ARMA(2,1,2)×(1,1,1)12,在主窗口输入:ls y12 ar(1) ar(2) ar(3) sar(12) ma(1) ma(2)sma(12)结果如下图图14:ARMA(2,1,2)×(1,1,1)12模型拟合结果由图14可知,模型拟合存在一些不显著的解释变量,下面进行一系列的尝试,最终确定最优的模型为:ARMA((2、3、4),1,4)×(0,1,1)12,模型拟合结果如图15图15:ARMA((2、3、4),1,4)×(0,1,1)12,模型拟合结果下面查看残差的自相关和偏自相关图图16:ARMA((2、3、4),1,4)×(0,1,1)12的残差的自相关和偏自相关图图17:ARMA((2、3、4),1,4)×(0,1,1)12拟合效果图由图17可知模型拟合的效果比较好,所以决定使用ARMA((2、3、4),1,4)×(0,1,1)12作最终的模型拟合结果。
7、模型的预测:首先扩展样本期至2012-12,最后共有三个变量值为空。
在Eviews中有两种预测方式:“Dynamic”和“Static”,前者是根据所选择的一定的估计区间,进行多步向前预测;后者是只滚动的进行向前一步预测,即每预测一次,用真实值代替预测值,加入到估计区间,再进行向前一步预测。
点击Dynamic forecast,“Forecast sample”中输入2000M01 2012M12,结果见图18:图18:模型动态预测图图中实线代表的是y12的预测值,两条虚线则提供了2倍标准差的置信区间。
可以看到,随着预测时间的增长,预测值序列的均值(接近0)上下波动,预测效果应该还不错。
软件默认将预测值放在YF中。
下面观察原序列Y12和YF之间的动态关系。
同时选中Y12和YF,击右键,点open/as group,然后点击view/graph,保持默认值不变,点击“确定”,出现图19。
图19:动态预测效果图可见,动态预测值虽然呈一条波动的曲线,但是与实际值有一定出入,说明动态预测效果不太理想。
下面我们再利用“Static”方法来预测,得到如图20所示的结果。
图20:静态拟合图图中可以看到,“Static ”方法得到的预测值波动性要大;同时,方差比例的下降也表明较好的模拟了实际序列的波动 ,Theil 不相等系数为0.363423,其中协方差比例为0.861706,表明模型的预测结果较理想。
同样同时选中Y12和YF ,击右键,点open/as group ,然后点击view/graph ,保持默认值不变,点击“确定”,出现图21,图21:静态拟合效果图上图说明模型模型的预测结果比较理想,从y12f 序列里面可以得到向前两步的预测值分别为:0.11081908593、-0.0033916132。
综合上述分析过程,实际上我们是针对原序列(X ):2000年1月—2011年9月美国失业率数据序列,建立了一个ARMA((2、3、4),1,4)×(0,1,1)12模型进行拟合,模型形式如下:234121223410.2045 1.29010.35100.6651(1)(1B )0.008571(10.8997)1 1.53010.26760.8688t t B B B B B x B B B B μ-++----=+--+ 可写为: 234121223410.2045 1.29010.35100.6651(1)(1B )(10.8997)0.0085711 1.53010.26760.8688t t B B B B B x B B B B μ-++---=++--+孔凡伟(PB10204014)。