当前位置:文档之家› 时间序列大作业

时间序列大作业

应用时间序列大作业课题:基于ARIMA模型的全国1980-2013年邮电业务函件数量时间序列分析及预测。

姓名:***学号:**********编号:48基于ARIMA 模型全国1980-2013年邮电业务函件数量时间序列分析及预测一.摘要时间序列就是按照时间的顺序记录的一列有序数据。

对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势。

时间序列分析在日常生活中随处可见,有着非常广泛的应用领域。

邮政与我们息息相关,他已经成为社会经济生活不可或缺的通信手段。

在世界上,函各国都以件量来衡量一个国家的邮政发展水平,而我国的函件量增长却不容乐观,这勾起了我研究的兴趣,加上我本人又有集邮的爱好,因此我选用了函件量进行分析研究。

本文用时间序列分析方法,对一段时间序列进行了拟合。

通过对1980至2013年全国邮电业务函件量序列进行观察分析,建立合适的ARIMA 模型,对未来五个月的全国邮电业务函件量序列进行预测。

然后对预测值和真实值进行比较,得出结论,所建立的模型有较好的拟合效果,从而提供了一个行情预测的有效方法。

关键词:时间序列 函件量 ARIMA 时间序列分析 预测二.前言邮政的最初发展史从人们的信函寄送需要开始的,现在邮政的众多业务也是借助经营函件业务而衍生出来的。

目前,函件业务的主要包括为用户传递书面通信、文件资料和书籍等。

他已经成为社会经济和生活不可缺少的通信手段。

如果的函件业务搞不好,邮政其他业务也就失去了赖以生存的基础,这将严重削弱邮政在社会中的地位和作用。

当前,世界各国都以函件量来衡量一个国家邮政发展水平,然而几十年随着经济建设的飞速发展,邮电业务的需求量迅猛增长,唯有函件业务增长不容乐观,与发达国家和甚至一些发展中国家相比还有很大差距。

原因何在?因此,本文就以以我国1980-2013年全国邮电业务函件量的数据为研究对象,做时间序列分析。

首先,对全国33年来全国邮电业务函件量的发展变化规律,运用SAS 软件进行分析其发展趋势。

再则,通过检验说明模型拟合效果的好坏,再利用模型对下一年进行预测。

最后,从国家经济、政策和社会发展等方面对全国邮电业务函件量变化规律及未来走势进行分析。

ARIMA 模型建模思路(一)模型介绍:ARIMA 模型( p, d, q) 又称为自回归移动平均模型。

其中AR 指自回归; p 为模型的自回归阶数; MA 为移动平均; q 为模型的移动平均阶数; I 指积分; d 为时间序列成为平稳之前必须取差分的次数。

其一般的表达式为:qt q t t p t y p t y t y t y -++-+-++-++-+-+=μβμβμβμβαααα 22110022110(二) 建模思路:ARIMA 建模思路是: 假设所研究的时间序列是由某个随机过程产生的, 用实际统计序列建立、估计该随机过程的自回归移动平均模型, 并用此模型求出预测值。

(三) 建模步骤:1. 观察时间序列。

根据时间序的散点图自相关函数( ACF) 图和偏自相关函( PACF) 图以及ADF 单位根检验观察其方差、趋势及其季节性变化规律, 识别该序列的平稳性。

2. 对序列进行平稳化处理。

如果数据序列是非平稳的, 并存在一定的增长或下降趋势, 则需对数据进行差分处理; 如果数据序列存在异方差性, 则需对数据进行对数转换或者开方处理, 直到处理后数据的自相关函数值和偏相关函数值无显著地异于零。

3. 模型识别。

若平稳时间序列的偏相关函数是截尾的, 而自相关函数是拖尾的, 则可断定此序列适合AR 模型; 若平稳时间序列的偏相关函数是拖尾的, 而自相关函数是截尾的, 则可断定此序列适合MA 模型; 若平稳时间序列的偏相关函数和自相关函数均是拖尾的, 则此序列适合ARMA 模型。

4. 对ARIMA( p, d, q) 模型定阶, 估计参数。

5. 模型检验。

进行假设检验, 诊断白噪声检验假设模型残差的ACF 值和PACF 值在早期或季节性延迟点处不得大于置信区间, 同时残差应理想化为0 均值。

可观察残差的ACF图、PACF 图, 并辅以D—w 值、t 值等检验法。

6. 预测分析。

时间序列分析包括以下步骤: 分析时间序列的随机特性; 用实际统计序列构造预测模型; 根据所得模型做出最佳的预测值。

ARIMA模型建模流程图(四)ARIMA(p,d,q)模型:在ARIMA模型的识别过程中,我们主要用到两个工具:自相关函数(ACF),偏自相关函数(PACF)以及它们各自的相关图。

对于一个序列{Xt}来说,它的第i 阶自相关系数定义为它的i阶自协方差除以它的方差,它是关于i的函数,因此我们也称之为自相关函数,通常记ACF(i)。

偏自相关函数PACF(i)度量了消除中间滞后项影响后两滞后变量之间的相关关系。

自相关系数和偏自相关系数这两个统计量来识别ARIMA(p,d,q)模型的系数特点和模型的阶数。

并用游程检验三.数据预处理及具体模型(建模)1.数据录入:1980-2013年全国邮电业务函件量2绘制时序图程序如下:data a;input a@@;time=1980+_n_-1;cards;33.13 33.88 33.94 35.21 39.48 46.78 49.59 54.79 59.77 57.28 54.87 52.11 57.18 68.70 76.50 79.55 78.68 68.55 65.51 60.52 77.71 86.93 106.01 103.84 82.81 73.51 71.31 69.50 73.63 75.32 74.01 73.78 70.74 63.41;Proc gplot;plot a*time;symbol1v=star i=join c=black;run;原时序图由时序图可以看出,序列具有有递增长期趋势,为非平稳时间序列。

因此,先进性一阶差分,程序如下:data a;input a@@;difa=dif(a);time=1980+_n_-1;cards;33.13 33.88 33.94 35.21 39.48 46.78 49.59 54.79 59.77 57.28 54.87 52.11 57.18 68.70 76.50 79.55 78.68 68.55 65.51 60.52 77.71 86.93 106.01 103.84 82.81 73.51 71.31 69.50 73.63 75.32 74.01 73.78 70.74 63.41;procgplot;plot a*time difa*time;symbol1v=star i=join c=black;run;一阶差分时序图直观检验,一阶仍不具有明显的平稳性,因此再进行二阶差分检验。

二阶差分程序如下:data a;input a@@;difa=dif(dif(a));time=1980+_n_-1;cards;33.13 33.88 33.94 35.21 39.48 46.78 49.59 54.79 59.77 57.28 54.87 52.11 57.18 68.70 76.50 79.55 78.68 68.55 65.51 60.52 77.71 86.93 106.01 103.84 82.81 73.51 71.31 69.50 73.63 75.32 74.01 73.78 70.74 63.41;procgplot;plot a*time difa*time;symbol1v=star i=join c=black;run;二阶差分时序图经过直观检验,二阶差分时序图明显具有平稳性,因此可以进行纯随机性检验。

3纯随机性检验程序如下:proc arima;identify var=a(1,1);run;由二阶差分时序图和白噪声检验,可以直观看出,可知P值<0.05,该时序图平稳,未通过白噪声检验,故对差分序列进行拟合ARMA模型。

4定阶:4.1根据相对最优定阶:程序如下:proc arima;identify var=a(1,1) nalg=8minic p=(0:5) q=(0:5);run;分析结果如下根据最优模型定阶,BIC最小原则。

程序如下:proc arima;identify var=a(1,1) nalg=8minic p=(0:5) q=(0:5);run;estimate p=3 ;run;p=3,时,分析结果如下:本例有参数不显著,残差的自相关检验通过检验,因此拟合仍然失败。

所以排除用此模型的可能。

4.2根据自相关图和偏自相关图定阶:由差分后的自相关图和偏自相关图可知偏自相关图具有二阶截尾性,自相关图有一阶截尾性所以可以尝试MA(1),AR(2)进行拟合。

4.3拟合MA(1)进行拟合程序如下:proc arima;identify var=a(1,1);estimate q=1;run;本例所有参数常数项不显著,残差的自相关检验都未通过检验,因此,拟合仍然失败。

所以排除用此模型的可能。

4.4拟合AR(2)进行拟合程序如下:proc arima;identify var=a(1,1);run;estimate p=2;run;有图可以看出残差自相相关显著,但参数检验常数项不显著,所以尝试选择NOINT选项,除去常数项,程序如下:proc arima;identify var=a(1,1);run;estimate p=2noint;run;由参数的显著性检验可知,参数的T统计量的P<0.0001,而且序列自相关系数白噪声检验的延迟各阶的LB统计量的P>0.05,所以拟合模型显著成立。

拟合模型的具体形式如下:该输出形式的等价于:xt=(1-1.12892B+0.74178B2)εt或记为:总结:我们通过最优定阶和自相关图分别选取了ARMA(3,2,0)和ARMA(2,2,0)及ARMA(0,2,1)由上面的分析结果可以知道,只有模型ARIMA(2,2,0)拟合效果显著,拟合效果较好。

所以我用它对邮政函件数进行预测和分析。

5.拟合预测图:程序如下:data a;input a@@;time=1980+_n_-1;cards;33.13 33.88 33.94 35.21 39.48 46.78 49.59 54.79 59.77 57.28 54.87 52.11 57.18 68.70 76.50 79.55 78.68 68.55 65.51 60.52 77.71 86.93 106.01 103.84 82.81 73.51 71.31 69.50 73.63 75.32 74.01 73.78 70.74 63.41;proc gplot;plot a*time=1;symbol v=star i=join c=black;run;proc forecast data=a method=stepar tread=3 lead=5 out=out outfull outest=est;id time;var a;run;proc gplot data=out;plot a*time=_type_/href=2013;symbol1i=none v=star c=black;symbol2i=join v=none c=red;symbol3i=join v=none c=black l=2;symbol4i=join v=none c=black l=2;run;proc gplot data=results;plot a*time=1 forecast*time=3/overlay;symbol1v=star c=black i=none;symbol3v=none c=red i=join;run;6.序列预测程序如下forecast lead=5id=time;proc gplot data=results;plot x*time=1 forecast*time=2 l95*time=3 u95*time=3/overlay; symbol1c=black i=none v=star;symbol2c=red i=join v=none;symbol3c=green i=join v=none;run;5期预测表如下上表是5年预期函件量总体成递增趋势。

相关主题