当前位置:文档之家› 基于ARIMA模型的全国公路客运量预测

基于ARIMA模型的全国公路客运量预测

基于ARIMA 模型的全国公路客运量预测
摘要:采用自回归移动平均模型(ARIMA ),对国家统计局提供的全国公路客运量数据进行分析,然后利用求解出的模型对未来的公路客运量进行预测,为我国未来公路客运量的估计提供参考作用。

关键词:ARIMA 客运量 时间序列分析
公路运输现在已经成为5种主要运输方式中完成运输量最多,实现营业收入最高的一种运输方式。

2004年全国累计完成公路客运量为162.89亿人,比上年增长11.2%的同时旅客周转量达到8719.15亿人公里,比上年增长13.5%。

公路运输量是区域经济发展的一个重要衡量指标,也是反映区域经济活力的指标之一,对其进行科学而准确的预测是很有必要的,是科学落实运输相关政策的前提。

同时,公路客运量是一个复杂的变量,受多种因素的影响,还存在着许多无法预知的内在影响关系,为了消除不客观因子对起客运量的影响,本文拟用时间序列ARIMA 模型的基本原理,对全国公路客运量进行预测。

一、 ARIMA 模型建模思路
ARIMA 模型( p, d, q) 又称为自回归移动平均模型。

其中AR 指自回归; p 为模型的自回归阶数; MA 为移动平均; q 为模型的移动平均阶数; I 指积分; d 为时间序列成为平稳之前必须取差分的次数。

其一般的表达式为:
q t q t t p t y p t y t y t y -++-+-++-++-+-+=μβμβμβμβαααα 22110022110
( 一) 建模思路
ARIMA 建模思路是: 假设所研究的时间序列是由某个随机过程产生的, 用实际统计序
列建立、估计该随机过程的自回归移动平均模型, 并用此模型求出预测值。

( 二) 建模步骤
1. 观察时间序列。

根据时间序的散点图自相关函数( ACF) 图和偏自相关函( PACF) 图以及ADF 单位根检验观察其方差、趋势及其季节性变化规律, 识别该序列的平稳性。

2. 对序列进行平稳化处理。

如果数据序列是非平稳的, 并存在一定的增长或下降趋势, 则需对数据进行差分处理; 如果数据序列存在异方差性, 则需对数据进行对数转换或者开方处理, 直到处理后数据的自相关函数值和偏相关函数值无显著地异于零。

3. 模型识别。

若平稳时间序列的偏相关函数是截尾的, 而自相关函数是拖尾的, 则可断定此序列适合AR 模型; 若平稳时间序列的偏相关函数是拖尾的, 而自相关函数是截尾的, 则可断定此序列适合MA 模型; 若平稳时间序列的偏相关函数和自相关函数均是拖尾的, 则此序列适合ARMA 模型。

4. 对ARIMA( p, d, q) 模型定阶, 估计参数。

5. 模型检验。

进行假设检验, 诊断白噪声检验假设模型残差的ACF 值和PACF 值在早期或季节性延迟点处不得大于置信区间, 同时残差应理想化为0 均值。

可观察残差的ACF 图、PACF 图, 并辅以D —w 值、t 值等检验法。

6. 预测分析。

时间序列分析包括以下步骤: 分析时间序列的随机特性; 用实际统计序列构造预测模型; 根据所得模型做出最佳的预测值。

二、数据说明
本文中采用的数据来源于国家统计局统计年鉴,全国公路客运量(1950~1998)。

三、ARIMA模型的应用
(一)分析时间序列
全国公路客运量(1950~1998)(单位:万人)
根据全国公路客运量序列,运用EVIEWS3.1软件,根据时间序列{yt} 的折线图、自相关函数(ACF) 图和偏自相关函数( PACF) 图, 以及ADF单位根, 观察其是否存在异方差, 其趋势以及识别该序列的平稳性。

在此,y表示客运量(万人)。

首先运用Eviews3. 1 软件对y做折线图如下:
图一
表1
从序列y的折线图可知该序列含有时间趋势,由ADF检验结果可以看出: t 统计值>ADF临界值,该序列没有通过平稳性检验。

(二)平稳化处理
从图一和表一可知该序列为非平稳序列,即序列{yt}存在异方差,因此需要对其进行平稳化处理,从而消除异方差。

经过多次尝试, 采用对序列{ yt} 取对自然对数即lny, 然后进行2 阶差分, 序列{ Zt} ( 对y 的2 阶差分) 达到平稳, 其序列折线图和ADF 检验结果分别如图2和表2 所示。

图2
表2
由图二和表二可知,序列{zt}已经趋于平稳了,即的D(Iny,2)为平稳序列,所以此模型中d=2.
( 三) 模型识别
模型识别即是选择用AR( p) 、MA( q) 还是用ARMA( p, q) 模型相对平稳的时间序列进行估计。

若平稳时间序列的偏相关函数是截尾的, 而自相关函数是拖尾的, 则可断定此序列适合AR 模型; 若平稳时间序列的偏相关函数是拖尾的, 而自相关函数是截尾的, 则可断定此序列适合MA 模型; 若平稳时间序列的偏相关函数和自相关函数均是拖尾的, 则此序列适合ARMA 模型。

从2 阶差分后的ACF和PACF图即图3 可以看出均是拖尾, 因此序列适合ARMA 模型分析。

( 四) 模型定阶与参数估计
根据对模型的平稳处理我们已经知道I( d) 的阶数为2, 即d =2, 现在主要对ARMA 模型进行定阶分析。

经过对图三的分析,进行反复筛选,最后确定p=1,q=1.即本文中选定ARMA (1,1)模型。

利用EVIEWS软件计算输出模型参数见表3。

图3
表3
( 五) 模型检验
模型检验也就是对模型残差项是否为白噪声过程的检验。

如果模型通过检验, 则可以进行预测, 否则回到建模第三步———对选用模型类型进行重新识别。

根据对时间序列的模型进行回归模拟, 并且得到拟合值和残差图( 图4) 。

对其残差进行检验, 得到残差的自相关图和偏自相关图( 图5) 以及扩充的ADF 单位根检验结果( 表5)
图4
图5
表5
通过图4 可以看出, 时间序列的实际值和拟合值总体上是比较接近的, 残差值比较小, 且通过对其PACF 图( 图5) 和残差的ADF 检验( 表5) 观察发现, 残差的自相关和偏自相关图都在置信区间内, 残差通过ADF 检验, 因此残差通过白噪声检验, 从而模型ARMA( 1, 1) 效果较好。

综上得出该序列用ARIMA (1,2,1)模型预测较好。

五、预测分析
根据前面分析可以知道时间序列{ Zt} 的ARIMA( 1,2,1) 模型预测表达式:
1
9899.013472.00033.0---+-=t t Z t Z μ 19899.0)3,(ln 3472.00033.0)2,(ln --+=t y D y D μ
Eg 1998
ln 3472.00033.01999ln y D y D +-= 1998
ln 3472.00033.01998ln 1999ln y D y y +-=- 0033.01998
ln 3472.01998ln 1999ln -+=y D y y )0033.01998ln 3472.01998(ln 1999-+=y D y e y
所以,原序列{yt}的ARIMA(1,2,1)预测模型为
t
v t y D t y
e t y +--+-=)0033.01ln 3472.01(ln 运用Eviews 软件对序列{}t y ln 作出1992-1999年的预测值与实际值的比较, 见表6。

表6 Iny 的预测值与实际值比较表
从表6 可以看出, 预测值和实际值的差异较小, 说明此建立的客运量预测ARIMA( 1, 2, 1) 模型预测效果较好, 可用于预测全国公路客运量。

但是我们也注意到, ARIMA 模型的预
测有其内在缺陷和不足, 即: 在短期内是较为有效的, 但是随着时间推移, 预测误差逐渐加大, 虽然如此, 其预测结果还是可以作为全国公路客运量发展的参考。

参考文献:
张晓峒. Eviews 使用指南与案例 . 北京: 机械工业出版社,2007.
张晓峒.计量经济学基础第三版. 南开大学出版社2007.
王代瑜. 基于ARIMA 模型的重庆货运量预测 2009.03.
国家统计局.1998年统计年鉴.。

相关主题