基于ARIMA模型的我国全社会固定资产投资预测摘要:本文采用ARIMA模型,用Eviews6.0软件对我国1980—2012年的全社会固定资产投资额进行了深入分析,并预测了2013年我国全社会固定资产投资额。
结果表明,ARIMA(4,1,3)模型能够提供较准确的预测效果,可以用于未来的预测,并为我国固定资产投资提供可靠的依据。
关键词:ARIMA模型固定资产投资额时间序列预测一、引言改革开放以来,我国的经济发展取得了举世瞩目的成就。
投资是拉动经济增长的三驾马车之一,因此研究我国全社会固定资产投资对研究我国经济增长有着重要的现实意义。
我国的全社会固定资产投资总额持续增加:1980年仅为910.9亿元,1993年首次突破10000亿元达到13072.3亿元;到2006年则猛增至109998.2亿元。
尤其是进入21世纪以来,随着中国加入WTO,外商投资大量增加,推动了经济政策的调整与完善,也给经济与投资增长增添了活力。
此前,已经有学者做过相关研究。
2010年李惠在《ARIMA模型在我国全社会固定资产投资预测中的应用》中,通过1980-2007年我国全社会固定资产投资的相关数据,运用统计学和计量经济学原理,从时间序列的定义出发,运用ARIMA建模方法,将ARIMA模型应用于我国历年全社会固定资产投资数据的分析与预测,检验得出ARIMA(4,2,4)模型为最佳,建议政府抓住投资机遇,合理安排投资比例和投资金额,促进经济的健康发展。
2007年靳宝琳和赫英迪在《ARIMA模型在太原市全社会固定资产投资预测中的应用》一文中采用Eviews软件系统中的时间序列建模方法对太原市的固定资产投资总额资料进行了分析,建立了ARIMA模型。
结果显示ARIMA(2,1,3)模型提供了较准确的预测效果,可用于未来的预测,为太原市全社套固定资产投资的预测提供了一种方便实用的方法。
王新华在《ARIMA模型在武汉市全社会固定投姿预测中的应用》中,采用ARIMA模型,对武汉市1950—2003年的全社会固定资产投资额进行了深入分析。
结果表明,ARIMA(8,1,9)模型提供较准确的预测效果,可以用于未来的预测,并为武汉市固定资产投资提供可靠的依据。
对全社会固定资产投资有影响的因素很多,而这些因素彼此之间的关系很复杂。
因此运用数理经济模型(即揭示经济活动中各个因素间的理论关系用确定性数学方程加以表述的方法来分析和预测是较为困难的)。
所以,本文把我国全社会固定资产投资总额看成是一个时间序列,利用历史数据分析并得到其规律性,从而预测其未来值。
二、模型的建立及预测过程1、模型的建立ARIMA 模型全称为差分自回归移动平均模型,简记ARIMA ,是由博克思和詹金斯于70年代初提出的一著名时间序列预测方法,所以又称为box-jenkins 模型、博克思-詹金斯法。
其中ARIMA (p ,d ,q )称为差分自回归移动平均模型,AR 是自回归,p 为自回归项; MA 为移动平均,q 为移动平均项数,d 为时间序列成为平稳时所做的差分次数。
所谓ARIMA 模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。
ARIMA 模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA )、自回归过程(AR )、自回归移动平均过程(ARMA )以及ARIMA 过程。
①自回归模型AR(p) 如果时间序列{t y }满足:t p t p t t y y y εφφ+++=-- (11)其中:t ε是独立同分布的随机变量序列,并且对于任意的t ,E(t ε)=0,Var(t ε)=2εσ>0,则称时间序列{t y }服从p 阶自回归模型,记为AR (p )。
②移动平均模型MA(q) 如果时间序列{t y }满足:q t q t t t y -----=εθεθε (11)则称时间序列{t y }服从q 阶移动平均模型,记为MA (q )。
q θθθ,,,21 是 q 阶移动平均模型的系数。
③ ARMA(p,q)模型 如果时间序列{t y }满足:t p t p t t y y y εφφ+++=--...11q t q t -----εθεθ (11)此模型是模型AR(p)与MA(q)的组合形式,记作ARMA(p,q)。
当 p=0 时,ARMA(0, q) = MA(q);当q = 0时,ARMA(p, 0) = AR(p)。
④ ARIMA (p,d,q )模型对于非平稳序列,经过几次差分后,如果能得到平稳的时间序列,就称这样的序列为单整序列。
设t y 是 d 阶单整序列,记作:t y ~ I(d)。
如果时间序列{}t y 经过d 次差分后是一个ARIMA(p,q)过程,则称原时间序列是一个p 阶自回归、d 阶单整、q 阶移动平均过程,记作ARIMA (p,d,q ),d 代表差分的次数。
2.ARIMA 模型预测的基本程序(1)根据时间序列的散点图、自相关图和偏自相关图,以及ADF 单位根检验观察其方差、趋势及其季节性变化规律,识别该序列的平稳性。
(2)数据进行平稳化处理。
如果数据序列是非平稳的,则需对数据进行差分处理。
对数据进行对数转换可以减低数据的异方差性。
(3)根据时间序列模型的识别规律,建立相应的模型:①若平稳时间序列的偏相关函数是截尾的,而自相关函数是拖尾的,则可断定此序列适合AR模型;②若平稳时间序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定此序列适合MA模型;③若平稳时间序列的偏相关函数和自相关函数均是拖尾的,则此序列适合ARMA模型。
(4)进行参数估计。
(5)进行假设检验,诊断模型的残差是否为白噪声,并检验模型的估计效果。
(6)进行预测。
三、ARIMA模型在我国全社会固定资产投资预测中的应用从《中国统计年鉴》上搜集计算整理出1980-2012年的年末全社会固定资产投资总额资料(见表1)表1 1980-2012年的年末全社会固定资产投资单位(亿元)年份固定资产投资总额(X)年份固定资产投资总额(X)年份固定资产投资总额(X)1980 910.9 1991 5594.5 2002 43499.91981 961.0 1992 8080.1 2003 55566.61982 1230.4 1993 13072.3 2004 70477.41983 1430.1 1994 17042.1 2005 88773.611984 1832.9 1995 20019.3 2006 109998.21985 2543.2 1996 22913.5 2007 137323.91986 3120.6 1997 24941.1 2008 172828.41987 3791.7 1998 28406.2 2009 224598.81988 4753.8 1999 29854.7 2010 251683.81989 4410.4 2000 32917.7 2011 311485.11990 4517.0 2001 37213.5 2012 364835. 01.平稳性检验时间序列数据建模,需要具备的前提条件是其序列平稳。
因此,首先需要对数据进行平稳性检验。
绘制时序图,可以看到序列有明显上升趋势,因此,全社会固定资产投资额具有很强的非平稳性(见图1)。
需要进行平稳化处理。
1图2首先对原始数据取自然对数,令t t X Y ln ,所得结果见表2,绘制时序图,可以看到序列仍然有明显上升趋势,因此,全社会固定资产投资额取对数后仍具有很强的非平稳性(见图2)。
图3是对t Y 进行单位根检验的结果,结果显示序列不平稳,需要进一步进行平稳化处理。
表2年份 t Y年份 t Y年份 t Y1980 6.814 1991 8.630 2002 10.681 1981 6.868 1992 8.997 2003 10.925 1982 7.115 1993 9.478 2004 11.163 1983 7.265 1994 9.743 2005 11.394 1984 7.514 1995 9.904 2006 11.608 1985 7.841 1996 10.039 2007 11.830 1986 8.046 1997 10.124 2008 12.060 1987 8.241 1998 10.254 2009 12.322 1988 8.467 1999 10.304 2010 12.436 1989 8.392 2000 10.402 2011 12.649 19908.416200110.524201212.807图3对t Y进行一阶差分处理,令1--=ttt YYZ,绘制时序图,可以看到序列仍然没有明显上升趋势,因此,全社会固定资产投资额差分后基本上平稳(见图4)。
图5是对t Z进行单位根检验的结果,结果显示序列基本上平稳。
图4图52.模型定阶及参数估计需要对模型的p值和q值进行筛选。
用Eviews软件作出直到滞后16期的ACF图和PACF图。
从图6中根据拖尾和截尾的情况来看,考虑p=3,4,q=3,4,5,再通过AIC值进行筛选,图7为各个组合的AIC值,可以看到当p=4,q=3的时候,AIC的值最小,根据AIC值最小化原-.1.0.1.2.3.4.51980198519901995200020052010Z则进行择优,可以认为ARIMA(4,1,3)模型较好。
图6图7 AIC值、用Eviews软件估计参数得到图8结果,从图中可以看到MA的二阶滞后项的系数检验非常不显著。
因此,剔除这一项,得到修正后的ARIMA(4,1,3),图9为修正后的参数估计。
根据修正结果,得到模型的表达式为:3143215520.33663.07443.03418.02742.04524.01828.0-----------++=tttttttt ZZZZZεεε图8qp 3 4 53 -2.5965 -2.59844 -4.205 -2.2651 -2.5936v .. . ..图93.模型的检验模型检验也就是对模型残差项是否为白噪声过程的检验,如果模型通过检验,则可以进行预测。
否则重新建模,通过对ARIMA(4,1,3)的残差的ACF图和PACF图的观察(图10),残差的自相关函数的AC值和偏自相关函数的PAC值全部落在置信区间内。
因此残差服从白噪声分布,所以说模型ARIMA参数选择是正确了,拟合的效果能符合要求。
图104.模型的预测根据时间序列{t Z }的ARIMA (4,1,3)模型:3143215520.33663.07443.03418.02742.04524.01828.0-----------++=t t t t t t t t Z Z Z Z Z εεε我们可以推出时间序列{t Y }的ARIMA (4,1,3)的预测公式为:+=-1t t Y Y 143213663.07443.03418.02742.04524.01828.0---------++t t t t t t Z Z Z Z εε35520.3--t ε进而推出时间序列{t X }的ARIMA (4,1,3)的预测公式为:35520.313663.047443.033418.022742.014524.01828.0--------+---+=t t t Zt Zt Zt Zt t e X εεε因此,根据公式,对2013年的全社会固定资产投资的预测为:408276.1244亿元。