居民消费价格指数的时间序列分析摘要:时间序列分析是一种根据动态数据揭示系统动态结构和规律的统计方法。
本文以我国2007年1月至2011年4月居民消费价格指数为研究对象,基于居民消费价格指数存在明显的非平稳性和季节性特征,运用自回归移动平均季节模型进行建模分析,并利用SPSS建立了居民消费价格指数时间序列的相关关系模型,并对其进行预测,取得较好的效果。
关键词:居民消费价格指数 SPSS软件时间序列分析预测一、引言(一)问题的基本情况及背景居民消费价格指数的调查范围和内容是居民用于日常生活消费品的全部商品和服务项目价格。
包括食品、烟酒及用品、衣着、家庭设备用品及维修服务、和个人用品、交通和通讯、娱乐教育文化用品及服务、居住等八大类商品及服务项目价格。
既包括居民从商店、工厂、集市所购买的价格,也包括从购买的价格。
该指数以实际调查的综合平均单价和根据住户调查有关资料确定的权数,按加权算术平均公式计算。
全国居民消费价格指数是反映居民家庭购买生活消费品和支出服务项目费用价格变动趋势和程度的相对数。
其目的在于观察居民生活消费品及服务项目价格的变动对城乡居民生活的影响,为各级党政领导掌握居民消费状况,研究和制定居民消费价格政策、工资政策以及为新国民经济核算体系中有消除价格变动因素的不变价格核算提供科学依据。
居民消费价格指数还是反映通货膨胀的重要指标。
当居民消费价格指数上升时,表明通货膨胀率上升,消费者的生活成本提高,货币的购买能力减弱;相反,当居民消费价格指数下降时,表明通货膨胀率下降,亦即消费者的生活成本降低,货币的购买能力增强。
居民消费价格指数的高低直接影响居民的生活水平,因此,准确的分析并及时的对居民消费价格指数做出合理的预测,对国家制定相应的经济政策,实行宏观调控,稳定物价,保证经济的增长平稳发展具有重要意义。
(二)问题的提出时间序列是指同一种现象在不同时间上的相继观察值排列而成的一组数字序列。
时间序列预测方法的基本思想是:预测一个现象的未来变化时,用该现象的过去行为来预测未来。
即通过时间序列的历史数据揭示现象随时间变化的规律,将这种规律延伸到未来,从而对该现象的未来做出预测。
对此希望建立相关居民消费价格指数的数学模型并预测居民消费价格指数的走势。
(三)问题分析居民消费价格指数是一个滞后性的数据,根据居民消费价格指数的这一特点,我们可以运用时间序列分析的方法对居民消费价格指数进行拟合,从而对未来的居民消费价格指数走势做出合理的预测。
二、模型的介绍及说明(一)时间序列模型的介绍时间序列是按时间顺序取得的一系列数据,时间序列分析方法有很多,本文主要讨论ARMA模型即自回归移动平均模型的方法。
ARMA模型是一类常用的随机时序模型,由博克斯(Box)、詹金斯(Jenkins)创立,简称B—J方法。
在B—J方法中,只有平稳的时间序列才能直接建立ARMA模型,这就要求时间序列满足假设条件:(1)对任意时间t,其均值恒为常数;(2)对任意时间t和s,其自相关系数只与时间间隔t-s有关,而与t和s 的起始点无关。
这样时间序列的统计特征不随时间推移而变化,称为平稳时间序列。
时间序列建模基本步骤是:(1)用观测、调查、统计、抽样等方法取得被观测系统时间序列动态数据。
(2)根据动态数据作相关图,进行相关分析,求自相关函数。
相关图能显示出变化的趋势和周期。
(3)辨识合适的随机模型,进行曲线拟合,即用通用随机模型去拟合时间序列的观测数据。
对于短的或简单的时间序列,可用趋势模型和季节模型加上误差来进行拟合。
对于平稳时间序列,可用通用ARIMA模型(自回归滑动平均模型)及其特殊情况的自回归模型、滑动平均模型或组合-ARIMA模型等来进行拟合。
当观测值多于50个时一般都采用ARIMA模型。
对于非平稳时间序列则要先将观测到的时间序列进行差分运算,化为平稳时间序列,再用适当模型去拟合这个差分序列。
通常情况下,自回归移动平均模型的建模过程分为以下几个步骤:(1)对原序列进行平稳性检验,若非平稳序列则通过差分消除趋势;(2)判断序列是否具有季节性,若有季节波动,则通过季节差分消除季节性;(3)进行模型识别;(4)进行模型定阶;(5)对模型的参数进行估计;(6)对模型的适合性进行检验,即对残差序列进行白噪声检验。
P阶自回归序列记作AR(p),形如X t=φ1X t−1+⋯+φp X t−p,φ称为自回归系数,是模型的待估参数。
q阶移动平均序列记作MA(q),形如X t=a t−θ1a t−1−⋯−θq a t−q,θ为移动平均系数,是模型的待估参数。
建立平稳时间序列的ARMA(p,q)模型,其具体形式如下:X t−φ1X t−1−⋯−φp X t−p=a t−θ1a t−1−⋯−θq a t−q其中:φ与θ为模型的待估参数。
求和自回归移动平均模型(autoregressive integrated moving average model )简称ARIMA (p,d,q )模型,其中AR (p )为自回归模型,MA (q )为滑动平均模型,p 、q 为各自对应阶数,I 表示两种模型结合,d 为对含有长期趋势、季节变动、循环变动的非平稳时间序列进行差分处理的次数。
ARIMA 模型的通式如下:()()()()()d 20,,0,0,t t t t t s s t B x B E Var E s t Ex s t εεεεσεεε⎧Φ∇=Θ⎪===≠⎨⎪=∀<⎩式中,()d 1d B ∇=-,()11p p B B B φφΦ=---,为平稳可逆ARMA (p,q )模型的自回归系数多项式;()11q q B B B θθΘ=---,为移动平滑系数多项式,{εt }为零均值白噪声序列[10]。
ARIMA 模型的实质就是差分运算与ARMA 模型的组合,任何非平稳序列只要通过适当阶数差分实现差分后平稳,就可以对差分后序列进行ARMA 模型拟合。
(二)模型的说明时间序列分析主要用于:①系统描述。
根据对系统进行观测得到的时间序列数据,用曲线拟合方法对系统进行客观的描述。
②系统分析。
当观测值取自两个以上变量时,可用一个时间序列中的变化去说明另一个时间序列中的变化,从而深入了解给定时间序列产生的机理。
③预测未来。
一般用ARMA 模型拟合时间序列,预测该时间序列未来值。
④决策和控制。
根据时间序列模型可调整输入变量使系统发展过程保持在目标值上,即预测到过程要偏离目标时便可进行必要的控制。
拟合好的模型对短期预测有比较好的预测效果,但随着时间的延长,它呈现出较差的预测效果。
三、我国居民消费价格指数的时间序列模型拟合(一)数据的选取及说明本文选取的数据主要来源于国家统计局网站,数据已经进行中心化处理,并在原数据基础上减100以简化计算。
(二)时间序列模型1.数据的录入我国2007年1月至2011年4月居民消费价格指数月度数据表1 我国居民消费价格指数月度数据2.时间序列数据图及平稳性检验图1 居民消费价格指数序列图用SPSS软件做出数据序列图(图1)并对序列的平稳性进行游程检验。
在表2中,概率的P值为0.000,如果显著性水平为0.05,由于概率P值小于显著性水平,因此拒绝零假设,即认为序列非随机。
其检验的SPSS输出结果如下:表2 时间序列数据是否平稳的游程检验结果Runs Test居民物价指数Test Value a-.02Cases < Test Value 26Cases >= Test Value 26Total Cases 52Number of Runs 4Z -6.443Asymp. Sig. (2-tailed) .0003.时间序列的预处理为消除序列的趋势同时减少序列的波动,可以对原有时间序列做二阶逐期差分,并绘制差分后的时序图(见图2)。
可以看出经过差分处理后的序列趋势基本上消除。
为了更好地描述月度数据时间序列并进行模拟,需对该序列再进行季节差分,进一步消除季节性(见图3)。
图2 居民消费价格指数二阶差分后时序图图3 居民消费价格指数一阶差分和一阶季节差分后时序图在表3中,概率的P值为1.000,如果显著性水平为0.05,由于概率P值大于显著性水平,因此接受零假设,即认为序列随机。
表3 一阶差分和一阶季节差分后数据自相关与偏自相关函数的数据统计Runs TestDIFF(居民物价指数,1) SDIFF(居民物价指数_1,1,12)Test Value a.20 .00Cases < Test Value 25 19Cases >= Test Value 26 20Total Cases 51 39Number of Runs 26 20Z -.139 .000Asymp. Sig. (2-tailed) .890 1.000a. Median4.模型的建立经过一阶差分和一阶季节差分后数据已经平稳化,下面对平稳后的数据进行平稳时间序列的ARMA(p,q)模型的拟合。
(1)模型的识别画自相关系数(图4)和偏自相关系数(图5)图图4 居民物价指数自相关系数图图5 居民物价指数偏自相关系数由图4和图5可以看出k ρ∧序列与kk ϕ∧序列皆不截尾,但都被负指数函数控制收敛到零,此时时间序列有可能为ARMA 序列。
(2)模型定阶及模型的参数估计通过SPSS 软件中的结果对季节差分改进后的时间序列模型ARIMA(p ,d ,q)(P ,D ,Q)12进行拟合效果的比较,从而最终确定模型的阶数(见表4)。
表4 各模型参数估计及检验结果0.327 0.715 0.776 0.8610.8780.370.163 -0.585 0.08 - - -0.23 - - - - --0.503 -0.494 -0.503 -0.496 -0.515 -0.540.117 0.624 0.56 0.669 0.62 -0.052 -0.997 - -0.092 - -0.959 0.956 0.958 0.958 0.958 0.954BIC -0.458 -0.498 -0.633 -0.634 -0.729 -0.745 RMSE 0.631 0.643 0.625 0.624 0.619 0.638 MAPE 71.88 88.922 76.282 75.702 76.64 80.298根据表4中调整后的样本决定系数 ,以及BIC准则,考察模型的整体拟合效果,力求简洁、有效。
表6 时间序列模型的参数估计ARIMA Model ParametersEstimate SE t Sig.居民物价指数-模型_1 居民物价指数NoTransformationAR Lag1.370 .137 2.699 .010Difference 1AR,SeasonalLag1-.540 .122 -4.439 .000模型ARMA(1,0)的BIC值较小,且系数均通过检验(见图6),所以最终确定改进后的ARIMA(1,1,0)(1,0,0)12模型为时间序列X t的最佳预测模型:(1−0.37B)(1+0.54B12)(1−B)X t=a t(3)模型的诊断和检验对模型进行适应性检验,SPSS输出的模型适应性检验的Ljung-Box结果如下(见表7):表7 时间序列模型的检验P值表明ARIMA(1,1,0)(1,0,0)12模型是合适的。