针对1998-2012年中国汽车月度产量的确定性分析
·声明:所有数据均来源于国家统计数据库:http://219.235.129.58/welcome.do 摘要:本次时间序列实验旨在针对1998-2012年15年间的中国汽车月度产量进行确定性分析,并采用乘法模型X=T·S·I。
先剔除周期,后计算季节指数,再对原数据剔除季节因素,以进行长期趋势拟合同时进行分析与预测。
一.数据描述性统计及其预处理
1.1数据预处理
根据表1.1我们初步可以看出存在多处缺失点,对于缺失点我们采用SAS 中expand过程采用插值法将其补全,得到缺失部分的数据分别为如下:
表1-2 缺失值处理
打开Eviews建立工作文件后,在命令栏建立输入:series ww,打开工作文件中ww,右键序列表格,单击Edit模式,将原数据复制入内保存即可。
再将缺失处理后的完整数据绘制成时序图,View/Graph/选择line&symbol 点击确定即可,以下时序图为SAS proc Gplot命令下绘制:
图1-1 时序图
从图可以看出,该数据具有明显的上涨趋势,且以一年为周期体现出季节性。
1.2 描述性统计
通过View/Descriptive Statistics/Histogram&Stat得出直方图与描述性统计信息如下:
图1-2 描述性统计
从图中可以看出,序列共180个,序列均值为为70.16822,中位数为52.87118,最大值为207.1925.最小值为10.1,标准差为55.57278,峰度系数与偏度系数分别为0.891068,另外做QQ图如下:
图1-3 QQ图
结合相伴概率小于0.05与QQ图,我们有足够理由否定原假设(原假设
为序列服从正态分布)。
1.3相关性分析
对ww序列作相关与偏相关分析,首先需要绘制自相关系数与偏相关系
数图。
如下:
图1-4
Date: 06/08/13 Time: 17:06
Sample: 1998M01 2012M12
Included observations: 180
很明显可以得到序列自相关系数非平稳且慢慢衰减,不截尾也不拖尾。
偏相关系数也不截尾不拖尾,序列初认为非平稳的,且非白噪声。
再尝试单位根检验,因为序列均值非0有截距项,且具有长期趋势,因此选用带截距与趋势项的ADF检验,检验准则用SIC准则,结果如下图:
表1-1 单位根检验
Null Hypothesis: WW has a unit root
Exogenous: Constant, Linear Trend
Lag Length: 12 (Automatic based on SIC, MAXLAG=13)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -1.327846 0.8775
Test critical values: 1% level -4.013946
5% level -3.436957
10% level -3.142642
*MacKinnon (1996) one-sided p-values.
根据表中ADF检验t值均大于各个水平值,相伴概率为0.8775,可知我们没有足够理由拒绝原假设,原假设为存在单位根,因此序列为非平稳的。
二.确定性分析模型的建立
2.1确定模型
根据时序图,我们看出数据具有长期递增趋势,以及可以看出以年为周
期的季节性波动同时作用于序列Xt,而且季节与随机因素波动变化率表现为
大于1,在此我们尝试用乘法模型拟合序列Xt;
即Xt=Tt×St×It
2.2分离长期因素
1.首先通过Excel进行12阶中心移动平均处理数据以凸显出长期趋势,(12阶中心移动平均做法为先做一次12阶向前移动平均后再做一次2阶向
前移动平均即可,注意12阶中心化后的第一个数据对应于7月份)得到图
形如下:
图2-1 12阶中心化移动平均结果
图2-2 剔除长期效果后季节与随机效应
另外对此做一次纯随机检验。
表2-1 纯随机检验
等其他因素。
2.3 计算季节指数并剔除 计算公式为:k
k x S x
, k x 为每一周期点的平均数,x 为全时期的平均数 表2-2 季节指数
图2-3 季节指数图
通过季节指数表可以看出,每年的3-4月份汽车产量较高,而其他月份较普通。
1.算出季节指数,从原数据剔除季节指数
得到季节指数,从原数据剔除(除法)季节效应后得到下图
图2-4 剔除季节效应后
从图可以看出季节因素明显减小,但后期的数据具有较大波动,势必会导致拟合上的缺陷。
2.对剔除季节效应的数据进行拟合
分别对原数据进行一次、二次、三次多项式进行拟合。
操作如下,以一次多项式拟合为例:生成一个时间趋势项
1.Series t=@trend+1
2.主窗口点击Object/New Object/Matrix-Vector-Coef(同时命名
为sh)
3.弹出后点Coefficient Vector,再确定维数此为一次多项式,固有
两个待估参数,所以为一行两列。
4.主窗口Quik/Estimate Equation/窗口内输入方程,在这里为:
ww1=sh(1)+sh(2)*t
t为待拟合序列
算出后一次拟合效果如下:
表2-3 线性拟合结果
Coefficient Std. Error t-Statistic Prob.
SH(1) -19.22769 3.137825 -6.127713 0.0000
SH(2) 0.989051 0.030068 32.89328 0.0000
R-squared 0.858727 Mean dependent var 70.28141
Adjusted R-squared 0.857933 S.D. dependent var 55.61297
S.E. of regression 20.96153 Akaike info criterion 8.934303
Sum squared resid 78210.64 Schwarz criterion 8.969781
Log likelihood -802.0873 Hannan-Quinn criter. 8.948688
F-statistic 1081.968 Durbin-Watson stat 0.187581
Prob(F-statistic) 0.000000
同理对二次与三次多项式进行拟合整合得出表格如下:
表2-4 多种拟合结果比较
次拟合效果最优,因此我们拟用二次函数拟合长期趋势。
下面对二次多项式的各个参数进行显著性t检验,检验后见下表:
表2-5 二次函数拟合参数检验
因此可以看出,剔除季节效应后长期趋势用:
2
=-+
()19.086190.274040.006978
x t t t
拟合效果最佳。
对于长期数据的拟合,效果如下图:
图2-5 长期趋势二次拟合图
2.4 剔除长期因素
对于剔除季节因素后的序列,另ww1为剔除季节因素后的序列,再用除法剔除长期因素公式为:
最后得出随机项数据如下图:
图2-6 模型随机项
再对此随机项进行相关性分析,此时的随机项已经没有明显趋势。
绘制出自相关系数与偏相关系数图如下:
从自相关系数可以看出,此序列仍具有一定的相关性,且纯随机性检验任不
属于白噪声,这说明此次确定性分析并没有将所有信息剔除干净,仍存在部分信息难以剔除。
2.5 模型的确立
由长期趋势由2
=-+进行拟合,对相应月
x t t t
()19.086190.274040.006978
度乘上季度指数,进行拟合,得到拟合效果如下:
由图我们可以看出,拟合效果基本符合。
三.预测未来一年的产量
根据长期趋势用2
=-+进行拟合,以及季度
x t t t
()19.086190.274040.006978
指数,我们对未来的一个周期数据进行预测,t从181取到192,再分别乘以各月的季度指数,得到预测数据如下:
拟合预测效果如下图:。