对镇江市近几年降雨量数据进行时间序列分析及预测
一、引言
最早的时间序列分析可以追溯到7000年前的古埃及。当时,为了发展农业生产,古埃及人一直在密切关注尼罗河泛滥的规律。把尼罗河涨落的情况逐天记录下来,就构成了所谓的时间序列。对这个时间序列长期的观察使他们发现尼罗河的涨落非常有规律。天狼星第一次和太阳同时升起的那一天之后,再过200天左右,尼罗河就开始泛滥,泛滥期将持续七八十天,洪水过后,土地肥沃,随意播种就会有丰厚的收成。由于掌握了尼罗河泛滥的规律,古埃及的农业迅速发展,解放出大批的劳动力去从事非农业生产,从而创建了古埃及灿烂的史前文明。
像古埃及人一样,按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列分析。由此可见,时间序列分析在我们生活中将扮演着一个十分重要的角色。
于是,我们先进行时间序列的定义。在统计研究中,常用按时间顺序排列的一组随机变量
……,X1,X2,……,Xt,……
来表示一个随机事件的时间序列,简记为{Xt,t∈T}或{Xt}
用x1,x2,……,xn或{xt,t=1,2,…,n}
表示该随机序列的n个有序观察值,称之为序列长度为n的观察值序列。
二、文献综述及数据来源
为充分了解时间序列在生活中的应用,本例就取镇江市近几年的降雨量数据进行时间序列分析,并在进行模型建设及检验完毕后,对2010年的月降雨量进行预测,并进行真实值的校对,以确认时间序列在生活中的有效应用。本例数据来源于江苏省统计年鉴2000—2009年,其中参考文献为中国人民大学出版社出版的《应用时间序列分析》。
关键字:时间序列 模型建设 检验 预测
三、数据展示及描述性分析
数据来源于江苏省统计年鉴2000—2009,选取的是镇江市从2000年到2009年的月降雨量。
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009
75.2 130.3 31.1 43.3 67.5 33.3 134.1 10.2 102.4 37.3
37.9 64.2 32 70 24.1 77.9 68.5 39.5 18.8 115.7
31.3 11.2 135.7 115 49.1 39.6 24.1 82.3 32.5 66.9
30.7 49.8 94.9 176.8 87.4 103.3 88.7 51.4 75.1 46.4
91.9 17.1 168.3 32.9 122.1 51.9 87.3 32.3 102.2 74.3
317.1 93 68.5 140.6 320.9 172.4 111.1 86.6 134.2 264.5
48.8 187.7 112.7 600.9 64.6 157.5 220.0 345.8 215.5 220.9
130.9 146.6 157.7 132.4 90.8 195.2 68.1 144.3 195.8 181.7
63.1 16.8 93.7 24.8 25.3 89.2 80.7 102.0 25.5 145.9
92.6 15 56.1 66.7 7.8 40.7 11.0 50.7 35.3 2.2
99.9 44.1 6.1 74.6 71.2 45.3 116.3 26.7 33.4 148.2
21.9 105.1 101.3 26.3 41.4 17.5 8.0 47.4 24.9 77.8
由描述统计量表得出,镇江市近几年的月降雨量在90.7925间波动,且极小值与极大值之间的差距还是挺大的,说明降雨量是一个具有季节性的数据。
四、时间序列数据的预处理
①对原数据进行时序图检验和自相关图检验:
020040060080000010203040506070809X
图一1
Date: 06/07/11 Time: 19:14
Sample: 2000:01 2009:12
Included observations: 120
Autocorrelation Partial Correlation AC PAC Q-Stat Prob
.|** | .|** | 1 0.208 0.208 5.3472 0.021
.|. | *|. | 2 -0.046 -0.093 5.6047 0.061
*|. | .|. | 3 -0.071 -0.043 6.2342 0.101
*|. | *|. | 4 -0.116 -0.100 7.9317 0.094
*|. | *|. | 5 -0.135 -0.103 10.267 0.068
**|. | *|. | 6 -0.189 -0.168 14.856 0.021
*|. | *|. | 7 -0.149 -0.117 17.723 0.013
*|. | **|. | 8 -0.175 -0.199 21.745 0.005
*|. | *|. | 9 -0.127 -0.158 23.882 0.004
.|* | .|. | 10 0.096 0.033 25.117 0.005
.|** | .|* | 11 0.293 0.177 36.654 0.000
.|** | .|* | 12 0.242 0.098 44.611 0.000
.|** | .|* | 13 0.212 0.156 50.779 0.000 描述统计量
N 全距 极小值 极大值 均值 标准差
VAR00001 120 598.70 2.20 600.90 90.7925 82.03718
有效的 N (列表状态) 120 .|* | .|* | 14 0.105 0.070 52.293 0.000
*|. | *|. | 15 -0.103 -0.099 53.775 0.000
*|. | *|. | 16 -0.142 -0.062 56.598 0.000
**|. | *|. | 17 -0.206 -0.142 62.647 0.000
*|. | *|. | 18 -0.181 -0.082 67.328 0.000
*|. | .|. | 19 -0.091 0.047 68.534 0.000
*|. | .|. | 20 -0.119 -0.033 70.595 0.000
*|. | *|. | 21 -0.105 -0.106 72.211 0.000
.|. | *|. | 22 -0.040 -0.150 72.453 0.000
.|** | .|* | 23 0.282 0.136 84.479 0.000
.|** | .|. | 24 0.297 0.031 97.905 0.000
.|** | .|* | 25 0.240 0.119 106.78 0.000
.|. | *|. | 26 -0.005 -0.095 106.79 0.000
*|. | .|. | 27 -0.062 0.002 107.39 0.000
*|. | *|. | 28 -0.166 -0.099 111.77 0.000
*|. | .|. | 29 -0.159 -0.019 115.82 0.000
.|. | .|. | 30 -0.039 0.056 116.06 0.000
*|. | *|. | 31 -0.167 -0.069 120.66 0.000
*|. | .|. | 32 -0.144 -0.002 124.11 0.000
.|. | .|. | 33 -0.050 -0.006 124.53 0.000
.|. | *|. | 34 0.036 -0.092 124.76 0.000
.|* | *|. | 35 0.131 -0.082 127.70 0.000
.|* | .|. | 36 0.186 -0.053 133.74
0.000
图一2
由时序图显示该序列具有一个周期长度为一年的平稳的季节变动。同时查看数据的自偏相关系数图及P值检验,得知此数据为平稳的相对随机数据,除几个数值的P值>0.05外,其余的P值均<0.05。所以对原序列先做一阶差分,提取线性长期趋势。
②一阶差分运算
在Eiews中Genr里输入dx=d(x),得到一阶差分后的时序图和自相关图:
-600-400-200020040060000010203040506070809DX
图二1
Date: 06/07/11 Time: 19:37
Sample: 2000:01 2009:12
Included observations: 119
Autocorrelation Partial Correlation AC PAC Q-Stat Prob
***|. | ***|. | 1 -0.339 -0.339 14.055 0.000