文献综述摘要:通过对数据一系列处理,运用三阶自回归AR(3)模型拟合gps坐标时间序列,由于gps坐标时间序列数据之间的相关关系,且历史数据对未来的发展有一定影响,并对未来的电力增长进行预测。
理论准备:拿到一个观测值序列之后,首先要判断它的平稳性,通过平稳性检验,序列可分为平稳序列和非平稳序列两大类。
如果序列值彼此之间没有任何向关性,那就意味着该序列是一个没有任何记忆的序列,过去的行为对将来的发展没有丝毫影响,这种序列我们称之为纯随机序列,从统计分析的角度而言,纯随机序列式没有任何分析价值的序列。
如果序列平稳,通过数据计算进行模型拟合,并利用过去行为对将来的发展预测,这是我们所期望得到的结果。
可采用下面的流程操作。
关键字:gps坐标时间序列时间序列分析数据预测一、前言GPS坐标时间序列分析原来是“概率论与数理统计”领域当中的一个重要分支,其中有国际著名的学术杂志“时间序列分析”。
由于在过去的二十几年当中,时间序列分析方法在经济学的定量分析当中获得了空前的成功应用,因此所出现的“时间序列计量经济学”已经成为了“实证宏观经济学”的同意语或者代名词。
由此可见,作为宏观经济研究,甚至已经涉及到微观经济分析,时间序列分析方法是十分重要的。
时间序列分析方法之所以在经济学的实证研究中如此重要,其主要原因是经济数据大多具有时间属性,都可以按照时间顺序构成时间序列,而时间序列分析正是分析这些时间序列数据动态属性和动态相关性的有力工具。
从一些典型的研究案例中可以看出,时间序列分析方法在揭示经济变量及其相关性方法取得了重要进展。
目前关于时间序列分析的教科书和专著很多。
仅就时间序列本身而言的理论性论著也很多,例如本课程主要参考的Hamilton的“时间序列分析”,以及Box 和Jankins的经典性论著“时间序列分析”;近年来出现了两本专门针对经济学和金融学所编写的时间序列专著,这也是本课程主要参考的教材。
另外需要注意的是,随着平稳性时间序列方法的成熟和解决问题所受到的局限性的暴露,目前研究非平稳时间序列的论著也正在出现,其中带有结构性特征的非平稳时间序列分析方法更是受到了广泛重视。
二、本实验采用2000-01~2004-11月gps坐标时间序列数据做时间序列分析模型,数据如下:2000.1 5.4% 2001.9 8.8% 2003.5 13.4%2000.2 15.3% 2001.10 8.5% 2003.6 13.1%2000.3 7.1% 2001.11 7.4% 2003.7 15.2%2000.4 6.9% 2001.12 9.6% 2003.8 15.5%2000.5 12.8% 2002.1 15.4% 2003.9 15.5%2000.6 12.5% 2002.2 -3.2% 2003.10 14.8%2000.7 13.5% 2002.3 6.2% 2003.11 15.6%2000.8 10.6% 2002.4 10.6% 2003.12 13.4%2000.9 7.0% 2002.5 8.5% 2004.1 5.9%2000.10 9.3% 2002.6 13.4% 2004.2 24.7%2000.11 9.4% 2002.7 11.4% 2004.3 15.4%2000.12 8.5% 2002.8 13.7% 2004.4 16.2%2001.1 0.1% 2002.9 18.6% 2004.5 16.6%2001.2 12.8% 2002.10 16.1% 2004.6 14.3%2001.3 9.8% 2002.11 17.1% 2004.7 11.7%2001.4 7.7% 2002.12 14.6% 2004.8 12.1%2001.5 7.7% 2003.1 10.7% 2004.9 11.8%2001.6 8.4% 2003.2 23.2% 2004.10 15.8%2001.7 10.2% 2003.3 16.2% 2004.11 14.4%2001.8 6.3% 2003.4 14.1%首先对数据进行平稳性与纯随机性的检验与判别(一)平稳性的检验我们先采用图示法,时序图如下:X.25.20.15.10.05.00-.05510152025303540455055由图所示,该序列有很大的波动,周期性不明显。
更重要的是该序列的上升或下降趋势并不明显,基本可以确认该序列是平稳的,但直观感受不能认定它就是平稳的,需进一步做检验。
样本自相关图如下:根据序列自相关图可以看出:该序列具有短期相关性,就是随着延期数的增加,平稳序列的自相关系数很快地接近于零,自相关图大部分都在2倍的标准差范围内。
所以确认该序列就是平稳序列。
下面进行纯随机性检验:由自相关图可以知道,该序列延迟16期的自相关系是0.285 0.318 0.418 0.288 0.346 0.282 0.212 0.276 0.211 0.185 0.102 0.087 0.164 0.137 0.063 0.019延迟期的Q 统计值和对应得P值如图:由于Q统计值都很大,而对应的P值都小a,所以拒绝该序列是白噪声的假设,故该序列是非纯随机序列。
三、对模型的识别,我们做出自相关和偏子相关图。
由于该序列的自相关系数大部分落入2倍标准差范围内,而且自相关系数衰减为零的速度很慢,所以表现出拖尾性,而偏自相关系数的三阶在二倍标准差范围外,其他衰减为零的速度很快,所以表现出三阶截尾性,所以可断定该模型是AR(3)模型,即三阶自回归模型。
一、我们采用最小二乘法进行参数估计:从图中我们可以得出模型为:30.1214900.426156t x x tε-=++二、 对模型进行检验(一)参数的显著性检验,如图由于以上参数的t 值显著大于2,p 值小于0.05,所以拒绝参数不显著的假设,即认为这些参数是显著的。
(二) 模型的显著性检验 主要对残差的白噪声检验,如图:由残差序列的自相关与偏自相关的延迟阶数k 下的Q 统计值的p 值都显著大于0.05,可认为该拟合模型的残差序列属于白噪声序列,即该拟合模型显著有效。
四、模型优化模型优化主要有两个准则——AIC和SBC准则我们主要采用施瓦兹准则,分别对AR(1)、AR(2)、AR(3)进行检验,结果依次如下:图表 1AR(1)图表 2AR(2)图表 3AR(3)通过比较可知:各模型中的Schwarz criterion(施瓦兹准则)值在ar(3)模型中最小,所以ar(3)模型是相对优化模型。
六、预测序列未来走势根据模型对未来五年做以下预测,如图:预测模型12 月20041 月20052 月20053 月20054 月2005V2-模型_1 预测.1344 .0941 .1647 .1285 .1301 UCL .2121 .1734 .2455 .2108 .2138 LCL .0567 .0149 .0840 .0463 .0464对于每个模型,预测都在请求的预测时间段范围内的最后一个非缺失值之后开始,在所有预测值的非缺失值都可用的最后一个时间段或请求预测时间段的结束日期(以较早者为准)结束。
同时做出未来五年预测值的置信区间:故预测未来五年电厂电力增长率分别为:0.1344、0.0941、0.1647、0.1285、0.1301,从数据中我们可以发现增长状况相对来讲波动不算太大,基本趋于稳定。
五、gps 坐标时间序列具体计算一元ARMA 模型是描述时间序列动态性质的基本模型。
通过介绍ARMA 模型,可以了解一些重要的gps 坐标时间序列的基本概念。
1 预期、平稳性和遍历性 1.1 预期和随机过程假设可以观察到一个样本容量为T 的随机变量t Y 的样本:},,,{21T y y y这意味着这些随机变量之间的是相互独立且同分布的。
例3.1 假设T 个随机变量的集合为:},,,{21T εεε ,),0(~2σεN i 且相互独立,我们称其为高斯白噪声过程产生的样本。
对于一个随机变量t Y 而言,它是t 时刻的随机变量,因此即使在t 时刻实验,它也可以具有不同的取值,假设进行多次试验,其方式可能是进行多次整个时间序列的试验,获得I 个时间序列:+∞=-∞=t t t y }{)1(,+∞=-∞=t t t y }{)2(,…,+∞=-∞=t t I t y }{)(将其中仅仅是t 时刻的观测值抽取出来,得到序列:},,,{)()2()1(I t t t y y y ,这个序列便是对随机变量t Y 在t 时刻的I 次观测值,也是一种简单随机子样。
定义3.1 假设随机变量t Y 是定义在相同概率空间},,{P Ω上的随机变量,则称随机变量集合},2,1,0,{ ±±=t Y t 为随机过程。
例3.2 假设随机变量t Y 的概率密度函数为:]21exp[21)(22t t Y y y f t σσπ=此时称此时密度为该过程的无条件密度,此过程也称为高斯过程或者正态过程。
定义3.2 可以利用各阶矩描述随机过程的数值特征: (1) 随机变量t Y 的数学期望定义为(假设积分收敛):⎰==+∞∞-tt Y t t t dy y f y Y E t )()(μ 此时它是随机样本的概率极限:∑==∞→I i i t I t y I P Y E 1)(1lim)( (2) 随机变量t Y 的方差定义为(假设积分收敛): 20)(t t t Y E μγ-= 例3.3 (1) 假设},,{21 εε是一个高斯白噪声过程,随机过程t Y 为常数加上高斯白噪声过程:t t Y εμ+=,则它的均值和方差分别为:μεμμ=+==)()(t t t E Y E 2220)()(σεμγ==-=t t t t E Y E(2) 随机过程t Y 为时间的线性趋势加上高斯白噪声过程:t t t Y εβ+=,则它的均值和方差分别为:t E t Y E t t t βεβμ=+==)()(2220)()(σεμγ==-=t t t t E Y E1.2 随机过程的自协方差将j 个时间间隔的随机变量构成一个随机向量),,(1'=--j t t t t Y Y Y X ,通过随机试验可以获得该随机向量的简单随机样本。
假设函数),,,(1),,(1j t t t Y Y Y y y y f j t t t ---- 为随机向量t X 的联合概率分布密度,则可以类似地定义:定义3.3 随机过程t Y 的自协方差定义为:)])([(j t j t t t tj Y Y E ----=μμγ上述协方差可以利用联合概率分布密度求解。
1.3 平稳性定义:假设随机过程t Y 的均值函数t μ和协方差函数t j γ与时间t 无关,则称此过程是协方差平稳过程,也称为弱平稳过程。