基于Excel的时间序列预测与分析1 时序分析方法简介1.1时间序列相关概念1.1.1 时间序列的内涵以及组成因素所谓时间序列就是将某一指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。
如经济领域中每年的产值、国民收入、商品在市场上的销量、股票数据的变化情况等,社会领域中某一地区的人口数、医院患者人数、铁路客流量等,自然领域的太阳黑子数、月降水量、河流流量等等,都形成了一个时间序列。
人们希望通过对这些时间序列的分析,从中发现和揭示现象的发展变化规律,或从动态的角度描述某一现象和其他现象之间的内在数量关系及其变化规律,从而尽可能多的从中提取出所需要的准确信息,并将这些知识和信息用于预测,以掌握和控制未来行为。
时间序列的变化受许多因素的影响 ,有些起着长期的、决定性的作用 ,使其呈现出某种趋势和一定的规律性;有些则起着短期的、非决定性的作用,使其呈现出某种不规则性。
在分析时间序列的变动规律时,事实上不可能对每个影响因素都一一划分开来,分别去作精确分析。
但我们能将众多影响因素,按照对现象变化影响的类型,划分成若干时间序列的构成因素,然后对这几类构成要素分别进行分析,以揭示时间序列的变动规律性。
影响时间序列的构成因素可归纳为以下四种:(1)趋势性(Trend),指现象随时间推移朝着一定方向呈现出持续渐进地上升、下降或平稳的变化或移动。
这一变化通常是许多长期因素的结果。
(2)周期性(Cyclic),指时间序列表现为循环于趋势线上方和下方的点序列并持续一年以上的有规则变动。
这种因素是因经济多年的周期性变动产生的。
比如,高速通货膨胀时期后面紧接的温和通货膨胀时期将会使许多时间序列表现为交替地出现于一条总体递增地趋势线上下方。
(3)季节性变化(Seasonal variation),指现象受季节性影响 ,按一固定周期呈现出的周期波动变化。
尽管我们通常将一个时间序列中的季节变化认为是以1年为期的,但是季节因素还可以被用于表示时间长度小于1年的有规则重复形态。
比如,每日交通量数据表现出为期1天的“季节性”变化,即高峰期到达高峰水平,而一天的其他时期车流量较小,从午夜到次日清晨最小。
(4)不规则变化(Irregular movement),指现象受偶然因素的影响而呈现出的不规则波动。
这种因素包括实际时间序列值与考虑了趋势性、周期性、季节性变动的估计值之间的偏差,它用于解释时间序列的随机变动。
不规则因素是由短期的未被预测到的以及不重复发现的那些影响时间序列的因素引起的。
时间序列一般是以上几种变化形式的叠加或组合出现的(如图1.4)。
图1.1 平稳序列图1.2 趋势序列图1.3 季节型序列图1.4 含有季节与趋势因素的序列1.1.2 时间序列的分类根据其所研究的依据不同,可有不同的分类:(1)按所研究的对象的多少来分,有一元时间序列和多元时间序列。
如某种商品的销售量数列,即为一元时间序列;如果所研究对象不仅仅是这一数列,而是多个变量,如按年、月顺序排序的气温、气压、雨量数据等,每个时刻对应着多个变量,则这种序列为多元时间序列。
(2)按时间的连续性可将时间序列分为离散时间序列和连续时间序列两种。
如果某一序列中的每一个序列值所对应的时间参数为间断点,则该序列就是一个离散时间序列;如果某一序列中的每个序列值所对应的时间参数为连续函数,则该序列就是一个连续时间序列。
(3)按序列的统计特性分,有平稳时间序列和非平稳时间序列两类。
所谓时间序列的平稳性,是指时间序列的统计规律不会随着时间的推移而发生变化。
平稳序列的时序图直观上应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及无周期特征;从理论上讲,分为严平稳与宽平稳两种。
相对的,时间序列的非平稳性,是指时间序列的统计规律随着时间的推移而发生变化。
(4)按序列的分布规律来分,有高斯型(Guassian) 和非高斯型时间序列(non-Guassian)1.2 时间序列分析概述时间序列分析是一种广泛应用的数据分析方法,它研究的是代表某一现象的一串随时间变化而又相关联的数字系列(动态数据),从而描述和探索该现象随时间发展变化的规律性。
时间序列的分析利用的手段可以通过直观简便的数据图法、指标法、模型法等来分析,而模型法应用更确切和适用也比较前两种方法复杂,能更本质地了解数据的内在结构和复杂特征,以达到控制与预测的目的。
时间序列分析方法包括:(1)确定性时序分析:它是暂时过滤掉随机性因素(如季节因素、趋势变动)进行确定性分析方法,其基本思想是用一个确定的时间函数()t f y =来拟合时间序列,不同的变化采取不同的函数形式来描述,不同变化的叠加采用不同的函数叠加来描述。
具体可分为趋势预测法(最小二乘)、平滑预测法、分解分析法等;(2)随机性时序分析:其基本思想是通过分析不同时刻变量的相关关系,揭示其相关结构,利用这种相关结构建立自回归、滑动平均、自回归滑动平均混合模型来来对时间序列进行预测。
为了对时间序列分析方法有一个比较全面的了解,现将时间序列分析方法归纳如下:⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎨⎧⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧平均模型等采用自回归模型、滑动贝叶斯分析马尔可夫分析不可控时序分析可控多元时序分析一元随机性时序分析平滑法等采用移动平均法、指数趋势加周期波动分析周期波动分析趋势变动分析发展水平分析确定性时序分析时间序列分析//1.3 确定性时间序列分析由1.1的介绍,我们知道时间序列的变动是长期趋势变动、季节变动、循环变动、不规则变动的耦合或叠加。
在确定性时间序列分析中通过移动平均、指数平滑、最小二乘法等方法来体现出社会经济现象的长期趋势及带季节因子的长期趋势,预测未来的发展趋势。
1.3.1 移动平均法通过对时间序列逐期递移求得平均数作为预测值的一种方法叫移动平均法,它是对时间序列进行修匀,边移动边平均以排除偶然因素对原序列的影响,进而测定长期趋势的方法。
其简单的计算公式为:预测值=最后n 个值的平均其中: n =被认为是与预测下一个时期相关的最近的时期数采用Excel 进行移动平均时,在【数据分析】选项中选择【移动平均】,并在对话框中输入数据区域和移动间隔即可。
说明:n 的选择:采用移动平均法进行预测 ,用来求平均数的时期数n 的选择非常重要,这也是移动平均的难点。
因为n 取值的大小对对所计算的平均数的影响较大。
当1=n 时,移动平均预测值为原数据的序列值。
当n =全部数据的个数时,移动平均值等于且为全部数据的算术平均值。
显然,n 值越小,表明对近期观测值预测的作用越重视 ,预测值对数据变化的反应速度也越快,但预测的修匀程度较低,估计值的精度也可能降低。
反之,n 值越大,预测值的修匀程度越高,但对数据变化的反映程度较慢。
不存在一个确定时期n 值的规则。
一般n 在3~200之间,视序列长度和预测目标情况而定。
一般对水平型数据,n 值的选取较为随意;一般情况下,如果考虑到历史上序列 中含有大量随机成分,或者序列的基本发展趋势变化不大,则n 应取大一点。
对于具有趋 势性或阶跃性特点的数据,为提高预测值对数据变化的反应速度,减少预测误差,n 值取 较小一些,以使移动平均值更能反映目前的发展变化趋势。
一般n 的取值为3~15。
具体取值要看实际情况,可由均方差MSE 来评价(MSE 的概念在第3节“预测方法的评估”中介绍)。
1.3.2 指数平滑法指数平滑法是对过去的观测值加权平均进行预测,使第1+t 期的预测值等于t 期的实际观测值与第t 期指数平滑值的加权平均值,即预测值=α(上期值)+)1(α-(上次预测值)一次指数平滑法预测模型为:()t t t M y M αα-+=+11 (1-1)其中:t M ——第t 期预测值;t y ——第t 期的实际观测值;α——平滑系数,且10<<α。
将 ()2211----+=t t t M y M αα()3221----+=t t t My Mαα代入(1-1)式中,可得:()∑=--=ti it it y M 01αα (1-2)公式(1-2)中各项系数和为:()()()()()()t t tt αααααααααα-+⎥⎦⎤⎢⎣⎡----=-+-++-+-111111111当∞→t 时, ()01→-tα, 系数和1→。
所以,可以说t M 是t 期以及以前各期观察值的指数加权平均值,观察值的权数按递推周期以几何级数递减,各期的数据离第t 期越远,它的系数愈小,因此它对预测值的影响也越小。
公式(1-1)稍作变换可得:)-(+=+t t t t M y M M α1 (1-3) 可见,1+t M 是t 期的预测值t M 加上用α调整的t 期的预测误差)-(t t M y 。
因此,简单指数平滑法用于预测实际上是根据本期预测误差对本期预测值作出一定的调整后得到的下一个预测值,即:新的预测值=老的预测值+α⨯老预测值的误差对老预测值所作的调整的幅度视α的大小而定。
说明: 平滑系数α的选择:α的取值对平滑效果影响很大, α越小平滑效果越显著. α取值的大小决定了在平滑值中起作用的的观察值的项数的多少,当α取值较大时,各观察值权数的递减速度快,因此在平滑值中起作用的观察值的项数就较少;而当α取值较小时,各观察值权数的递减速度很慢,因此在平滑值中起作用的观察值的项数就较多。
如果用移动平均数与指数平滑法相比,要使两者具有相同的灵敏程度,移动平均数n 的取值与指数平滑法中α的取值有如下关系:αα-=-121n当α取值0.05~0.3之间时,如果要使移动平均具有相应的灵敏程度,则N 的取值为:当α取值较小时,指数平滑法的平滑能力较强,而α取值较大时,模型对现象变化的反应速度较快。
一般来说α取值的大小应当视所预测对象的特点及预测期的长短而定。
一般情况下,观测值呈较稳定的水平发展,α值取0.1~0.3之间;观测值波动较大时α,值取0.3~0.5之间;观测值呈波动很大时,α值取0.5~0.8之间。
采用Excel 进行指数平滑预测步骤如下: 1、选择在【数据分析】选项中选择【指数平滑】; 2、在【输入区域】中输入数据区域;3、在【阻尼系数】输入α-1的值(注:阻尼系数=α-1);4、在【输出区域】中选择预测结果输出位置;单击【确定】即可。
1.3.3 趋势预测(1)线性趋势预测模型:bt a y t +=用最小二乘法求待定参数a 、b 决定于标准方程组:⎩⎨⎧+=+=∑∑∑∑∑∑2tb t ty t b a y ⇒()⎪⎩⎪⎨⎧-=--=∑∑∑∑∑tb y a t t n y t ty n b ][)(22趋势预测的误差可用线性回归中的估计标准误差来衡量。