当前位置:文档之家› 第二章时间序列的预处理

第二章时间序列的预处理

),,(),,(21,,21,,2121m t t t m t t t x x x F x x x F m m τττ+++=第二章 时间序列的预处理 2.1 平稳性检验 2.1.1 特征统计量 一、概率分布对时间序列},{T t X t ∈,,,,,21T t t t N m m ∈∀∈∀ 联合概率分布记为),,(21,,21m t t t x x x F m,由这些有限维分布函数构成的全体记为:},,,),,2,1(),,,({2121,,21T t t t m m x x x F m m t t t m ∈∀∈∀成为序列}{t X 的概率分布族二、特征统计量对时间序列},{T t X t ∈,取T s t ∈∀, 1、均值t t EX =μ为}{t X 在t 时刻的均值函数,},{T t t ∈μ反映},{T t X t ∈每时每刻的平均水平 2、方差2)(t t t X E DX μ-=3、自协方差函数(autocovariance function)和自相关函数(autocorrelatioi function) 定义 ),(s t γ为}{t X 的协方差函数:))((),(s s t t X X E s t μμγ--= 定义),(s t ρ为}{t X 的自相关系数,ACF. st DXDX s t s t ⋅=),(),(γρ2.1.2 平稳时间序列的定义 一、严平稳只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为是严平稳的。

定义 2.1 设}{t X 为一时间序列,对任意正整数m ,任取T t t t m ∈ ,,21,对任意整数τ 有则称时间序列}{t X 为严平稳时间序列。

二、宽平稳定义 2.2 如果}{t X 满足如下三个条件: (1)任取∞∈ 2,tEX T t 有;(2)任取μμ,,=∈tEXT t 有为常数;(3)任取),(),(T,t -s k T,k s,t,t s k k s t -+=∈+∈γγ有且; 则称}{t X 为宽平稳时间序列。

三个条件即:1)均值、方差均为常数;2)协方差与间隔有关,与起点无关。

宽平稳只要求二阶平稳。

宽平稳一般推不出严平稳,但当序列服从多元正态分布是,则二阶平稳可以退出严平稳。

2.1.3 平稳时间序列的统计性质 一、常数均值T t EX t ∈∀=,μ二、自协方差函数与自相关函数只依赖于时间的平移长度而与时间的起止点无关 ),(),(T,t -s k T,k s,t,t s k k s t -+=∈+∈γγ有且 从而有 T s t s t s t ∈∀-=,),(ˆ),(γγ定义2.4 对于平稳时间序列},{T t X t ∈,任取}{)(T),k t(t t X k 为时间序列定义γ∈+的延迟k 自协方差函数: ),()(k t k k +=γγ 容易得出:常数方差:T t t t DX t ∈==),0(),(γγ 延迟k 自相关系数: )0()()(),(2γγσγγρk k DXDX k t t Xkt t k ==⋅+=+自相关系数具有如下性质:(1)规范性 k ∀≤=,11k 0ρρ且 (2)对称性k k -=ρρ(3)非负定性:对任意整数m,相关阵m Γ为对称非负定阵21201110ρρρρρρρρρ----=Γm m m m m(4)非唯一性:一个平稳时间序列一定唯一决定了它的自相关函数,但一个自相关函数未必唯一对应着一个平稳时间序列。

2.1.4 平稳时间序列的意义对随机序列},,,,,{21 t X X X 而言,它在任意时t 的序列值t X 都是一个随机变量,而且由于时间的不可重复性,该变量在任意一个时刻只能获得唯一的样本观察值。

2.1.5 平稳性的检验方法有两种:一是根据时序图和自相关图显示的特征作出判断的图检验方法;二是构造检验统计量进行假设检验的方法。

一、时序图检验横轴表示时间,纵轴表示序列取值。

平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界的特点。

如果观察序列的时序图显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列。

二、自相关图检验一个坐标轴表示延迟时期数,另一个坐标轴表示自相关系数,通常以垂线表示自相关的大小。

平稳序列的自相关系数k ρˆ会很快地衰减向零。

反之,非平稳序列的自相关系数k ρˆ衰减向零的速度通常比较慢。

2.2 纯随机性检验 2.2.1 纯随机序列的定义定义2.5 如果时间序列}{t X 满足如下性质: 1)任取μ=∈t EX T t 有,; 2)任取T s t ∈,,有{,,02),(st st s t =≠=σγ称序列}{t X 为纯随机序列,也称为白噪声序列,简记为),(~2σμWN X t2.2.2白噪声序列的性质 一、纯随机性0,0)(≠∀=k k γ这说明白噪声序列的各项之间没有任何相关关系,这种序列就是纯随机序列,序列在进行完全无序的随机波动。

如果序列值之间呈现出某种显著的相关关系: 0,0)(≠∃≠k k γ说明该序列不是纯随机序列,该序列间隔k 期的序列值之间存在着一定程度的互相影响关系(相关信息)。

二、方差齐性所谓方差齐性,就是指序列中每个变量的方差都相等,即2)0(σγ==t DX如果序列不满足方差齐性,就称该序列具有异方差性质。

2.2.3 纯随机性检验(白噪声检验)时间序列}{t X 应满足,0,0)(≠∀=k k γ,实际上,由于观察值序列的有限性,导致纯随机序列的样本自相关系数不会绝对为零 ,这些自相关系数都在零值附近以一个很小的幅度做着随机波动。

如果一个随机事件序列是纯随机的,得到一个观察期数为n 的观察序列}2,1,{n t x t =,那么该序列的延迟非零期的样本自相关系数将近似服从均值为零,方差为序列观察期倒数的正态分布,即0),1,0(~ˆ≠∀k n N k ρ,n 为序列观察期数。

由此可以构造检验统计量来检验序列的纯随机性。

一、假设条件原假设:延迟期数小于或等于m 期的序列值之间互相独立 备择假设:延迟期数小于或者等于m 期的序列值之间有相关性m m H m H k k ≤≥∀≠≥∀====k 10:1,0:1100,,至少存在某个ρρρρ二、检验统计量 1.Q 统计量为指定延迟期数为序列观测期数;m ),(~ˆ212n m n Q mk k χρ∑== 当Q 统计量大于)(21m αχ-分为点,或者该统计量的P 值小于α时,则可以以α-1的置信水平拒绝原假设,认为该序列为非白噪声序列;否则,接受原假设,认为该序列为纯随机序列。

2.LB 统计量∑=-+=mk k m kn n n LB 122)(~)ˆ()2(χρ平稳时间序列通常具有短期相关性,只要延迟时期够长,自相关系数都会收敛于零。

2.4上机指导 2.4.1 绘制时序图GPLOT 语句说明:proc gplot data=a ;——告诉系统,下面准备对临时数据集'a'中的数据绘图;plot price1*time=1 price2*time=2/overlay ;——要求系统要绘制两条时序曲线,第一条以price1为纵坐标,以symbol1语句所规定的格式绘制。

第二条以price2为纵坐标,以symbol2语句所规定的格式绘制。

Overlay 选项指令系统将这两条时序图绘制在同一张图中。

Symbol 语句中选项:C ——图线颜色。

可选red, black,green,pink,blue 等等V ——表示观察值的图形。

可选star,dot,circle,diamond.也可以选none; I ——观察值之间的连线方式。

可选join,spline(光滑连接),needle(作观察值到横轴的悬垂线)2.4.2 平稳性与随机性检验一、平稳性检验IDENTIFY语句:每条IDENTIFY语句执行后会给出五方面的信息:1)分析变量的描述性统计2)样本自相关图3)样本逆自相关图4)样本偏自相关图5)纯随机性检验结果1)1)分析变量的描述性统计信息如:分析变量的名称Name of V ariable序列均值Mean of Working Series标准差Standard Deviation观察值个数Number of Obsservations2)样本自相关图3)样本逆自相关图4)样本偏自相关图Lag——延迟阶数Covariance——延迟阶数给定后的自协方差函数Correlation——延迟阶数给定后的自相关系数Std Error——自相关函数的标准差"."——2倍标准差范围二、纯随机性检验5)纯随机性检验结果To Lag——延迟阶数Chi-Square——Q统计量的值,该统计量服从卡方分布LBDF——Q统计量服从卡方分布的自由度mLBPr>ChiSq——该Q统计量的P值LBAutocorrelation——计算得出的延迟各阶Q统计量的样本自相关系数的具体数值LB分析结果显示:Q的P值均显著小于0.05,为平稳的非白噪声序列。

LB。

相关主题