当前位置:文档之家› 数学建模——时间序列分析

数学建模——时间序列分析


时间序列数据的预处理
3. 序列纯随机性检验
时间序列数据的预处理
结论:
➢ 由于统计量的P值<0.0001,远远小于 0.05,即拒绝 序列为纯随机序列的假定。因而认为京市城乡居民 定期储蓄所占比例的变动不属于纯随机波动,各序 列值之间有相关关系。
➢ 这说明我们可以根据历史信息预测未来年份的北京 市城乡居民定期储蓄所占比例,该平稳序列属于非 白噪声序列,可以对其继续进行研究。
➢ 1964年——1999年中国纱年产量SAS程序
➢ data a;input sha@@; ➢ year=intnx('year','1964',_n_-1);format year year4.; ➢ dif=dif(sha); ➢ cards; ➢ 97 130 156.5 135.2 137.7 180.5 205.2 190 188.6 196.7 ➢ 180.3 210.8 196 223 238.2 263.5 292.6 317 335.4 327 ➢ 321.9 353.5 397.8 436.8 465.7 476.7 462.6 460.8 ➢ 501.8 501.5 489.5 542.3 512.2 559.8 542 567 ➢; ➢ proc gplot;plot sha*year=1 dif*year=2; ➢ symbol1 v=circle i=join c=black; ➢ symbol2 v=star i=join c=red; ➢ proc arima data=a;identify var=sha nlag=22; ➢ run;
➢ 则有(用延迟算子表示差分):
平稳时间序列数据分析
1.2 两种样本相关系数的基本概念与计算
➢ 样本自相关系数
➢ 样本偏自相关系数
nk
(xt x)( xtk x)
ˆk t1 n
(xt x)2
t 1
所谓滞后k阶偏自相关系数就 是指在给定中间k-1个随机变 量 xt-1, xt-2,… xt-k+1的条件下, 或者说,在剔除了中间k-1个 随机变量的干扰之后, xt-k对 xt影响的相关度量。
➢ 自相关图检验 平稳序列通常具有短期相关性。该性质用自相关 系数来描述就是随着延迟期数的增加,平稳序列 的自相关系数会很快地衰减向零。
时间序列数据的预处理
平稳性检验
➢ 例1 ➢检验1964年——1999年中国纱年产量序列的平 稳性
➢ 例2 ➢检验1962年1月——1975年12月平均每头奶牛月 产奶量序列的平稳性
➢ 备择假设:延迟期数小于或等于m期的序列值之间 有相关性
H1:至少存在某个 k 0,m 1,k m
时间序列数据的预处理
检验统计量 ➢ Q统计量
m
Q

n
ˆ
2 k
~
2(m)
k 1
➢ LB统计量
m
LB n(n 2) (
ˆ k2
) ~ 2(m)
k1 n k
➢ 纯随机序列也称为白噪声序列,它满足如下两条 性质
(1)EXt ,t T
(2)
(t,
s)



2,t

s ,t ,
s
T
0,t s
时间序列数据的预处理
标准正态白噪声序列时序图
时间序列数据的预处理
3.2 白噪声序列的性质
➢ 纯随机性
(k) 0,k 0
➢各序列值之间没有任何相关关系,即为 “没有 记忆”的序列
时间序列分析
华中农业大学数学建模基地系列课件

引例
7000年前的古埃及人把 尼罗 河涨落的情况逐天记录下来, 就构成所谓的时间序列。对这 个时间序列长期的观察使他们 发现尼罗河的涨落非常有规律 。由于掌握了尼罗河泛滥的规 律,使得古埃及的农业迅速发 展,从而创建了埃及灿烂的史 前文明。
时间序列数据的预处理
2 平稳性检验
➢平稳性检验主要有两种方法:
➢根据时序图和自相关图显示的特征做出判断的 图检验方法
➢构造检验统计量进行假设检验的方法。
时间序列数据的预处理
2.1 平稳性的图检验
➢ 时序图检验 根据平稳时间序列均值、方差为常数的性质,平 稳序列的时序图应该显示出该序列始终在一个常 数值附近随机波动,而且波动的范围有界、无明 显趋势及周期特征。
引例
什么是时间序列
➢ 时间序列:某一系统在不同的时间(地点或其他条件 等)的响应(数据)。
➢ 时间序列是按一定的顺序排列而成,“一定顺序”既 可以是时间顺序,也可以是具有不同意义的物理量。
如:研究高度与气压的关系,这里的高度就可以看作 “时间” 总而言之,时间序列只是强调顺序的重要性,因此又被 称为“纵向数据”,相对于“横向数据”而言的。
3) (t, s) (k, k s t ),t, s, k且k s t T
时间序列数据的预处理
平稳时间序列的统计性质
➢ 常数均值和方差
➢ 自协方差函数和自相关函数只依赖于时间的平移 长度,而与时间的起止点无关
➢延迟k自协方差函数
(k) (t,t k),k为整数
➢ 方差
DXt E( X t t )2

2
(x


t
)
dFt ( x)
➢ 自协方差
(t, s) E( Xt t )( X s s )
➢ 自相关系数
(t,s) (t,s)
DXt DX s
时间序列数据的预处理
1.2 平稳时间序列的定义
➢ 严平稳
➢严平稳是一种条件比较苛刻的平稳性定义,它 认为只有当序列所有的统计性质都不会随着时 间的推移而发生变化时,该序列才能被认为平 稳。
程序说明(数据的录入)
➢ 等间隔时间数据的录入
时间序列数据的预处理
程序说明(数据的录入)
➢ 等间隔时间数据的录入
时间序列数据的预处理
程序说明(数据的录入)
➢ 的录入)
➢ 取数据中的子集
时间序列数据的预处理
程序说明(数据的录入)
➢ 缺失数据的插入
时间序列数据的预处理
时间序列数据的预处理
1. 绘制时序图
该序列显示北京市城乡居民定期储蓄所占比例序列波动“貌似” 比较平稳
时间序列数据的预处理
2. 自相关图进一步检验平稳性
样本自相关图延迟3阶后,自相关系数都落在2倍标准差范围以内,而且自相 关系数向零衰减的速度非常快。综合前两个步骤,可知北京市城乡居民定期 储蓄所占比例为平稳序列
➢ p 阶差分 p xt p1 xt p1 xt1
➢ k 步差分 k xt xtk
平稳时间序列数据分析
延迟算子
➢ 延迟算子类似于一个时间指针,当前序列值乘以 一个延迟算子,就相当于把当前序列值的时间向 过去拨了一个时刻
➢ 记 B为延迟算子,有
xt p B p xt ,p 1
平稳时间序列数据分析
延迟算子的性质 B0 1
B(c xt ) c B( xt ) c xt1,c为任意常数
B( xt yt ) xt1 yt1
Bn xt xtn
(1 B)n
n
(1)i Cni Bi ,
i0
其中
Cni

n! i!(n i)!
时间序列数据的预处理
➢ 1962年1月—1975年12月平均每头奶牛月产奶量SAS程序
时间序列数据的预处理
➢ 1949年——1998年北京市每年最高气温SAS程序
时间序列数据的预处理
3 纯随机性检验
➢ 纯随机序列的定义 ➢ 纯随机性的性质 ➢ 纯随机性检验
时间序列数据的预处理
3.1 纯随机序列的定义
内容提要
➢ 时间序列数据的预处理
平稳性检验 纯随机性检验
➢ 平稳时间序列数据分析 ➢ 非平稳时间序列数据分析
时间序列数据的预处理
➢时间序列数据的预处理
➢基本概念 ➢平稳性检验 ➢纯随机性检验
时间序列数据的预处理
1 基本概念
1 .1 基本的数字特征
➢ 概率分布的意义 ➢ 随机变量族的统计特性完全由它们的联合分布函数或 联合密度函数决定
➢ 时间序列概率分布族的定义
{Ft1,t2 , ,tm ( x1, x2 , , xm )} m (1,2, , m),t1, t2 , , tm T
➢ 几个重要数字特征:均值 、方差、自协方差、自相关系 数
时间序列数据的预处理
特征统计量
➢ 均值

t EXt xdFt ( x)
➢ 例3 ➢检验1949年——1998年北京市每年最高气温序 列的平稳性
时间序列数据的预处理
例1 平稳性检验
时间序列数据的预处理
平稳性检验
时间序列数据的预处理
平稳性检验
时间序列数据的预处理
例2 自相关图
时间序列数据的预处理
例3 时序图
时间序列数据的预处理
例3 自相关图
时间序列数据的预处理
纯随机序列的假定
时间序列数据的预处理
例4 随机生成的100个服从标准正态的白噪声序列纯 随机性检验
样本自相关图
时间序列数据的预处理
检验结果
延迟 延迟6期
QLB 统计量检验 QLB 统计量值
2.36
P值 0.8838
延迟12期
5.35
0.9454
由于P值显著大于显著性水平 ,所以该序列 不能拒绝纯随机的原假设。换句话说可以认 为该序列的波动没有任何统计规律可循,因 此可以停止对该序列的统计分析。
时间序列数据的预处理
相关主题