当前位置:文档之家› R语言 非平稳序列的随机分析

R语言 非平稳序列的随机分析


差分平稳

对原序列作一阶差分消除趋势,再作4步差分消除季节效 应的影响,差分后序列的时序图如下
白噪声检验
延迟阶数
2 统计量
43.84
51.71
P值
6
12
<0.0001
<0.0001
18
54.48
<0.0001
差分后序列自相关图
差分后序列仍有一定季节效应,延迟4阶后,自相关系数有一个反弹。 延迟1阶到3阶,延迟4阶到7阶衰减非常迅速,故该序列具有短期相关性。
xt t t
j t j j 0 d
( B)at
随机性影响
确定性影响
差分运算的实质

Cramer分解定理在理论上保证了适当阶数的差分一定可以 充分提取确定性信息

差分方法是一种非常简便、有效的确定性信息提取方法 差分运算的实质是使用自回归的方式提取确定性信息
i d xt (1 B) d xt (1) i C d xt i i 0 d
arima(x,order=c(1,1,0)) arima(diff(x),order=c(1,0,0))

arima(x,order=c(1,1,0),xreg=1:length(x))
ARIMA模型预测

原则
最小均方误差预测原理

Green函数递推公式
1 1 1 2 1 1 2 2 j 1 j 1 p d j p d j
2000年1月 2000年3月 2000年5月 2000年7月 2000年9月 2000年11月 2001年1月 2001年3月 2001年5月 2001年7月 2001年9月 2001年11月 2002年1月 2002年3月 2002年5月 2002年7月 2002年9月 2002年11月 2003年1月 2003年3月 2003年5月 2003年7月 2003年9月 2003年11月 2004年1月 2004年3月 2004年5月 2004年7月 2004年9月 2004年11月 2005年1月 2005年3月 2005年5月 2005年7月 2005年9月 2005年11月
ARIMA 模型族

d=0 ARIMA(p,d,q)=ARMA(p,q) p=0 ARIMA(p,d,q)=IMA(d,q)


q=0
ARIMA(p,d,q)=ARI(p,d) d=1,P=q=0 ARIMA(p,d,q)=random walk model

随机游走模型( random walk)
( p, d , (q1 ,, qn )) 以简记为 ARIMA
q1 ,, qn 为非零移动平均系数的阶数

如果自相关和移动平滑部分都有省缺,可以简记为
ARIMA (( p1 ,, pm ), d , (q1 ,, qn ))
例:对1917年-1975年美国23岁妇女每万人生育 率序列建模
差分方式的选择
• 序列蕴含着显著的线性趋势,一阶差分就可以实现趋势平稳

原序列时序图

差分后序列时序图

序列蕴含着曲线趋势,通常低阶(二阶或三阶)差分就可 以提取出曲线趋势的影响
差分后序列时序图

一阶差分

二阶差分
例:差分运算提取1995年1月—2000年12月平均每 头奶牛的月产奶量序列中的确定性信息
例:

已知ARIMA(1,1,1)模型为

(1 0.8B)(1 B) xt (1 0.6B) t
xt 1 4.5
xt 5.3
t 0.8 2 1


xt 3 的95%的置信区间
预测值

等价形式
(1 1.8B 0.8B 2 ) xt (1 0.6B) t xt 1.8xt 1 0.8xt 2 t 0.6 t 1
预测值
xt l ( t l 1 t l 1 l 1 t 1 ) ( l t l 1 t 1 )
et (l )
ˆ t (l ) x
E[et (l )] 0 Var[et (l )] (1 )
2 1 2 l 1 2

滑系数 k ,1 k q 为零,即原模型中有部分系数省缺了,
那么该模型称为疏系数模型。
疏系数模型类型

如果只是自相关部分有省缺系数,那么该疏系数模型可以
(( p1 ,, pm ), d , q) 简记为 ARIMA
p1 ,, pm 为非零自相关系数的阶数

如果只是移动平滑部分有省缺系数,那么该疏系数模型可
2、乘积季节模型

使用场合
• 序列的季节效应、长期趋势效应和随机波动之间有着复杂 地相互关联性,简单的季节模型不能充分地提取其中的相 关关系。
例:拟合1948-1981年美国女性月度失业率序列

1、检验序列平稳性
差分平稳

一阶、12步差分: x.dif=diff(diff(x),12) plot(x.dif)
第二部分 残差自回归( Auto-Regressive )模型 第三部分 异方差
• 一、异方差的性质 • 二、方差齐性变换 • 三、条件异方差模型
Cramer分解定理(1961)

任何一个时间序列 {xt }都可以分解为两部分的叠加:其中 一部分是由多项式决定的确定性趋势成分,另一部分是平 稳的零均值误差成分,即
第五讲 非平稳序列的随机分析
本讲内容
第一部分 ARIMA模型
• 一、差分运算 • 二、ARIMA模型
第二部分 残差自回归( Auto-Regressive )模型 第三部分 异方差
• 一、异方差的性质 • 二、方差齐性变换 • 三、条件异方差模型
本讲内容
第一部分 ARIMA模型
• 一、差分运算 • 二、ARIMA模型
一阶差分序列时序图
一阶差分序列自相关图
一阶差分后序列白噪声检验 延迟阶数 6 12 18
2统计量
P值 0.0178 0.1060 0.1344
15.33 18.33 24.66
拟合ARMA模型

偏自相关图
建模

课后问题

用R拟合以下三个模型的区别,三个模型的表达式分别是 什么形式?

二、ARIMA模型

(一)ARIMA模型介绍 (二)疏系数模型 (三)季节模型
ARIMA模型结构

使用场合:差分平稳序列拟合 模型结构
( B) d xt ( B) t 2 E ( ) 0 , Var ( ) t t , E ( t s ) 0, s t Ex 0, s t s t

模型结构
xt xt 1 t 2 E ( ) 0 , Var ( ) t t , E ( t s ) 0, s t Ex 0, s t s t

模型产生典故
Karl Pearson(1905)在《自然》杂志上提问:假如有个醉汉醉
1、简单季节模型

简单季节模型是指序列中的季节效应和其它效应之间是加 法关系
xt S t Tt I t

简单季节模型通过简单的趋势差分、季节差分之后序列即
可转化为平稳,它的模型结构通常如下
( B ) D xt t ( B)
d
例:拟合1962—1991年德国工人季度失业率序列
差分后序列自相关图与偏自相关图
除了1阶和4阶偏自相关系数显著大于2倍标准差之外,其他 阶数基本都在2倍标准差内波动。
所以尝试拟合疏系数模型AR(1,4)
模型拟合

预测
101
102
103
104
105
106
100
99
100 102 104 106 108 110 96 98
2000年1月 2000年8月 2001年3月 2001年10月 2002年5月 2002年12月 2003年7月 2004年2月
98 cpi
1月 6月 2月
2004年9月 2005年4月
2005年11月
2006年6月 2007年1月 2007年8月 2008年3月 2008年10月
2、乘积季节模型
2009年5月
2009年12月 2010年7月 2011年2月 2011年9月 2012年4月 2012年11月 2013年6月 2014年1月 2014年8月 2015年3月 2015年10月
自相关图
偏自相关图
建模



150000
200000
250000
100000
50000
2、乘积季节模型
1、简单季节模型
0
(三)季节模型
国内生产总值_当季值(亿元)
2000年第1季度 2000年第3季度 2001年第1季度 2001年第3季度 2002年第1季度 2002年第3季度 2003年第1季度 2003年第3季度 2004年第1季度 2004年第3季度 2005年第1季度 2005年第3季度 2006年第1季度 2006年第3季度 2007年第1季度 2007年第3季度 2008年第1季度 2008年第3季度 2009年第1季度 2009年第3季度 2010年第1季度 2010年第3季度 2011年第1季度 2011年第3季度 2012年第1季度 2012年第3季度 2013年第1季度 2013年第3季度 2014年第1季度 2014年第3季度 2015年第1季度 2015年第3季度 2016年第1季度 2016年第3季度 2017年第1季度 2017年第3季度
相关主题