时间序列分析基本知识讲解
典型案例
1988 年某药品公司一种抗生素的出厂数量(单位:千箱) 时间 1 月 2 月 3 月 4 月 5 月 6 月 7 月 8 月 9 月 10 月 11 月 12 月 数量 371.5 267.4 372.4 368.2 349.4 362.8 420.9 380.4 385.6 335.0 338.5 306.6
1600
1500
1400
ቤተ መጻሕፍቲ ባይዱ
1300
1200
1100
1000
900
800
700
600
500
400
MAR1979
NOV1981
AUG1984
MAY1987
FEB1990
NOV1992
AUG1995
MAY1998
JAN2001
DATE
时间序列与随机过程
一般来说,时间序列中各变量值无法用确 定的函数形式表达,各时刻的观测结果可 视作随机因素作用下的变量,当 t(a,b)时, 变量集合 ,x常t 被称作随机过程,实际 工作中的实测值序列则被称作随机过程的 一次实现。其中,参数t可以是时间,也可 以是其他有序变量,如空间位置、温度水 平等。
时间序列分析的用途
(1)预测 (2)序列间的关系 (3) 序列分解 (4)模型的适用性检验 (5)干预分析
1.1 时间序列的分解
(1)趋势性(Trend) (2)季节性(Seasonal Fluctuation) (3)随机性(Irregular Variation)
“加法式” 与 “乘法式”迭加
权 与 t 的间隔时间
=0.3
重
=0.2
值
=0.1
1
0.3
0.2
0.1
2
0.21
0.16
0.09
3
0.147
0.128
0.081
4
0.1029
0.1024
0.0729
5
0.07203 0.08192
0.06561
6
0.050421 0.065536 0.059049
7
0.035295 0.052429 0.053144
= 0.2×267.4+0.8×359.17 = 340.82 ……
指数平滑法用于某药品生产公司一种抗生素的出厂数量预测(单位:千箱)
时间(年/月) 数 量
1988/ 1 2 3 4 5 6 7 8 9 10 11 12
1989/ 1
375.1 267.4 372.4 368.2 349.4 362.8 420.9 380.4 385.6 335.0 338.5 306.6 ……
8
0.024706 0.041943 0.047830
9
0.017294 0.033554 0.043047
10
0.012106 0.026844 0.038742
指数平滑法实现预测的本质意义
St xt(1)St 1
S t S t 1(xtS t 1)
平滑预测值 = 历史对当前的预测值 + α × 当前预测的误差
Xt Tt St It
t1,2,,
分离出趋势项和周期项后,时间序列 往往表现为平稳波动。
借助时间序列进行预测的依据
平稳化后的时间序列历史值
X1,X2,,Xn
中往往含有 X n 1 的信息,这就使得
利用历史样本 x1,x2,,xn预测所关
心指标将来的取值水平成为可能。
1.2 指数平滑法
对于事物未来发展的水平,新近观 测值比早期观测值的预测价值更大, 因而在预测时,新近观测值应比早 期观测值具有更大的权重。
= 0.2
355.19 359.17 340.82 347.13 351.35 350.96 353.33 366.84 369.55 372.76 365.21 359.87 349.21
xˆt1 (1)
= 0.5
355.19 365.15 316.27 344.34 356.27 352.83 357.82 389.36 384.88 385.24 360.12 349.31 327.95
时间序列的定义
医学科研工作中,按一定时间间隔(常为 等间距)对客观事物进行动态观察,由于 随机因素的作用,各次观察的指标
x1,x2,x3,,xi,
都是随机变量,这种按时间顺序排列的随 机变量(或其观测值)就是时间序列。
图1.1 某医科大学附属医院1980年~1999 年逐月出院患者数
C 1700
试用指数平滑法预测1989年1月份的出厂 数量。
指数平滑预测的通式
St xt(1)St 1
St —— 第t期平滑值(t >0);
—— 平滑系数(取值范围);
xt —— 第t期实际观察值。
拟合过程
S1 = 355.19 (怎样选?) S2 = 0.2×x1+0.8×S1
= 0.2×371.5+0.8×355.19 = 359.17 S3 = 0.2×x2+0.8×S2
= 0.7
355.19 369.13 297.92 350.06 362.76 353.41 359.98 402.62 387.07 386.04 350.31 342.04 317.23
当前平滑结果与历史值的关系
S t 1xt 1 (1 )S t 2
S t 2x t 2 (1 )S t 3
权重系数的特点
平滑预测值 = 历史对当前的预测值 + α × 当前预测的误差
α界于(0 ~ 1.0)之间。 如果要求模型有较高灵敏度,能够迅速跟
踪新数据的变化,权重系数可取?一些;
如果要求模型不要被随机扰动影响太大,
权重系数可选?一些,使预测结果更主要
时间序列分析基本知识讲解
路漫漫其悠远
少壮不努力,老大徒悲伤
统计分析的数据 静态数据(static data) 动态数据(dynamic data)
时间序列分析(time series analysis)
建立数学模型,从数量上揭示某现象的 发展变化规律或者从动态的角度刻画某 现象与其他现象之间的内在数量关系, 以便认识客观事物、预测其未来的变化 趋势。有时还可以依据事物相互作用机 制,作出针对性的调整,从而达到改造 客观之目的。
……
代入下式 ,
St xt(1)St 1
S tx t( 1 )x t 1( 1 )2 x t 2( 1 )3 x t 3 ( 1 )t 1 x 1 ( 1 )tS 0
(1)(1)2(1)t1(1)t 11 ((11 ))t(1)t
当 t时,(1)t 0,系数之和→1。
不同历史值获得的权重值递减情形