状态空间模型和卡尔曼滤波
var(εt ) Qt
(11.1.4)
量测方程和状态方程的扰动项的协方差矩阵用 表示
Ω
var
ut εt
Ht 0
0 Qt
3
量测方程中的矩阵 Zt , dt , Ht 与转移方程中的矩阵 Tt , ct , Rt , Qt 统称为系统矩阵。如不特殊指出,它们都 被假定为非随机的。因此,尽管它们能随时间改变, 但是都是可以预先确定的。对于任一时刻 t,yt 能够被
7
例11.3 变参数模型 由于各种各样的外界冲击和政策变化等因素的影响,经济 结构不断发生变化,用OLS等固定参数模型:
yt xt β ut , t 1, 2 , , T
表现不出来这种经济结构的变化,因此,需要考虑采用变参数 模型(Time-varying Parameter Model)。下面利用状态空间模型 来构造变参数模型。
量测方程: 状态方程:
yt xt βt ztγ ut βt βt1 εt
(u
t
,
εt
)~
N
0 0
,
0
2
0 Q
,
t 1, 2 , , T
8
xt 是具有随机系数 t 的解释变量的集合,zt 是有固 定系数 的解释变量集合,随机系数向量 t 是对应于 (11.1.1)中的状态向量,称为可变参数。变参数 t 是不可
第十一章 状态空间模型和卡尔曼滤波
State Space Models and Kalman Filter
上世纪60年代初,由于工程控制领域的需要,产生了卡 尔曼滤波 (Kalman Filtering)。进入70年代初,人们明确提出 了状态空间模型的标准形式,并开始将其应用到经济领域。 80年代以后,状态空间模型已成为一种有力的建模工具。许 多时间序列模型,包括典型的线性回归模型和ARIMA模型都 能作为特例写成状态空间的形式,并估计参数值。在计量经 济学文献中,状态空间模型被用来估计不可观测的时间变量: 理性预期,测量误差,长期收入,不可观测因素(趋势和循 环要素)。状态空间模型在经济计量学领域其他方面的大量 应用请参见 Harvey(1989)和 Hamilton(1994) 。
当一个模型被表示成状态空间形式就可以对其应用 一些重要的算法求解。这些算法的核心是Kalman滤波。 Kalman滤波是在时刻 t 基于所有可得到的信息计算状态 向量的最理想的递推过程。Kalman滤波的主要作用是: 当扰动项和初始状态向量服从正态分布时,能够通过预测 误差分解计算似然函数,从而可以对模型中的所有未知参 数进行估计,并且当新的观测值一旦得到,就可以利用 Kalman滤波连续地修正状态向量的估计。
1
§11.1 状态空间模型的定义
状态空间模型一般应用于多变量时间序列。设 yt 是包含 k 个经济变量的 k1 维可观测向量。这些变量与 m1 维向
量 t 有关,t 被称为状态向量。定义“量测方程”
(measurement equation) 或称“信号方程”(signal equation)
为
yt Ztαt dt ut , t 1, 2,,T
(11.1.1)
其中:T 表示样本长度,Zt 表示 km 矩阵,称为量测矩阵,
dt 表示 k1 向量,ut 表示 k1 向量,是均值为0,协方差矩
阵为
Ht
的连续的不相关扰动项,即
E(ut ) 0 var(ut
)
Ht
(11.1.2)
2
一般地,t 的元素是不可观测的,然而可表示成一阶马
尔可夫(Markov)过程。下面定义转移方程(transition equation)
量测方程: yt (1, 0) t
(11.1.10)
状态方程:
t
0 0
1 0
t
1
1
t
(11.1.11)
这种形式的特点是不存在量测方程噪声。
5
例11.2 二阶自回归模型AR(2)
yt 1 yt1 2 yt2 ut , t 1, 2 , , T (11.1.14)
其中:E(ut) = 0,var(ut) = 2,cov(ut , ut-s) = 0, 考虑两个可能的
观测变量,必须利用可观测变量 yt 和 xt 来估计。假定变
参数 t 的变动服从于AR(1) 模型(也可以简单地扩展为 AR(p) 模型),扰动向量 ut , t 假定为相互独立的,且服 从均值为0,方差为 2和协方差矩阵为 Q 的正态分布。
9
§11.2 卡尔曼滤波 (Kalman Filtering )
表示为当前的和过去的 ut 和 t 及初始向量 0 的线性组
合,所以模型是线性的。
4
例11.1 一阶移动平均模型MA(1)
yt t t1 , t 1, 2 , , T
(11.1.9)
其中:E(t )=0,var(t)= 2,cov(t , t-s)=0, 通过定义状态向量 t =( yt ,t )可以写成状态空间形式
在例11.1的MA(1)模型中的参数 { , 2} 和例11.2的AR(2)模 型中的参数 { 1, 2, 2} 是未知的,这些参数将通过 向
量表示,并被称为超参数(hyperparameters)。超参数确定 了模型的随机性质,在 ct 和 dt 中出现的参数仅影响确定性的 可观测变量和状态的期望值。在状态空间模型中可以引入外 生变量作为解释变量,也可以引入 yt 的延迟变量,这些都可 以放到 dt 中去。如果 ct 或 dt 是未知参数的一个线性函数,这 些未知参数也可以作为状态变量或者超参数的一部分元素。
或称状态方程(state equation)为
αt Ttαt1 ct Rtεt , t 1, 2,,T (11.1.3)
其中:Tt 表示 mm 矩阵,称为状态矩阵,ct 表示 m1 向量,
Rt 表示 mg 矩阵,t 表示 g1 向量,是均值为0,协方差矩阵
为 Qt 的连续的不相关扰动项,即
E(εt ) 0
状态空间形式( k=1, m=2 )是
yt (1, 0)αt
(11.1.15)
αt
2
yt yt
1
12
换一种形式
yt (1, 0)αt
01αt
1
10
ut
αt
yt yt
1
11
2
0
αt1
1
0
ut
(11.1.16)
(11.1.17)
6
系统矩阵 Zt ,Ht ,Tt ,ቤተ መጻሕፍቲ ባይዱt ,Qt 可以依赖于一个未知参数 的集合。状态空间模型的一个主要的任务就是估计这些参数,