非线性/非高斯滤波讲义L ECTURE N OTES ON N ONLINEAR N ON-G AUSSIAN F ILTERING(第0.3版)张永安哈尔滨工业大学航天学院电话:150********;Email:zhangyongan76@2012年3月符号表∼:随机变量(向量)x具有概率分布密度函数()p x。
x p x()Pr()x:x取某值的概率。
∼:x服从均值为x、自协方差阵为P的高斯分布密度函数。
(;,)x N x x Pexp()x:x的指数函数,也可写作x e。
第一章 最优滤波的一般描述1.1 预备知识z 符号表示:()x p x ∼:随机变量(向量)x 具有概率分布密度函数()p x ; Pr()x :x 取某值的概率;(;)x N x x P ∼:x 服从均值为x 、自协方差阵为P 的高斯分布密度函数;exp()x :x 的指数函数,也可写作x e 。
z 估计(Estimation ):从受到各种噪声和干扰影响的信号中按一定准则提取有用信号的过程。
z 估计器(Estimator ):用作估计的算法。
z 估值(Estimate ):被估计量经估计后得到的真实值的估计值。
z 决策(Decision ):从一组离散的物理量中选取其中一个的估计过程。
z 滤波(Filtering ):估计动态系统当前状态的过程。
z 导航(Navigation )等运动状态信息。
z 跟踪(Tracking ):通过遥测的方法估计运动体的状态信息。
引理1:分块矩阵求逆 给定11122122P P P P P ⎡⎤=⎢⎥⎣⎦则其逆阵为11122122T T T T T ⎡⎤=⎢⎥⎣⎦其中()()111111122221112211122221112111222121222111T P P P P T P P P P V P P TV P P T −−−−−−⎧=−⎪⎪⎪=−⎨⎪=−⎪=−⎪⎩引理2 矩阵逆引理 设,A C 可逆,则()1111111()A BCD A A B DA B C DA −−−−−−−+=−+若用1A −代替A ,1C −代替C ,则()1111()A BC D A AB DAB C DA −−−−+=−+1.2 高斯随机向量的概率特征n 维随机向量n x ∈ 可以由其概率分布函数()F x 或者概率分布密度函数()p x 来表征,若其具有分布密度函数()p x ,则()()xF x p x dx −∞=∫x 也可以由其特征函数来决定,x 的特征函数为其概率分布密度函数的傅里叶变换:()()()TTnjx jx x E e e p x dx ωωφω=∫ ,()1()()2T njx x np x ed ωφωωπ−=∫顾名思义,高斯随机向量的概率分布为高斯分布(也称多维正态分布)。
定义: (1) 随机向量x 具有高斯分布密度函数:()()1121(;,)2exp 2T xxxx x N x x P P x x P x x π−−⎡⎤=−−−⎢⎥⎣⎦∼ 其中x Ex ,()()Txx P E x x x x ⎡⎤−−⎣⎦(2) 随机向量x 具有如下形式特征函数:()1()exp 2Tjx T T x xx E e jx P ωφωωωω⎡⎤==−⎢⎥⎣⎦其中x Ex ,()()Txx P E x x x x ⎡⎤−−⎣⎦1.3 高斯向量的基本性质性质1 高斯向量的线性变换仍然是高斯向量。
也就是,若(;,)xx x N x x P ∼,z Ax =,m n A ×∈ ,rank A m =,则~(;)zz z N z z P ,且Tzzxx z AxP AP A =⎧⎨=⎩ 证明:()()()()1exp ()()21exp ()()2T TTTjz j Ax z z x jx A T x x T T T T T xx T T T xx E eE e E e A jx A A P A j Ax AP A ωωωφωφωωωωωωω⎡⎤==⎣⎦⎡⎤==⎣⎦⎡⎤=−⎢⎥⎣⎦⎡⎤=−⎢⎥⎣⎦性质2(作为性质1的推论):高斯向量的线性组合仍然是高斯向量。
也就是:若1x 与2x 是联合高斯的,12,n x x ∈ ,且11111122122222;,x x x P P N P P x x x ⎧⎫⎡⎤⎡⎤⎡⎤⎡⎤⎪⎪⎨⎬⎢⎥⎢⎥⎢⎥⎢⎥⎪⎪⎣⎦⎣⎦⎣⎦⎣⎦⎩⎭∼ 则其线性组合1122z A x A x =+也是高斯的,其中12,m n A A ×∈ ,12rank rank A A m ==,11111122122222;,x x x P P N PP x x x ⎧⎫⎡⎤⎡⎤⎡⎤⎡⎤⎪⎪⎨⎬⎢⎥⎢⎥⎢⎥⎢⎥⎪⎪⎣⎦⎣⎦⎣⎦⎣⎦⎩⎭∼ 则~(;)zz z N z z P ,且11221111112222112222T T T Tzz z A x A x P A PA A P A A P A A P A =+⎧⎨=+++⎩ 特别的,若12n A A I ==,则1211122122zz z x x P PP P P =+⎧⎨=+++⎩ 证明:112212TT Tz A x A x M x x =+⎡⎤=⎣⎦这里[]12M A A =然后利用性质1。
性质3 若TTTy x z ⎡⎤=⎣⎦为高斯向量,则给定z 的条件下,x 的分布也是高斯分布,也就是;,xxxz zx zz P P x x x N PP z z z ⎧⎫⎡⎤⎡⎤⎡⎤⎡⎤⎪⎪⎨⎬⎢⎥⎢⎥⎢⎥⎢⎥⎪⎪⎣⎦⎣⎦⎣⎦⎣⎦⎩⎭∼ 则()|(|);),xx z p x z N x x z P =,其中;,xx xz zx zz P P x x x N P P z z z ⎧⎫⎡⎤⎡⎤⎡⎤⎡⎤⎪⎪⎨⎬⎢⎥⎢⎥⎢⎥⎢⎥⎪⎪⎣⎦⎣⎦⎣⎦⎣⎦⎩⎭∼ 其中11|ˆ()()xz zz xx z xx xz zz zxx z x P P z z P P P P P −−⎧=+−⎪⎨=−⎪⎩ 证明:可逆分块矩阵xxxz zxzz P P P P P ⎡⎤=⎢⎥⎣⎦的逆阵为11xxxz xxxz zxzz zx zz PP T T P P P T T −−⎡⎤⎡⎤==⎢⎥⎢⎥⎣⎦⎣⎦其中()()11111111xxxx xz zz zxxz xx xz zz xx xz zzzx zz zx xx zz zx xx zz zzzx xx xz T P P P P T P P T T P P T T P P P P T T P P P P −−−−−−−−⎧=−⎪⎪=−=−⎪⎨=−=⎪⎪=−⎪⎩ 证明一:设x xz zξη⎧−⎨−⎩ ()()()()()()()()()12121112exp (,)2|1()2exp 211exp 22T xxyy T zz zz T T yy zz P y y P y y p x z p x z p z P z z P z z c y y P y y z z P z z ππ−−−−⎡⎤−−−⎢⎥⎣⎦==⎡⎤−−−⎢⎥⎣⎦⎡⎤=−−−+−−⎢⎥⎣⎦定义()()()()()11111112()T Tyy zz T TT yy zz xx xz T T T zz zxzz T T T T T xx zx xz zz zz zx xx xz T T T T xx zx xz zx xx xz Tzx xxq y y P y y z z P z z T P T T P T T T T T T T T T T T T T T T T T T T ξξηηηηξξηηηηξξξηηξηηηηξξξηηξηηξη−−−−−−−=−−−−−⎡⎤⎡⎤=−⎢⎥⎣⎦⎣⎦⎡⎤⎡⎤⎡⎤=−⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦=+++−−=+++=+()111()(xx zx xx Txz zz xx xz zz T T x x P P z z T x x P P z z ξη−−−+⎡⎤⎡⎤=−−−−−−⎣⎦⎣⎦因此,在给定z 的条件下,x 的条件分布为高斯分布:|ˆ~(),xx z x N x z P ⎡⎤⎣⎦其中111ˆ()()xz zz zz xx xx xz zz zxxz x P P z z P T P P P P −−−⎧=+−⎪⎨==−⎪⎩证明二:构造新的变量()1xz zz s x P P z z −=−−后面请同学们补充上。
定义 系统称为是线性高斯系统,若它是线性系统,且初始状态和输入信号满足高斯假设:1k k k k kk k k kx A x B w z C x v −=+⎧⎨=+⎩ 其中000ˆ~(,)~(,)~(,)k k k kk k x N xP w N q Q v N r R ⎧⎪⎨⎪⎩ 以下不作说明时,都假定0,,k k x w v 相互独立。
例 给定如上离散时间线性高斯系统,记{}1:1121,,,k k z z z z −−给定1k −时刻1k x −的概率分布密度()11:1|k k p x z −−,试求k x 的条件概率分布密度()1:|k k p x z 。
1.4 估计的基本概念1.4.1 参数估计问题引出参数估计问题 设参数n x ∈ 未知,现用某传感器测量该参数,传感器输出m z ∈ 为()z h x v =+其中m v ∈ 为测量误差,它为一随机变量,一般可以通过实验的方法确定其统计特性,因此这里设()p v 已知。
现给定参数x 的k 个测量12,,,k z z z ,()i i z h x v =+记{}1::1,2,,k k j z z j k Z = ,估计问题就是要寻找一个关于1:k z 的函数1:1:ˆˆ()(,)k k xz x k z 使得ˆx在某个准则意义上给出x 的最佳近似。
定义估计误差: ˆxx x =− 区分测量残差与测量误差两个概念,给定()ˆ()z h x vz h x ε=+⎧⎨=+⎩则v 为测量误差,是未知量;ε为测量残差,在x 的估计值ˆx 给出后,ε是已知的。
1.4.2 估计方法估计方法与所掌握的先验信息与使用的概率模型有关。
因此首先介绍一下概率模型。
1. 概率模型(1)非贝叶斯模型 (Non-Bayesian Model) 若在估计前没有任何关于状态的先验信息时,估计只能利用测量所提供的信息,给定k 个测量1:k z 后,可以有似然函数来表征:1:()(|)Z k x p z x Λ=如果这些测量是相互独立的,则1:1()(|)(|)kZ k i i x p z x p z x =Λ==∏进一步,若测量误差服从高斯分布,也就是~(;,)i i i i v N v r R则有[][]111()det(2)exp ()()2kT Z i i i i i x R z h x r R z h x r π−=⎧⎫Λ=−−−−−⎨⎬⎩⎭∏。