当前位置:文档之家› 第7章 随机系统最优控制

第7章 随机系统最优控制



1 GQ' 2 0
τ >0 τ =0 τ <0
2. 系统状态的随机型性能指标 仍考虑系统 x(t) = A(t)x(t) + G(t)w(t)
及其初始状态
(7-4-10’) (7-4-11’) (7-4-13)
x(t0 ) = x0
(7-4-14)
由于 x(t)是在白噪声 w(t)作用下动力学系统的响应,是一个随机过程,如果采用与确定 性二次型性能指标相同的表示方法,即
(7-4-2)
其中 x(t)是 n 维随机状态向量;x0 是 n 维随机初始状态向量,其统计性能为
E[x(t0 )] = E[x0 ] = µ0
(7-4-3)
Var[x(t0 )] = E{[x0 − µ0 ][x0 − µ0 ]T } = Px (t0 ) = Px0
(7-4-4)
w(t)是 m 维零均值高斯白噪声过程,统计性能为 Cov[w(t), w(τ )] = E[w(t)w(τ )T ] = Q'(t)δ (t −τ )
(7-4-7’) (7-4-8’)
APx + Px AT + GQ'GT=0
iii’) x(t)的协方差阵为
(7-4-9’)
Px (τ ) = Φ(τ )Px Px (−τ ) = PxΦ T (τ )
τ

0

iv’) x(t +τ ) 与 w(t)的协方差阵为
Φ(τ )GQ'
Pxw

)
=
(7-4-5)
其中
δ
(t
−τ
)
=

1 ε
,
τ

ε 2
<
t

+
ε 2
,为狄拉克
δ
函数;Q’(t)为动态噪声
w(t)的协方差矩阵。
0 , t 等于其他值
并设 x(t0)与 w(t)无关,即
Cov[x(t0 ), w(τ )] = E{[x(t0 ) − µ0 ][w(t) − Ew(t)]T
xT (t f
)Pt f
x(t f
)
+
1 2
t f xT (t)Q(t)x(t)dt
t0
(7-4-15)
则 Js 就无法象确定性系统那样是一个确定数值,而是一个随机变量。要求得确定性的性
能指标数值,需要考虑用 Js 的数学期望
∫ J
=
EJ s
=
E{1 2
x T (t f
)Pt f
x(t f
Cov[x(t0 ), w(τ )] = E{[x(t0 ) − µ0 ][w(t) − Ew(t)]T } = 0
随机状态反馈调节器问题为寻求最优控制 u*(t),使随机二次型性能指标
∫ J
=
E{1 2
xT
(t
f
)Pt f
x(t
f
)
+
1 2
tf [xT (t)Q(t)x(t) + uT (t)R(t)u(t)]dt}
∫ J
=
1 2
µ0T P(t0 )µ0
+
1 2
Tr
{
tf t0
G(t)Q'(t)GT (t)P(t)dt}
(7-4-26)
以上讨论表明,随机系统的性能指标总是大于相应的确定性系统性能指标,(7-4-21)式
中右边的后两项分别是由于初始状态的随机性和系统的随机干扰而产生的。
3. 随机状态反馈调节器
考虑随机干扰作用下或系统本身存在随机误差时系统的动力学模型 x(t) = A(t)x(t) + B(t)u(t) + w(t)
(7-4-23)
当 w(t) ≠ 0,Q’(t) ≠ 0,系统初始状态为零均值随机变量,即有 Ex(t0 ) = Ex0 = µ0 = 0 ,
Var[x(t0 )] = Px (t0 ) ,则有
∫ J
=
1 2
Tr {Px
(t0
)P(t0
)
+
t f G(t)Q'(t)GT (t)P(t)dt}
t0
(7-4-24)
相同维数方阵),则上式可改写为
∫ J
=
1 2
Tr {Px
(t0
)P(t0
)
+
t f G(t)Q'(t)GT (t)P(t)dt}
t0
其中,P(t)必须满足矩阵微分方程 P(t) + P(t) A(t) + AT (t)P(t) + Q(t) = 0
以及终值条件
(7-4-18) (7-4-19)
Px (t f ) = Pt f
τ

0

(7-4-10)
其中 Φ(t + τ , t) 为系统(7-4-1)的状态转移矩阵。
iv) x(t + τ ) 与 w(t)的协方差阵为
Φ(t + τ ,t)G(t)Q'(t)
Pxw
(t
+
τ
,
t)
=

1 G(t)Q' 2 0
(t
)
τ >0 τ =0 τ <0
(7-4-11)
对于定常随机系统
x(t) = Ax(t) + Gw(t) x(t0 ) = x0
(7-4-12)
当其具有与上述相同的噪声统计性能时,x(t)的统计性能有类似于上面公式的表达式。
当 t → ∞ 时 Px (t) → P ,有
i’) x(t)的均值满足矩阵微分方程
d [Ex(t)] = AEx(t) + GEw(t) dt E[x(t0 )] = µ0 ii’) x(t)的方差阵满足矩阵代数方程
7.2 滤波的稳定性问题
1.稳定性的基本概念 2.系统的一致完全能观性和一致完全能控性 3.滤波稳定性定理 4.定常系统滤波稳定性
7.3 连续系统 Kalman 滤波
1.问题提法 2.滤波公式推导方法
7.4 随机系统最优控制
随机系统最优控制的表现形式主要有两种,一种是基于输入输出模型的最小方差控制,
+
d dt
[Px
(t ) P(t )]]dt

[Px
(t
f
)P(t
f
)

Px
(t0
)P(t0
)]}
∫ =
1 2
Tr {Px
(t0
)P(t0
)
+
tf t0
[Px
(t
)Q(t
)
+
Px
(t
)
P (t
)
+
Px
(t
)
P(t
)]dt}
将 x(t)的方差阵 Px (t) 满足的(7-4-9)式代入上式,并注意到 Tr [MN ] = Tr [NM ](M、N 为
)+
1 2
t f x T (t)Q(t)x(t)dt}
t0
(7-4-16)
作为性能指标。其中 Pt f 为终值项加权矩阵,Q(t)为积分项加权矩阵,均为对称半正定矩阵。 此式可以考虑表示为另外一种形式。 首先假定 E[x(t0 )] = µ0 = 0 。 令 Px' (t0 ) = E[x0 x0T ] ,表示 对 x0 x0T 取均值, 则 此时有
(7-4-17)
∫ 在 上 式 右 边 加 上 一 项
1{ tf 2 t0
d dt
[Px
(t)P(t)]dt

[Px
(t
f
)P(t
f
)

Px
(t0
)P(t0
)]}
=
0
,并令
Px (t f ) = Pt f ,则上式可表示为
∫ J
=
Tr
{1 2
Px
(t
f
)Pt f
+1 2
tf t0
[ Px
(t )Q(t )
Px' (t0 ) = Px (t0 ) = Px0 。
n
∑ 再考虑 x0T x0 = Tr [x0 x0T ] ,其中Tr [ A] = ai ,表示对 n×n 维方阵 A 的对角线元素 ai 求 i =1
和。则有
∫ J
=
1 Tr{2
Px (t f
)Pt f
+1 2
tf t0
Px (t)Q(t)dt}
的性能指标变大了。
证明:
先证明确定性系统的一个预备定理:设确定性系统 x(t) = A(t)x(t) + B(t)u(t)
(7-4-30)
x(t0 ) = x0 和性能指标
(7-4-31)
∫ J
=
1 xT 2
(t
f
)Fx(t
f
)
+
1 2
t f [xT (t)Qx(t) + uT (t)Ru(t)]dt
(7-4-27)
x(t0 ) = x0
(7-4-28)
其中 x(t)为 n 维状态向量,w(t)为 n 维零均值高斯白噪声向量,u(t)为 m 维控制向量;
E[x(t0 )] = E[x0 ] = µ0 , Var[x(t0 )] = E{[x0 − µ0 ][x0 − µ0 ]T } = Px (t0 ) = Px0 ; Cov[w(t), w(τ )] = E[w(t)w(τ )T ] = Q'(t)δ (t −τ ) ;
相关主题