当前位置:
文档之家› 第七章极小值原理与典型最优控
第七章极小值原理与典型最优控
对于线性系统
(t ) A(t ) x(t ) B(t )u(t ) x x(t 0 ) x 0
LQR问题为
1 J x(t f ) 2
2 S
Min
u (t )
1 2
tf
t0
[ x(t )
2 Q (t )
u(t )
2 R (t )
]dt
S , Q 0, R 0
24
* (t ) K1 x(t ) K 2u * (t ) u u * (t0 ) u (t0 ) K1 S P21 , K 2 S P22
41
1
1
P A AT P PT S 1 P Q P 11 11 11 21 21 11 (T ) 0 P P A BT P PT S 1 P P 21 21 11 22 21 P21 (T ) 0
u * (t ) R B P x(t )
T
1
39
为下列代数Riccati方程的解 P A AT P P BR1BT P Q 0
P
或是Riccati微分方程的稳态解
(t ) P(t ) A(t ) AT (t ) P(t ) P P(t ) B(t ) R 1 (t ) B T (t ) Q(t ) P(T ) 0
tf
t0
(t )]}dt (t )[ f [ x(t ), u(t ), t ] x
T
6
定义标量函数
Hamilton 函数为
H [ x(t ), u(t ), (t ), t ] [ x(t ), u(t ), t ]
(t ) f [ x(t ), u(t ), t ]
P(t t ) P(t ) (t ) P lim t 0
取步长为负值,反向积分,即
P(t f ) P(t 0 )
34
P(t)的对称性,即
PT (t ) P(t )
所以P待求的元素个数为n(n+1)/2
35
•P(t)的半正定性
可以证明
但 故
1 T x (t0 ) P (t0 ) x(t0 ) 2
P lim P(t ,0, T )
T
40
PI调节器
1 T T T (t )]dt J [ x (t )Qx(t ) u (t ) Ru(t ) u (t ) Su Min 2 t0 u (t ) (t ) Ax(t ) Bu(t ) x s.t. x(t0 ) x0
tf
t0
T {H[ x(t ),u(t ), (t ),t ] (t ) x(t )}dt
9
如果 u 是最优控制律
对应于边界条件有
H [ x(t ), u(t ), (t ), t ] H [ x(t ), v(t ), (t ), t ], v
H x f ( x, u , t )
上述问题有解的条件:系统完全可控
u * (t ) R (t ) B (t ) P (t ) x(t )
T
37
1
P (t ) P(t ,0, ) lim P(t ,0, T )
T
T P(t ) P(t ) A(t ) A (t ) P(t )
P(t ) B(t ) R 1 (t ) B T (t ) Q(t ) P(T ) 0
为使H相对于所选择的u(t)尽可能小,必 T 须有: u (t ) B (t )
B T (t )
即u(t)取单位向量,
16
H (t ) x Ax(t ) Bu(t ) H T (t ) A (t ) x x(t0 ) x0 , x(t f ) 0 H [ x(t f ), (t f ), u (t f )] 1
H x
10
也可以写成
H [ x(t ), u (t ), (t ), t ] min H [ x(t ), v(t ), (t ), t ],
H x f ( x, u , t )
H x
v
11
满足边界条件
x(t 0 ) x 0
T
7
Hale Waihona Puke 特性指标为J [ x(t ), t ] t t
tf
t t f
0
(t )}dt {H[ x(t ),u(t ), (t ),t ] (t ) x
T t0
8
积分可得
J { [ x(t ), t ] (t ) x(t )
T
t t f t t0
J min
J min 0, 且t0为任意
P(t ) 0
36
•无限时间调节器问题
1 T T J [ x ( t ) Q ( t ) x ( t ) u (t ) R(t )u (t )]dt Min 2 t0 u (t ) (t ) A(t ) x(t ) B(t )u (t ) x s.t. x(t0 ) x0
2 2 2 2
1 u (t ) sign[ x1 (t ) x2 (t ) x2 (t ) ] 2
21
22
6.2 典型最优控制
主要内容
LQR问题 线性伺服机构 Bang-Bang 控制 奇异控制
离散系统最优控制
23
6.2.1 LQR(Linear Quadratic Regulator)问题
H 0 u(t ) R 1 (t ) BT (t ) (t ) u
A(t ) x B(t )u x
x(t 0 ) x 0
(t f ) Sx(t f )
26
确定闭环控制
假设 则得
(t ) P(t ) x(t )
T P(t ) P(t ) A(t ) A (t ) P(t )
17
如
MinJ t f s.t. 1 (t ) x2 (t ) x 2 (t ) u (t ) x
式中: u (t ) 1
18
H[ x(t ),u(t ), (t )] 1 1 (t ) x2 (t ) 2 (t )u(t )
(t ) 0 1 (t ) (t ) 2 1 1 (t ) c1 , 2 (t ) c2 c1t u sign(2 ) sign(c2 c1t ) x(t f ) 0
则逆Riccati方程为
1 (t ) A(t ) P 1 (t ) P 1 (t ) AT (t ) B(t ) R 1 (t ) BT (t ) P 1 1 P ( t ) Q ( t ) P (t ) P 1 (t ) S 1 f
32
•最优反馈控制结构
LQR问题的普遍性
LQR问题的提法具有普遍意义,不限于 哪种物理系统,而且人们证明这样的提 法易于获得解析解,最为可贵的是能获 得线性反馈解。 线性系统最优控制所的结果也适用于小 信号下运行的非线性系统,可以作为一 次近似 提供了一种统一的框架。
25
应用极小值原理
实现最优控制要求满足
H Q(t ) x(t ) AT (t ) (t ) x
N[ x(t f ), t f ] 0
N T H (t f ) ( )v, t t f t f t f
N T (t f ) ( )v, t t f x x
12
极小值原理与变分学
区别在于极值条件不同 极小值原理的极值条件是 Hamilton 函数
MinJ t f s.t. (t ) Ax(t ) Bu(t ) x x(t0 ) x0
式中:u (t ) U ,即 u (t ) 1
15
解:Hamiliton 函数为
T
H[ x(t ),u(t ), (t ),t ] (t )[ Ax(t ) Bu(t )]
u – m 维控制向量函数
容许控制
u Rm
- 是一给定的有界集合
假定终端时间 t f 满足 N[ x(t f ), t f ] 0
3
假设 f 对于 x , u 具有连续的偏导数
这种光滑性假定,对于任何分段连续的函数 u 保证了存在唯一的属于式(1)的容许轨线 x 可定义容许控制函数集合是这类分段连续的函数 并假定对于一个容许的 u 和给定的初始条件 , x(t 0 ) 在所考虑的控制区域内,式( 1)确定了一个唯一 的容许解
P(t ) B(t ) R 1 (t ) BT (t ) P(t ) Q(t ) P(t f ) S
27
dy 2 ( x ) y ( x ) y ( x) 在数学中,dx
称为
Riccati方程,所以(7)式也称为Riccati 方程
28
最优控制律为
令
K (t ) R 1 (t ) BT (t ) P(t )
主要内容
极小值原理
典型最优控制
1
6.1 极小值原理
极小值原理
研究最优控制问题的现代理论 对古典变分学的发展 一些文献中也被称为极大值原理 以 Bolza 问题为对象描述极小值原理