当前位置:
文档之家› 哈工大现代控制理论基础第十一章最优控制.ppt
哈工大现代控制理论基础第十一章最优控制.ppt
h 和 v ,月球的重力加速度为常数 g,飞船的自身
质量及所带燃料分别为 M 和 F 。
设从 t 0时刻飞船开始进入软着陆过程,
以竖直向上为参考正方向, 可写出运动方程为
6
h v
v
f m
g
m kf
其中 k 为常数。
h(0) h0 控制飞船从初始状态为 v(0) v0
m(0) M F
0
s2
0
0
0
0
0 0 0 0 0 0
S
0
0
0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
19
上述性能指标的第一项表示末端时刻导弹与目标距 离的一种度量, 该距离常称为脱靶量; 第二项表示 控制过程消耗的能量。
20
11.1.2 最优控制的一般提法
设被控系统的状态方程及初始条件为
x(t) f (x(t), u(t),t) x(t0 ) x0 目标集为 M,求取一个容许控制 u(t) U , t [t0 , tf ]
tf L(x(t), u(t),t)dt
t0
其中 和 L 为连续可导的标量函数。
22
11.2 应用变分法求解无约束条件 的最优控制问题
11.2.1 泛函与变分
一. 泛函与泛函算子
所谓泛函,简单地说就是函数的函数,定义如下:
设 y(x)为给定的某类函数,如果对于这类函数中的
每一个函数,有某个数 J 与之相对应, 则称 J 为这类
第十一章 最优控制
目录
11.1 最优控制的一般提法 11.2 应用变分法求解无约束条件的最优控制 11.3 极小值原理 11.4 线性二次型最优控制问题 11.5 动态规划
1
11.1 最优控制问题的一般提法
最优控制研究的主要问题: 根据已建立的被控 对象的数学模型, 选择一个容许控制律, 使得被控 对象按照预定的规律运动,并使某一个性能指标达到 最大或最小。
x 面内的坐标, vd 表示导弹的速度, vd 与 轴的
夹角为 d , F表示导弹的侧向控制力。 如果用
表示推进剂秒流量, 可作为一个控制量, 则纵向
推力为 C , 其中 C 为常数。 设 Kd 表示导弹的
阻力因子, 且
Kd
1 2
C0 S
13
其中
C0
零升力阻力系数,可以看作是常数
大气密度,也可以看作是常数
F
16
令
x xm xd
y ym yd
则可得状态方程
x1 x6 cox6
sin m
x3
sin
x4
x3
1 x5
(Cu1
Kd x32 )
x4
u2 x3 x5
x5 u1
x6 0
17
这个问题可以归纳为:导弹从已知的初始状态
x(t0 ) x0 出发, 通过选择适当的控制律 (t) 及
[例2]
J m(tf )
空对空导弹拦截。 假定导弹与目标的运动
发生在同一平面, 即假设导弹能产生足够大的铅垂
方向的升力,以抵消其自身的重力; 假定导弹推力
方向与其速度方向一致, 目标常速、定航向飞行。
这种假定并非过分限制, 实际上,导弹按此种假设
9
下所形成的控制律飞行, 直至接收到关于目标下一 次新的测量为止,根据新的测量再形成新的控制律, 这样反复进行,直至击中目标。 当量测采样间隔充 分小时, 关于目标常速、定航向的假设离实际情况 相差并不太远。
从数学的观点来看, 最优控制问题是求解一类 带有约束条件的泛函极值问题, 属于变分学范畴。
2
经典的变分法只能解决控制无约束的问题, 即容许控制属于开集的一类最优控制问题。 然而, 工程中的控制常常是有约束的, 即容许控制是属于 闭集的。为了解决这个问题, 20世纪50年代,美国 学者贝尔曼和苏联科学院院士庞德里亚金分别独立 地拓展了经典变分法, 分别给出了动态规划方法和 极大值原理。 它们构成了最优控制的理论基础。
函数的泛函,记为 J J y(x)。
23
函数类 y(x) 称为泛函 J 的定义域。
[例3] 函数的定积分是一个泛函。设
1
J (x) 0 x(t)dt
3
11.1.1 最优控制问题的两个例子
[例1] 飞船的月球软着陆问题。 如图所示,飞船
靠其发动机产生一个与月球重力方向相反的推力 f ,
使得飞船到月球表面时速度为零, 即实现软着陆。
要求设计推力函数 f (t) ,使得发动机燃料消耗最少。
4
f
m
h mg
月球
5
[解]
m 设飞船的质量为 ,其高度和垂直速度分别为
F (t)(t0 t tf ) ,使得在末端时刻 tf 尽可能地接
近目标, 同时,尽可能地节省控制能量。
为此,取性能指标为
J xT (tf )Sx(tf )
tf uT (t)R(t)u(t)dt
t0
这里的 R(t) 和 S 均为对角线矩阵。
18
R(t)
r1(t)
0
0
r2
(t
)
s1 0 0 0 0 0
使受控系统由给定初始条件出发,在末端时刻 tf t0
将系统的状态转移到目标集 M, 并使性能指标 J
达到最小。 21
其中, 目标集 M可表示为
M x(tf ) x(tf ) Rn, g x(tf ),tf 0, h x(tf ),tf 0
性能指标 J 可表示为
J (x(tf ),tf )
7
到某一时刻 tf 实现软着陆,即
vh((ttff
) )
0 0
控制过程中,推力 f (t)不能超过发动机所能提供的
最大推力 fmax, 即 0 f (t) fmax
最优控制问题可以描述为: 在满足控制约束的条件
下,寻求发动机推力 f (t) ,使飞船的燃料消耗最小,
8
也就是使得 tf 时刻飞船的质量 m为最大, 即
S
导弹的参考面积
将 F 和 看作是两个独立的控制变量时, 导弹
的运动方程为
14
xd
vd
cos d
yd vd sin d
vd
1 m
(C
Kdvd2 )
d
1 vd
F m
m
15
取状态变量为
xT x1 x2 x3 x4 x5 x6 x y vd d m vm
取控制变量为
uT u1 u2
10
[解] 在上述假设下目标的运动方程为
xm vm cosm
ym
vm
sin m
vm 0
(xm , ym )
目标的位置坐标,
vm
目标的线速度,
m
x 目标运动方向与 轴的夹角,
11
y
vd
d
(xd , yd )
o
vm
m
(xm , ym )
x
12
设 m 为导弹的质量,(xd , yd )为导弹在坐标平