当前位置:
文档之家› 第五章用变分法求解最优控制问题
第五章用变分法求解最优控制问题
t
f
t0
t t0
f
vdu
J
d F F ( x dt x
F ) xdt x x
tf
(5-2)
t0
J取极值的必要条件是 J 等于零。因 x 是 任意的,要使(5-2)中第一项(积分项)为 零,必有
F x d dt ( F x ) 0
6、泛函的极值:若存在 0 ,对满足的 X X 一切X,J ( X ) J ( X ) 具有同一符号,则 称 J ( X ) 在 X X 处有极值。
*
*
*
处有极值的必要条件是对 于所有容许的增量函数 X (自变量的变分), 泛函 J ( X ) 在 X *处的变分为零
ˆ X (t ) X (t )
0 ,存在 0
时,就有
ˆ J (X ) J (X )
则称 J ( X ) 在
ˆ X
处是连续的。
3、线性泛函: 满足下面条件的泛函称为线性泛函
J X J X
J ( X Y ) J ( X ) J (Y )
(5-3)
上式称为欧拉——拉格朗日方程。
(5-2)式中第二项为零的条件要分两种情况来讨论:
1、 固定端点的情况
这时 以 x (t
F x
tf
x ( t 0 ) x 0 , x ( t f ) x f ,它们不发生变化,所
0
) x (t f ) 0
。而(5-2)中第二项可写成
J
t t0
f
F x ( t ), x ( t ), t dt
(5-1)
* * x x (t )、(t ) 在极值曲线 x ( t )、 ( t ) 附 x 为此,让自变量函数
近发生微小变分 x、 x ,即
x (t ) x (t ) x (t )
*
* x (t ) x (t ) x (t )
tf t0
T
( t ) f ( X , U , t ) X dt
(5-17)
于是有约束条件的泛函 J 的极值问题化为无约 束条件的增广泛函 J a 的极值问题。 再引入一个标量函数
H ( X , U , , t ) F ( X , U , t ) f ( X , U , t ) (5-18)
J X ( t f ), t f
tf t0
F X ( t ), U ( t ), t dt
(5-14)
*
这是综合指标。我们要求出最优控制 U ( t )和满足状 态方程的极值轨迹 X
*
( t ),使性能指标取极值。
在下面的讨论中,假定初始时刻 t 0和初始状态 X ( t ) X 是给定的,终端则可能有几种情况。我们 将就几种常见的情况来讨论,即 t f 给定, ( t f ) 自 X 由和 t f 自由, X ( t f ) 属于一个约束集。
0 0
5.3.1 终端时刻 t f 给定,终端状态 X ( t )自由
f
将状态方程(5-13)写成等式约束方程的形式
f ( X , U , t ) X (t ) 0
(5-15)
与有约束条件的函数极值情况类似,引入待定的n 维拉格朗日乘子向量函数
( t ) 1 ( t ), 2 ( t ), , n ( t )
时)
例5-1
求通过点(0,0)及(1,1)且使
J
1
(x
0
2
2 x ) dt
取极值的轨迹
x ( t )。
*
解 这是固定端点问题,相应的欧拉——拉格朗日方 程为 d
2x (2 x) 0 dt
即
x 0 x
它的通解形式为
x ( t ) Acht Bsht
式中:
F x 1 F F x 2 X F x n
(5-11)
横截条件为(自由端点情况)
F 0 X
(当 t t 0 和 t
tf
T
(5-16)
与以前不同的是,在动态问题中拉格朗日乘子 向量 (t ) 是时间函数。 在最优控制中经常将 (t ) 称为伴随变量,协态(协状 态向量)或共轭状态。引入 (t ) 后可作出下面的增 广泛函
J a X ( t f ), t f
F X , U , t
x 容易验证 x ( t ) 0 时, J 0 对应局部极小; ( t ) 2 t 时, J 4 27 ,对应局部极大。 3
5.3 有约束条件的泛函极值 ——动态系统的最优控制问题
前面讨论泛函极值问题时,对极值轨迹 X ( t ) 没有附 加任何约束条件。但在动态系统最优控制问题中, 极值轨迹必须满足系统的状态方程,也就是要受到 状态方程的约束。考虑下列系统
0
f
(
F x
) t t f x (t f ) 0
(5-5) (5-6)
(
F x
) t t0 x (t 0 ) 0
因为这里讨论 x (t ) 是标量函数的情况,x ( t ) 和 x ( t f ) 也是标量,且是任意的,故(5-5)、(5-6)可化 为
于是泛函J 的增量 J 可计算如下(以下将*号省去)
J
t t0
f
F x
x , x x , t F x , x , t dt
tf t0
F F 2 2 x x o ( x ) , ( x ) d t x x
*
1 0
2 3 ( x x ) dt
x (0) 0
*
取极值的轨迹 没有限制。
x ( t ) ,并要求
,但对
x (1)
*
解 这是终端自由的情况。欧拉—拉格朗日方程为
d dt (2 x 3 x ) 0
2
即
2x 3x
2
常数
于是 x 是常数,x 则是时间的线性函数,令
第五章 用变分法解最优控制 —泛函极值问题
本章主要内容
变分法基础 5.2 无约束条件的泛函极值问题 5.3 有约束条件的泛函极值——动态系 统的最优控 t f 制问题 5.4 小结
5.1
在动态系统最优控制问题中,性能指标是一个 泛函,性能指标最优即泛函达到极值。解决泛函极 值问题的有力工具是变分法。所以下面就来列出变 分法中的一些主要结果,大部分不加证明,但读者 可对照微分学中的结果来理解。
5.1 变分法基础
先来给出下面的一些定义。 1、泛函: 如果对某一类函数X (t )中的每一个函 数 X (t ),有一个实数值J 与之相对应,则称J 为依赖于 函数 X (t )的泛函,记为
J J X (t )
粗略来说,泛函是以函数为自变量的函数。
2、泛函的连续性: 若对任给的 当
T
它称为哈密顿(Hamilton)函数,在最优控制中 起着重要的作用
于是 J a 可写成
J a X ( t f ), t f
H ( X , U , , t )
tf t0
T
X 这里 是实数, 和
Y
是函数空间中的函数。
4、自变量函数的变分: 自变量函数 X (t ) 的变分 X X 是指同属于函数类 X (t ) 中两个函数X ( t ) 、 ( t ) 之差
1
2
X X 1 (t ) X 2 (t )
这里, t 看作为参数。当 X (t ) 为一维函数时,X 可用图5-1来表示。
J
tf t0
F ( X , X , t ) dt
(5-9)
式中
x1 (t ) x 2 (t ) X x n (t )
x1 (t ) x 2 (t ) X n (t ) x
X X
*
定理: ( X ) 在 J
J ( X , X ) 0
*
为了判别是极大还是极小,要计算二阶变 分 J 。但在实际问题中根据问题的性质容易 判别是极大还是极小,故一般不计算 J 。
2
2
5.2 无约束条件的泛函极值问题 5.2.1 泛函的自变量函数为标量函数的情况
为简单起见,先讨论自变量函数为标量函数 * x (t ) x (t ) (一维)的情况。我们要寻求极值曲线 , 使下面的性能泛函取极值
cht e e
t t
sht e
t t
2
2
由初始条件 x ( 0 ) 0 ,可得A=0。 再由终端条 件
x (1) 1
,可得 B
1 sh 1,
因而极值轨迹为
x ( t ) sht sh 1
*
例5-2 求使指标
J
*
X f X ( t ), U ( t ), t
(5-13)
U 式中,X (t ) 为 n 维状态向量, (t ) 为m 维控制向量(这 里假定U ( t )不受限制.
否则不能用变分法求解,而要用极小值原理或动态 规划法求解, f X ( t ), U ( t ), t 是n维连续可微的向量 函数。性能指标如下:
上式中 o [( x )
2
, ( x ) ]是高阶项。
2
(泰勒级数展开)
根据定义,泛函的变分 J 是 J 的线性