当前位置:文档之家› 最优控制变分法

最优控制变分法


AB



x2 x1
1 y ' 2 dx
通过A,B两点的函数若为 y f (x) ,则不同的函数有不同的 弧长,即弧长是 y 的函数,记为 J ( y ) ,即
x2 1 y 2 dx J ( y ) AB x1

因此,求弧长的定积分是一种变换,它把x1与x2之间各点相应 的y变换为标量(弧长)。由此例可以看出定积分为泛函。 以下是各章经常要用到下列形式的目标函数
级数展开后的线性主部,而 o(y ) 就是Taylor级数 展开的各高阶项之和。即
ˆ ) J ( y ) [ Fyy Fy 'y ']dx J(y
x0
x1
(1—1)
1 x1 [ Fyy (y ) 2 2 Fyy 'yy ' Fy ' y ' (y ' ) 2 ]dx 2 x0
| [ ( Fy Fy ) ' (F y ' Fy ' )]dx | | |dx
x0 x0
x1
x1
[| (Fy Fy ) | | ' ( F y ' Fy ' ) |]dx
x0
x1
2 ( x1 x0 )
说明这一项为高阶无穷小。代入
ˆ) ห้องสมุดไป่ตู้J ( y) J(y
x1
F
x1 x0
y
F y dx
( F y F y ) '( F y' F y ' ) dx x0
F
x1 x0
y
F y dx o ( y , y ')
第一章

变分法
1.1 泛函 1.2变分的推演 1.3Euler方程 1.4向量情形 1.5有约束的情形 1.6端点可变情形 1.7变分的另一种定义
1.1 泛函
(1)定义(泛函)
泛函是一映射L : J K , J Y , Y为一向量空间, K 一般为实数 域R或复数域C。 这说明泛函是一种变换,它把向量空间Y中某一子集J 映射为 K的某个子集。 例:曲线的弧长 在xy平面上过A(x1 ,y1),B(x2,y2)两点之间的曲线弧长公式为
max( d 0 , d 1 )
必有 所以
ˆ y | , | y ˆ ' y ' | |y
ˆ y | | ( y 2 ) y || ( y ) y || y
ˆ ' y ' | | ( y ' 3 ' ) y ' || ( y ' ) y ' || y
(3)定义(n级ε邻区和泛函求极值)
ˆ ( x) 为中心,由 ( x ) 和 ( x ) 以函数 y
ˆ ( x) 构成的带状 (ε为无穷小量),称为函数 y
的ε邻区。若有另一个函数 y F ( x),
ˆ 和 y 的零级距离落入ε邻区内,称该邻区为零级 y
则称泛函有极小值。 该定义说明泛函极小值存在的充分条件为
ˆ )J ( y ) 0. J(y
同样泛函极大值存在的充分条件为:
ˆ )J ( y ) 0; J(y
1.2 变分的推演
考虑如下泛函求极值问题 x1 J ( y ) F ( x, y ( x), y( x))dx x0 式中,F 为 x, y ( x), 及 y ( x ) 的函数。 虽然以下的推演可以推广到目标函数中具有高阶导数的情 况,但在自动控制中都是用一阶的状态向量方程描写系统 的,因此目标函数中通常不出现二阶以上的高阶导数 。 设极值曲线为 y ˆy ˆ ( x), 可取曲线为 y y ( x ).
因此
ˆ) J 2 J 3J J ( y) J ( y
从全局极值看, 当 J ( y ) J ( y ˆ ) 0 时有全局最小,当
ˆ ) 0 时有全局最大。从局部极值看,y 落入 y J ( y) J ( y ˆ
的n级

ˆ )与J ( y ) 十分接近,因此, 邻区内, J ( y

x1 x0
F y y F y ' y ' dx o ( y , y ')
式中,采用了变分记号。
y 的一次变分
y 的一次变分
ˆ y y y
ˆ ' y ' y ' ' y
受上式的启发,看到 F y y F y ' y ' 是 F ( x, y, y' ) 用Taylor
因此,定义泛函的一次变分为
J

x1
x0
[ F y y F y ' y ' ] dx
定义泛函的二次变分定义为
1 x1 J [ F yy ( y ) 2 2 F yy ' y y ' F y ' y ' ( y ' ) 2 ]dx 2 x0
2
注意,泛函的二次变分并不等于对泛函的一次变分再取 一次变分。
邻区。N 级
邻区的定义可以类推。
所谓泛函求极值就是:
ˆ ( x), 寻找 y F ( x) 使 y 落入 设存在极值曲线 y
ˆ的n级 y

邻区内,则 y F ( x ) 就是所求的极值曲线。
(4)定义(泛函的极值)
设 J ( y ) 为泛函,y为规定的区域内可以取的曲线
ˆ 为极值曲线。若 J ( y ˆ ) J ( y ) (简称可取曲线),y
式中, 0 1 1, 0 2 1, 0 3 1 利用多元函数的中值定理,
F ( x, y , y ) F ( x, y , y ') Fy ( x, y 2 , y 3 ) ' Fy ' ( x, y 2 , y 3 )
J 0
为局部极值存在的必要条件;而
2 J 0 为局部极值存在极小的充分条件,
2 J 0 为局部极值存在极大的充分条件。
1.3 EULER方程
泛函求极值
min J ( y )
y
x1
x0
F ( x , y ( x ), y ' ( x )) dx
泛函极值存在的必要条件为 J 0 由式(1—1),得泛函极值存在的必要条件为
注意x无增量,故缺一项。书写为方便起见,令
Fy Fy ( x, y 2 , y 3 ), Fy Fy( x, y 2 , y 3 )
代入,
x1 ˆ ) J ( y ) [ F ( x, y , y ) F ( x, y, y ')]dx J(y x0 x1 [ Fy ( x, y 2 , y 3 ) Fy( x, y 2 , y 3 )]dx x0 x1 [ Fy Fy]dx x0 x1 x1 [ Fy Fy ' ]dx [ ( Fy Fy ) ( Fy Fy)]dx x0 x0
d max(d 0, d1)
d max(d 0, d1, d 2)
………………
dn
max | F(n) (x) G(n) (x) |, x [a,b]
d max( d 0, d 1, d 2., dn )
称 为 n级 距 离
该定义说明在闭区间[a,b]内,两条曲线纵坐标的差取绝 对值(因距离总为正),并从所有绝对值中找出最大的作 为零级距离。如果零级距离很小,表示两条曲线很靠近。 但是零级距离小并不能保证两条曲线形状相同,因此还要 看一阶导数,二阶导数……,n阶导数是否接近。由于一 级距离是从d0,d1取出最大的一个形成的,所以一级距离 小就表示两条曲线的距离很近。对于二级距离,……,n 阶距离的解释可以类推。
J [ x ( t f ), t f ]

tf
t0
( x ( t ), u ( t ), t ) dt
x(t) 为状态向量, t f 为终时, 式中,t为时间, t0为开始时间,
和 都是标量函数。 u(t ) 为控制向量, x(tf ) 为状态向量终态。
上式中,第一项

把向量 x(t f ) 及 t f 变换为标量,的确为泛函
以下计算第二个积分,实际上是估计余项。 按泛函求极值的
ˆ 与 y 的一级距离应落入ε邻区内(由于本节的泛函 定义, y
只对 y 与 y’提出要求,故只用到一级距离),即令
ˆ y| d 0 max | y
x [ x 0 , x1 ]
ˆ ' y ' | d 1 max | y
x [ x 0 , x1 ]
ˆ 和 y 的差用 表示,则 若 y
ˆ ( x) y ( x) ( x), y
ˆ 和 y 的差是不同的 显然 是x的函数,因为不同 x 时 y ˆ ( x) ( x), 最后结果是一样的)。 (当然也可以令 y ( x) y
移项,得 求导,得
ˆ y y
ˆ y y
| Fy ' Fy ' || Fy ' ( x, y 2 , y 3 ) Fy ' ( x, y , y ) | 2
其中,=max( 1, 2)。上两式无非说明对于连续函数,自 变量的增量为无穷小时,函数的增量也为无穷小。 由于和的绝对值小于等于绝对值的和,故
若 F(x, y, y)对 x 的一阶偏导数 Fx , F ( x, y , y ) 对 y 的一阶偏导数
相关主题