当前位置:文档之家› 最优控制 第五章 用变分法求解连续最优控制问题—有约束条件的泛函极值

最优控制 第五章 用变分法求解连续最优控制问题—有约束条件的泛函极值

第五章 用变分法求解连续 最优控制问题 —有约束条件的泛函极值 有约束条件的泛函极值
上节讨论没有约束条件的泛函极值问题。 上节讨论没有约束条件的泛函极值问题。但在 最优控制问题中,泛函 所依赖的函数总要受到受控 最优控制问题中,泛函J所依赖的函数总要受到受控 系统状态方程的约束。 系统状态方程的约束。解决这类问题的思路是应用 拉格朗日乘子法, 拉格朗日乘子法,将这种有约束条件的泛函极值问 题转化为无约束条件的泛函极值问题。 题转化为无约束条件的泛函极值问题。
[
]
所示。 例1:有系统如图 所示。欲使系统在 内从状态 :有系统如图1所示 欲使系统在2s内从状态
θ (0) 1 ω(0) = 1 转移到 θ(2) 0 ω(2) = 0 ,使性能泛函
1 2 2 。 J = ∫ u (t ) dt → m ,试求 in 试求u(t)。 2 0
& f [x(t ), u(t ), t] − x(t ) = 0
应用拉格朗日乘子法, 应用拉格朗日乘子法,构造增广泛函
(5-3)
& J ′ = ∫ L[x(t ), u(t ), t] + λT (t )[ f [x(t ), u(t ), t] − x(t )] dt
tf t0
{
}
式中λ(t)——待定的 维拉格朗日乘子矢量。 待定的n维拉格朗日乘子矢量 式中 待定的 维拉格朗日乘子矢量。
λ(t f ) = 0
若始端和终端都固定时, 若始端和终端都固定时,δx(t0)=0,δx(tf)=0则以 , 则以
x(t0 ) = x0
x(t f ) = x f
作为两个边界条件。 作为两个边界条件。
(5-15) (5-16)
实际上,上述泛函极值的必要条件, 实际上,上述泛函极值的必要条件,亦可 由式(5-6)写出欧拉方程直接导出。 写出欧拉方程直接导出。 由式 写出欧拉方程直接导出 即
(5-18)
N x(t f ), t f = 0
式中N——q维向量函数,n≥q。 维向量函数, 式中 维向量函数 。
[
]
(5-19)
性能泛函
J = Φ x(t f ), t f + ∫ L[x(t ), u(t ), t]d t
tf t0
[
]
(5-20)
其中Φ、 都是连续可微的数量函数 都是连续可微的数量函数, 其中 、L都是连续可微的数量函数,tf是待求 的终端时间。 的终端时间。 最优控制问题是寻求控制矢量u , 最优控制问题是寻求控制矢量 *(t),将系统从 初态x(t 转移到目标集 转移到目标集N[x(tf), tf]=0上,并使 取极小。 取极小。 初态 0)转移到目标集 上 并使J取极小
λ1 = C1 λ2 = −C1t + C2
u = C1t − C2 1 3 1 2 x1 = C1t − C2t + C3t + C4 6 2 1 2 x2 = C1t − C2t + C3 2
4个积分常数 1, C2, C3, C4由4个边界条件 个积分常数C 个积分常数 个边界条件
x1 (0) = 1, x2 (0) = 1, x1 (2) = 0, x2 (2) = 0
定义纯量函数
H[x, u, λ, t] = L[x, u, t] + λ f [x, u, t]
T
(5-4)
为哈密尔顿函数。 称H[x,u,λ,t]为哈密尔顿函数。则 为哈密尔顿函数
′ = ∫ H[x, u, λ, t] − λT x dt & J
tf t0
{
}
(5-5) (5-6)
或 式中
& J ′ = ∫ H[x, x, u, λ, t]d t
这个方程是在假设δu为任意,控制 这个方程是在假设 为任意,控制u(t)取值 为任意 取值 不受约束条件下得到的。如果u(t)为容许控制, 不受约束条件下得到的。如果 为容许控制, 为容许控制 的约束, 变分不能任意取值 变分不能任意取值, 受到 u(t ) ∈U 的约束,δu变分不能任意取值,
∂H 那么, 不成立, 那么,关系式 = 0不成立,这种情况留待极 ∂u
*
x1 *(t) t
0.5
1 * x2 (t)
1.5
2
比较上述结果可见,即使是同一个问题, 比较上述结果可见,即使是同一个问题, 如果终端条件不同,其最优解也不同。 如果终端条件不同,其最优解也不同。
二、波尔札问题
设系统状态方程
& x(t ) = f [x(t ), u(t ), t]
初始状态x(t0)= x0,终始状态 f)满足 终始状态x(t 满足 初始状态
T
由欧拉方程, 由欧拉方程,得
& ∂H d ∂H 0 0λ1 λ1 − = λ + & = 0 & ∂x dt ∂x 1 0 2 λ2
& λ1 = 0 ⇒ & λ2 = −λ1
λ1 ∂H d ∂H − = u + [0 1] = 0 & ∂u dt ∂u λ2
T T T t0
tf
tf t0
将上式代入式(5-5),得 , 将上式代入式
J ′ = ∫ H[x, u, λ, t] + λ x dt − λ x
tf T T t0
{
}
tf t0
(5-8)
相对于最优控制u 及最优轨线 设u(t)和x(t)相对于最优控制 *(t)及最优轨线 和 相对于最优控制 的变分为δu和 ,计算由δu和 引起的 u*(t)的变分为 和δx,计算由 和δx引起的 的变分为 J´的变分为: 的变分为:
u(t)
ω(t)
1s
θ(t)
1s
x1
x2
解:系统状态方程及边界条件为
0 1 0 & x= x + 1u 0 0 1 0 x(0) = , x(2) = 1 0
由式(5-7),得 , 由式
0 1 2 T 0 1 & & H = L + λ [ f − x] = u + λ x + 1u − x 2 0 0
tf t0
& & H[x, x, u, λ, t] = L[x(t ), u(t ), t] + λ (t ){ f [x(t ), u(t ), t] − x(t )}
T
(5-7)
对式(5-5)右边第二项作分部积分,得 右边第二项作分部积分, 对式 右边第二项作分部积分

tf
t0
& & − λ x dt = ∫ λ x dt − λ x
x(t) u(t) (2,2,5) 2 1 0 -1 -2 u*(t) -3 x2*(t) 0.5 1 7/6 1.5 2 t x1 (t)
*
例2:设问题同例 。但将终端状态改为 :设问题同例1。但将终端状态改为θ(2)=0, , ω(2)自由,即终端条件改成部分约束、部分自 自由,即终端条件改成部分约束、 自由 重求u 、 由。重求 *(t)、x*(t)。 。
于是得
u (t ) = 6t −12 3 3 9 2 * x1 (t ) = t − t + t +1 16 8 9 2 9 * x2 (t ) = t − t +1 16 4
*
u*(t)和x*(t)的图像见图 。 的图像见图3。 和 的图像见图
x(t) u(t) 2 1 0 -2 -4 -6 u (t) -8 -10
解得
7 C1 = 3, C2 = , C3 = 1, C4 = 1 2
因此, 因此,最优解为
7 u (t ) = 3t − 2 1 3 7 2 * x1 (t ) = t − t + t +1 2 4 3 2 7 * x2 (t ) = t − t +1 2 2
*
最优控制u 及最优轨线 及最优轨线x 如图 所示。 如图2所示 最优控制 *(t)及最优轨线 *(t)如图 所示。
在这类极值问题中, 在这类极值问题中,要处理两种类型的等式约 一是微分方程约束,一是终端边界约束。 束。一是微分方程约束,一是终端边界约束。根据 拉格朗日乘子法,要引入两面两个乘子矢量, 拉格朗日乘子法,要引入两面两个乘子矢量,一个 是n维λ(t),另一个是 维µ,将等式约束条件泛函 维 ,另一个是q维 , 极值化成无约束条件泛函极值问题来求解。 极值化成无约束条件泛函极值问题来求解。
⇒{u = −λ2
∂H d ∂H 0 1 0 & − = x + 1u − x = 0 & ∂λ dt ∂λ 0 0
& x1 = x2 ⇒ & x2 = u
5个未知数 1, x2, λ1, λ2, u,由5个方程联立求得通解 个未知数x 个未知数 , 个方程联立求得通解
正则方程及控制方程与例1完全相同 完全相同, 解 正则方程及控制方程与例 完全相同,只是 边界条件改成 t = 0时 x1 (0) = 1, x2 (0) = 1,t = 2 时
x1(2) = 0, λ2 (2) = 0,代入例1的通解中可确定积分 代入例 的通解中可确定积分
常数: 常数:
9 18 C1 = , C2 = , C3 = 1, C4 = 1 8 8
[
]
J = ∫ L[x(t ), u(t ), t]d t
tf t0
(5-2)
寻求最优控制u(t),将系统从初始状态x(t0)=x0 ,将系统从初始状态 寻求最优控制 转移到终端状态x(t ,并使性能泛函J取极值 取极值。 转移到终端状态 f),并使性能泛函 取极值。
将状态方程式(5-1)写成约束方程形式 写成约束方程形式 将状态方程式
相关主题