离散系统的极小值原理
u * (k ) = 0.2
x* (k ) = 1 − 0.2k
k = 0,1, 2,3, 4,
总结 应用离散欧拉方程求解等式约束和不等式约束 的离散极值问题比较麻烦,而用离散极小值原理处 理这种约束问题却很方便。特别是,当控制序列受 约束时,离散变分法不再适用,只能用离散极小值 原理或离散动态规划来求解离散极小值问题。
2 离散极小值原理
庞特里亚金发表极小值原理时,只讨论了连续系 统的情况。为了获得离散系统的极小值原理,有 人曾经从离散系统与连续系统比较接近这一事实 出发,设想把连续极小值原理直接推广到离散系 统中去,但除了采样周期足够小的情况外,结果 是失败的。 离散极小值原理的普遍论述比较复杂,证明过程 也十分冗长。为了简单起见,下面介绍控制向量 序列不受约束情况下的离散极小值原理,然后不 加证明地推广到控制向量序列受约束的情况。
因为: ∂Lk = λ (k + 1)
∂x(k )
∂Lk = u (k ) + λ (k + 1) ∂u (k )
∂Lk −1 = −λ ( k ) ∂x(k )
所以由离散欧拉方程(3-6)可得:
λ ( k + 1) = λ ( k ) = c
u ( k ) = −λ ( k + 1) = −c
其中 c为待定的常数。 将 u (k ) = −c 代入状态差分方程,有
离散极小值原理可以叙述如下: 定理3 [定理3-7] (关于离散系统末端状态受约束) [定理3-8] (关于离散系统末端状态自由) 定理3
[定理3-7] 定理3 7](关于离散系统末端状态受约束) 设离散系统状态方程
x(k + 1) = f [ x(k ), u (k ), k ]
k = 0,1,L , N − 1 x(0) = x0
离散最优控制问题中,性能指标取为如下:
J = ∑ L [ x (k ), u ( k ), x (k + 1), k ] = ∑ Lk
k =0 k =0
k
N −1
N −1
(3-2)
式中 L = L [ x(k ), u(k ), x(k + 1), k ] 是第 k 个采样周期 内性能指标 J 的增量。
x (k + 1) = x (k ) − c
用迭代法求解上述差分方程,有:
x (1) = x (0) − c
x (2) = x (1) − c = c(0) − 2c
M
x( k ) = x(0) − kc
代入已知边界条件 x(0) = 1, x(5) = 0 ,解得:
c = 0.2
因此,该离散系统的最优控制与最优轨线 分别为:
λ (2) = 2 x(2) λ (1) = 2( x(1) + x(2)) λ (0) = 2( x(0) + x(1) + x(2))
因此: u (0) = − x(1) − x(2)
u (1) = − x(2) u (2) = 0
根据状态方程
∂u (k )
[定理3-8] 定理3 8](关于离散系统末端状态自由) 设离散系统状态方程
x(k + 1) = f [ x(k ), u (k ), k ]
k = 0,1,L , N − 1 x(0) = x0
性能指标
J = ϕ [ x( N ), N ] + ∑ L [ x(k ), u ( k ), k ]
H x* (k ), u * ( k ), λ (k + 1), k = min H x* (k ), u (k ), λ ( k + 1), k u ( k )∈Ω
(3-17) 若控制变量不受约束,即u (k )可以在整个控制空 间 R m中取值,则极值条件为 ∂H (k ) (3-18) =0
式中 ψ (•) ∈ R r , r ≤ n
若 u * (k )是使性能指标(3-9)为最小的最优控 x 制序列,* (k )是相应的最优状态序列,则必存 在 r 维非零常向量 γ 和 n 维向量函数 λ (k ) ,使 u (k ) 、 * ( k ) 和 λ ( k ) 满足如下必要条件: x 得
(3-5)
……
可得离散泛函极值的必要条件:
∂Lk −1 ∂Lk ∂x(k ) + ∂x(k ) = 0 ∂Lk =0 ∂u (k )
(3-6)
以及
∂Lk −1 ∂Lk −1 δ x( N ) + δ x(0) = 0 ∂x (k ) k =N ∂x( k ) k =0
4
则原泛函在状态差分方程等式约束下的条件极 小问题化为广义泛函的无条件极小问题。这时:
1 2 Lk = u (k ) + λ ( k + 1) [ − x(k + 1) + x(k ) + u (k ) ] 2
1 2 Lk −1 = u ( k − 1) + λ (k ) [ − x(k ) + x(k − 1) + u (k − 1) ] 2
② x(k ) 和 λ ( k )满足边界条件
ψ [ x( N ), N ] = 0
∂ϕ [ x( N ), N ] ∂ψ T [ x( N ), N ] λ(N ) = γ + ∂x( N ) ∂x( N )
x(0) = x0
(3-14) (3-15) (3-16)
③ 离散哈密顿函数对最优控制 u * (k ) 取极小值
k =0 N −1
ϕ 式中 f (•) 、 (•) 和 L(•) 都是其自变量的连续可微函 u u x( 数,k) ∈Rn , (k ) ∈ R m 。控制有不等式约束: (k ) ∈ Ω , 其中 Ω 为容许控制域。末端状态 x( N ) 自由。
x 若 u * (k )是使性能指标为最小的最优控制序列, (k ) 是相应的最优状态序列,则必存在 n 维向量函 x 数 λ ( k ) ,使得 u* (k ) 、 * (k )和 λ ( k )满足如下必要条件:
k =0 N −1
(3-4)
当不考虑式(3-1)所示的等式约束时,为了求得上 述离散拉格朗日问题的极值解,对式(3-4)取离散 一次变分:
T T ∂L T ∂Lk ∂Lk k δ J = ∑ δ x( k ) + δ u (k ) + δ x(k + 1) k = 0 ∂x ( k ) ∂u (k ) ∂x(k + 1) N −1
*
①x(k ) 和λ ( k ) 满足下列差分方程
x(k + 1) = ∂H ( k ) ∂λ (k + 1)
λ (k ) =
∂H (t ) ∂x( k )
式中离散哈密顿函数
H (k ) = H [ x(k ), u (k ), λ (k + 1), k ]
= L [ x(k ), u (k ), k ] + λ T (k + 1) f [ x(k ), u (k ), k ]
② x(k )和 λ ( k )满足边界条件
x(0) = x0 ∂ϕ [ x( N ), N ] λ(N ) =
∂x( N )
③离散哈密顿函数对最优控制取极小值
H x* (k ), u * (k ), λ (k + 1), k = min H x* (k ), u (k ), λ (k + 1), k u ( k )∈Ω
(3-8) (3-9)
性能指标
J = ϕ [ x( N ), N ] + ∑ L [ x(k ), u ( k ), k ]
k =0 N −1
ϕ 式中 f (•) 、 (•) 和 L(•) 都是其自变量的连续可微函 u u x( 数,k) ∈Rn , (k ) ∈ R m 。控制有不等式约束: (k ) ∈ Ω , 其中 Ω 为容许控制域。末端状态受下列等式约束限 制: ψ [ x( N ), N ] = 0 (3-10)
设式(3-1)和式(3-2)构成的离散最优控制 问题存在极值解,记为x* (k )和 u (k ) ,则在极值解 附近的容许轨线和容许控制可以表示为
*
x ( k ) = x* ( k ) + δ x ( k ) u (k ) = u * (k ) + δ u (k ) x(k + 1) = x* (k + 1) + δ x(k + 1)
1 离散欧拉方程
当控制序列不受约束时,可以采用离散变分法求 解离散系统的最优控制问题,得到离散极值的必 要条件——离散欧拉方程。 设描述离散系统的状态差分方程为:
x(k + 1) = f [ x(k ), u (k ), k ]
(3-1)
式中 x(k ) 是离散时刻 tk 的 n 维状态;u (k ) 是 tk 的 m f 维控制向量; (•)是 n 维向量函数序列,对于等间 N 隔采样, = kT , 为采样周期; 为数据窗口长度。 T k
极小值原理
离散系统的极小值原理
目录
离散欧拉公式 离散极小值原理
随着数字计算机日益普及,计算机控制系统日 益增多,因此,离散系统最优控制问题的研究 显的十分重要,其原因是,一方面许多实际问 题本身就是离散的,另一方面,即时实际系统 是连续的,但为了对连续系统采用计算机控制, 需要把时间整量化,从而得到一离散化系统。
*
① x(k )和λ ( k ) 满足下列差分方程
x(k + 1) = ∂H ( k ) ∂λ (பைடு நூலகம் + 1)
(3-11) (3-12)