最优控制
1 (0) 2 (0)
AT
(1)
1 0.1
0 2000 1 100
2000 300
故
u(0) 10BT AT (0) 100
u(1) 10BT AT (1) 100
19
x(1)
1 0
0.1 1
1 0
00.1(100)
1 10
例 2-2 离散型线性调节器
时变系统
设离散系统的状态方程为
6
H (k) L[x(k),u(k), k] T (k 1) f [x(k),u(k), k]
实现最优控制的必要条件:
J 0
注意到 dx(N), dx(k), du(k)是任意的,dx(0)=0 可得:
(k) H (k)
x(k )
(N )
x(N )
k 0,1,2 N 1
(k) L f T (k 1)
2-2 离散系统的最小值原理
离散系统的最优控制问题:
✓实际系统本身就是离散的,这类系统的进程,是在逐 个离散的时刻按步实现的。
✓实际系统本身是连续的,但在用计算机进行最优控制 的计算和实际控制时,要把时间量化,以适应计算机 运算的需要,仍是离散化的最优控制问题。
介绍控制向量不受约束情况下离散系统的最小值原理。
x(k )
x(k) x(k)
(2-114)
并满足边界条件
x(0) x0
(2-115)
[x(N ), N ] 0 (N ) T v
x(N ) x(N )
(2-116) (2-117)
2)离散哈密顿函数对最优控制序列uˆ(k) 取极值:
H (k) 0 或 L f T (k 1) 0
13
寻找最优控制序列 u(k),使性能指标达极小值。
设P是n x n实对称方阵,V(x)=xTPx为由P所决定的二次型 函数,若V(x)>0,P称为正定,若V(x)>=0,P称为半正定。
20
解 写出哈密顿函数
H (k) 1 xT (k)Q(k)x(k) 1 uT (k)R(k)u(k)
2
2
T (k 1)[ A(k)x(k) B(k)u(k)]
k 0
取极小值,以实现最优控制的必要条件是:
(2-96) (2-97) (2-98)
8
1)状态向量序列 x(k)和协态向量系列(k) 满足下列差分方
程:
x(k 1) H (k) 或 x(k 1) f [x(k),u(k), k] (k 1)
(2-99)
(k) H (k) 或 (k) L f T (k 1)
u(0) u(1)
u(N-1)
x(0) x(1)
x(2) x(N-1)
x(N)
f
f
...
f
图 2-4
2
状态终端不受约束
问题 2-2 设离散系统的状态方程为
x(k 1) f [x(k),u(k), k]
其状态初值已知是
k 0,1,2 N 1
x(0) x0
寻找最优控制序列uˆ(k) ,k=0,1,…,N-1 使性能指标
x(k 1) A(k)x(k) B(k)u(k) k 0,1, N 1 (2-119)
其初态 x(0) x0已知。性能指标是二次型的,并用下式表示:
J 1 xT (N )F(N )x(N ) 2
1
N 1
[
xT
(k
)Q(k
)
x(k
)
uT
(k
)
R(k
)u(k
)]
2 k0
(2-120)
式中 R(k)是正定矩阵,F(N)和 Q(k)是半正定矩阵。
2
2
T (k 1)[ A(k)x(k) B(k)u(k)]
由控制方程 H (k) 0知
u (k )
R(k )u(k ) BT (k )(k 1) 0
于是
u(k ) R1(k )BT (k )(k 1)
(2-124)
把(2-124)式代入方程(2-119)
x(k 1) A(k)x(k) B(k)u(k)
4
k 0
为了寻找离散系统的最优解,和连续系统的情形相
仿,引进协态向量序列(k) ,k=1,2,…,N,则问题便化为 求广义性能指标:
J [x(N ), N ]
N 1
[
L[
x(k
),
u(k
),
k
]
T
(k
1){
f
[
x(k
),
u
(k
),
k
]
x(k
1)}]
(2-91)
k 0
的极小值。
定义离散的哈密顿函数序列:
k 0
取极小值,以实现最优控制的必要条件是:
12
(2-109) (2-110) (2-111) (2-112)
1)状态向量序列 x(k)和协态向量序列(k) 满足下列差分方
程:
x(k 1) H (k) 或 x(k 1) f [x(k),u(k), k] (k 1)
(2-113)
(k) H (k) 或 (k) L f T (k 1)
求出协态方程
(k) H (k) Q(k)x(k) AT (k)(k 1)
x(k )
(2-121) (2-122)
因状态终值无约束,故协态终值是
(N) F(N)x(N)
(N ) T v
x(N ) x(N )
(2-123)
(N) 1 xT (N)F(N)x(N)
21
2
H (k) 1 xT (k)Q(k)x(k) 1 uT (k)R(k)u(k)
1
离散系统的状态方程可以用非线性差分方程表示:
x(k 1) f [x(k),u(k), k]
k 0,1,2 N 1
(2-86)
式中x(k) 为 n 维状态向量序列,u(k) 为 m 维控制向量序列,
而 f 则是连续可微的 n 维向量函数,其相互关系如图 2-4
所示,图中x(0) 和x(N ) 分别表示状态的初值和终值。
0.101.1
0 1 1
0 0.01
0 0.1
故
18
x(2)
1 0
0.2 1
x1 x2
(0) (0)
Байду номын сангаас
0 0.01
0.01 1 (1) 0.202 (1)
代入 x(0)、x(2),整理得
0 0.01
0.01 0.20
1 (1) 2 (1)
1 0
解得
1 2
(1) (1)
2000 100
uˆ(0) ,uˆ(1) ,…,uˆ(N 1) 和相应的 N 个最优状态向量xˆ(1) ,
xˆ(2),…,xˆ(k) 以使(2-90)式表示的性能指标取极小值。
称uˆ(k) ,k=0,1,…,N-1 为最优控制
xˆ(k) ,k=1,2,…,N 为最优轨线
N 1
J [x(N ), N ] L[x(k),u(k), k]
N 1
J [x(N ), N ] L[x(k),u(k), k]
k 0
取极小值。
(2-88) (2-89) (2-90)
3
连续系统最优控制:
在时间区间[t0,t f ]上寻找最优控制uˆ(t) 和相应的最优轨 线xˆ(t) ,使性能指标取极小值。
离散系统最优控制:
在离散时刻 0,1,…,N-1 上寻找 N 个最优控制向量
x(k )
x(k) x(k)
(2-100)
其边界条件是
x(0) x0
(N )
x(N )
(2-101) (2-102)
2) 离散哈密顿函数对最优控制序列uˆ(k) 取极值,即
H (k) 0 或 L f T (k 1) 0
u (k )
u(k) u(k)
(2-103)
9
k=0,1,…,N-1
状态终端受约束
17
x(2) Ax(1) 10BBT AT (1) A2x(0) 10 ABBT (1) 10BBT AT (1)
由 x(2)可以求得(1) ,随之确定(0) 。
由于
A2
1 0
0.2 1
AT
1 0.1
0 1
10 ABBT 1010
01.100.10
0.1
0 0
0.01 0.10
10BBT AT 1000.10
1){
f
[x(k),u(k), k]
x(k
1)}]
(2-108)
k 0
的极小值。
把关系式(2-108)和(2-91)比较一下,可见它们之间的唯
一 差 别 , 是 (2-108) 式 中 添 加 了 一 个 反 映 终 态 条 件 的 项 vT [x(N ), N ]。如在定理 2-3 中凡出现[x(N ), N ]的地方,均 代之以[x(N ), N ]+vT [x(N ), N ] ,则定理 2-3 可移植到状态终
H (k ) L[x(k ),u(k ), k ] T (k 1) f [x(k ),u(k ), k ] k 0,1,2 N 1
(2-92)
5
则(2-91)式可写成
N 1
J [x(N ), N ] [H (k) T (k 1)x(k 1)]
(2-93)
k 0
把(2-93)式右边第二项进行简单变换,可得
值受约束的情形中来。
11
定理 2-4 设离散系统的状态方程是
x(k 1) f [x(k),u(k), k]
则为把状态 x(k)自初态
x(0) x0
转移到满足边界条件