当前位置：文档之家› 第二节最讲义优化原理与动态规划

第二节最讲义优化原理与动态规划

3
3 B3 3
C1 3 T
4 C2
2.状态(state)、状态变量和可能状态集 (1)状态与状态变量。表示每个阶段开始所处的自然状况或客观条件。
2 Q4
3
A1 7 4
6 4 A2 2 4
4 2
A3 5
B1 1 4
6 B2
3
3 B3 3
C1 3 T
4 C2
(2)动态规划维数。 (3)可能状态集：用S(sk)表示。
所取决策必是Q→ A1→ B2→ C2→T，全程长度
是13。
A1 7
B1 1
2
4 6
4
C1 3
Q4 3
4 A2 2
4
4 2
6 B2
3 3
T 4 C2
A3 5
B3 3
◆全枚举法计算工作量将会十分庞大。 ◆局部最优求出的解不一定是最优解。
3.动态规划方法就是从终点逐段向始点方向寻找最短路线的方法。解题步骤如下： ●把问题划分为几个阶段。 ●按阶段顺序首先考虑最后阶段如第四阶段的最优决策，也就是走哪条路线最短。 ●按阶段顺序依次考虑第三、第二，第一阶段的最优决策，为此只需确定每一阶段上各初始点的最优决策即可。
表示某种运算，可为加、减、乘、除、开方等。
◆常见有:
n
Vk,n vi (si , xi ) ik
和
n
Vk,n vi (si, xi ) ik
7.最优指标函数：fk(sk)
fk(sk)op V k,nt,k1 ,2,,n
相应的子策略称为sk状态下的最优子策略，记为pk*(sk) ；而构成该子策略的各段决策称为该过程上的最优决策，记为
从上阶段的某一状态值到下阶段某一状态值的转移规律成为状态转移律
s k 1 T ( s k ,x k ( s k ) ) x k s k 或简写为 sk1T(sk,xk)
6.指标函数
(1)阶段指标函数(也称阶段收益)（是对应某一阶段状态和从该状态出发的一个阶段的决策的某种效益度量。）vk(sk,xk) 简记为vk 。
第二节最优化原理与动态规划
精品
一、动态规划方法导引
1.全枚举法或穷举法。共有18条可能路线，进行比较，求得最优路线Q→ A3→ B1→ C1→T。
2 Q4
3
A1 7 4
6 4 A2 2 4
4 2
A3 5
B1 1 4
6 B2
3
3 B3 3
C1 3 T
4 C2
2.“局部最优路径”法：选择当前最短途径， “逢近便走”。
(2)过程指标函数(指标函数)。(它所包含的各阶段指标函数的函数。） Vk,n(sk,xk, sk+1,xk+1,…, sn,xn)。简记为Vk,n 。
◆动态规划求解的问题的过程指标函数(指标函数)，必须具有关于阶段指标的可分离形式(和、积或其他形式) ：
V k,n V k,n (sk,x k,sk 1 ,x k 1 ,,sn ,x n ) v k(sk,x k) v k 1 (sk 1 ,x k 1 ) v n (sn ,x n )
3
3 B3 3
C1 3 T
4 C2
4.策略和子策略(Policy)
（1）全过程策略指具有n个阶段全部过程，简称策略。表示为 {x1(s1),x2(s1),…,xn(sn)}。
k后部子过程策略,表示为pk(xk)
2 Q4
3
A1 7 4
6 4 A2 2 4
4 2
A3 5
B1 1 4
6 B2
3
3 B3 3
8. 概念的关系。
决策xk(sk)
决策xk+1(sk+1)
状态阶段k 状态阶段k+1 状态
sk
T(sk,xk) sk+1 T(sk+1,xk+1) sk+2
vk(sk,xk)
vk+1(sk+1,xk+1)
四、最优化原理与动态规划的数学模型 1. 最优化原理 (贝尔曼最优化原理) 若某一全过程最优策略为：
阶段1
阶段2
4,C1 B1 1 4
7,C2 6
B2 3
6,C1 3 B3 3
3,T C1 3
4,T 4
C2
0，T
T
阶段3
阶段4
最短路径：Q→ A3→ B1→ C1→T
三、动态规划的基本概念。
1.阶段(stage)和阶段变量。把所给问题恰当地划分为若干个相互联系又有区别的子问题，称之为多段决策问题的阶段。
C1 3 T
4 C2
(2)允许策略集合记作P。
最优策略:从允许策略集中，找出的具有最优效果的策略。
2 Q4
3
A1 7 4
6 4 A2 2 4
4 2
A3 5
B1 1 4
6 B2
3
3 B3 3
C1 3 T
4 C2
5.状态转移方程(状态转移律) ：多阶段决策过程的发展就是用阶段状态的相继演变来描述的。
4 2
A3 5
B1 1 4
6 B2
3
3 B3 3
C1 3 T
4 C2
(2)决策变量:xk=xk(sk) 决xk(策sk)变∈量Dk(xskk()s允k) 的许允决许策决集合策实集际用是Dk决(sk策) 表的示约, 束条件。
2 Q4
3
A1 7 4
6 4 A2 2 4
4 2
A3 5
B1 1 4
6 B2
xk (sk)x,k 1(sk 1),,xn (sn) 有 p k ( s k ) { x k ( s k )x k 1 , ( s k 1 ) ,, x n ( s n )k } 1 ,2 , ,n 简记为 p k { x k ,x k 1 , ,x n } k ,1 ,2 , ,n
◆用动态规划方法逐段求解时，每个阶段上的求优方法基本相同，而且比较简单，每一阶段的计算都要利用上一阶段的计算结果，因而减少了很多计算量。阶段数愈多，这种效果愈明显。
二、动态规划解题标号法：
11,A3 2 Q4 3
11,B1 ,B2
A1 7 4
8,B1
6 4
A2 2
4
8,B1 4 2
A3 5
2 Q4
3
A1 7 4
6 4 A2 2 4
4 2
A3 5
B1 1 4
6 B2
3
3 B3 3
C1 3 T
4 C2
3.决策(decision)、决策变量和允许决策集合
(1)决策。表示当过程处于某一阶段的某个状态，可以作出不同的决定（选择），从而确定下一阶段的状态。
2 Q4
3
A1 7 4
6 4 A2 2 4
2 Q4
3
Hale Waihona Puke A1 7 46 4 A2 2 4
4 2
A3 5
B1 1 4
6 B2
3
3 B3 3
C1 3 T
4 C2
用以描述阶段的变量叫作阶段变量，一般以 k表示阶段量．
阶段数k的编号法有两种：
(1)顺序编号；(2)逆序编号法。
2 Q4
3
A1 7 4
6 4 A2 2 4
4 2
A3 5
B1 1 4
6 B2

e商务文档

第二节最讲义优化原理与动态规划

相关文档推荐：