当前位置:文档之家› 动态规划问题

动态规划问题

需指出:动态规划是求解某类问题的一种方 法,是考察问题的一种途径,而不是一种算法。 必须对具体问题进行具体分析,运用动态规划的 原理和方法,建立相应的模型,然后再用动态规 划方法去求解。
2020/5/22
动态决策问题的特点: 系统所处的状态和时刻是进行决策的重要因
素; 即在系统发展的不同时刻(或阶段)根据系
第一节 动态规划问题
§1.1 多阶段决策问题 §1.2 动态规划问题举例
§1.1 多阶段决策问题
所谓多阶段决策问题是指一类活动过程,它可以分为 若干个相互联系的阶段,在每个阶段都需要作出决策。 这个决策不仅决定这一阶段的效益,而且决定下一阶 段的初始状态。
每个阶段的决策确定以后,就得到一个决策序列, 称为策略。多阶段决策问题就是求一个策略,使各阶 段的效益的总和达到最优.
q1 Q1(x1) q2 Q2 (x2 )
决策
决策
状态 1
状态
2 状态 状态
x1 S1 R1(x1, q1) x2 T1(x1, q1)
决策
n
n
opt{ Rk (xk , qk )}
k 1
2020/5/22
§1.1 多阶段决策问题
动态规划是用来解决多阶段决策过程最优化 的一种数量方法。其特点在于,它可以把一个n 维决策问题变换为几个一维最优化问题,从而一 个一个地去解决。
g=g(u1)
这时,机器的年完好率为a,即如果年初完好机器 的数量为u,到年终完好的机器就为au, 0<a<1。
2020/5/22
机器负荷分配问题
在低负荷下生产时,产品的年产量h和投入生产 的机器数量u2的关系为
h=h(u2)
相应的机器年完好率b, 0< b<1。 假定开始生产时完好的机器数量为s1。要求制定
5 A
3
1 B1 3
6
8 B2 7
6
C1 6 8
3 C2 5
3 C3 3
84 C4
2 D1
2
D2 1 2
3 D3
3
E1 3
5 5 E2 2
6 6
E3
F1 4
G 3 F2
1
2
2020/5/22
3
4
5
6
不包含时间因素的静态决策问题(本质上是一次 决策问题)也可以适当地引入阶段的概念,作为多 阶段的决策问题用动态规划方法来解决。
4 . 线性规划、非线性规划等静态的规划问题也可 以通过适当地引入阶段的概念,应用动态规划方法 加以解决交通网络图如下,其中 两点之间的数字表示距离(或花费),试求从A点到 G点的最短距离(总费用最小)。
生产决策问题
某工厂生产某种季节性商品,需要作下一年度的 生产计划,假定这种商品的生产周期需要两个 月,全年共有6个生产周期,需要作出各个周期 中的生产计划。设已知各周期对该商品的需要 量如下表所示:
周期 1 2 3 4 5 6
需求量 5 5 10 30 50 8
2020/5/22
生产决策问题
假设这个工厂根据需要可以日夜两班生产或只是日班生产, 当开足日班时,每一个生产周期能生产商品15个单位,每生 产一个单位商品的成本为100元。当开足夜班时,每一生产 周期能生产的商品也是15个,但是由于增加了辅助性生产设 备和生产辅助费用,每生产一单位商品的成本为120元。由 于生产能力的限制,可以在需求淡季多生产一些商品储存起 来以备需求旺季使用,但存储商品是需要存储费用的,假设 每单位商品存储一周期需要16元,已知开始时存储为零,年 终也不存储商品备下年使用,问应该如何作生产和存储计划, 才能使总的生产和存储费用最小?
2020/5/22
生产决策问题(续)
2020/5/22
生产决策问题(续)
5
f
(xi )
112000xxii
,0
xi 15 300,15
xi
30
2020/5/22
§1.2 动态规划问题举例
2. 机器负荷分配问题:某种机器可以在高低两种 不同的负荷下进行生产。在高负荷下进行生产时, 产品的年产量g和投入生产的机器数量u1的关系为
一个五年计划,在每年开始时,决定如何重新分配 完好的机器在两种不同的负荷下生产的数量,使在 五年内产品的总产量达到最高。
2020/5/22
3. 航天飞机飞行控制问题:由于航天飞机的运 动的环境是不断变化的,因此就要根据航天飞机飞 行在不同环境中的情况,不断地决定航天飞机的飞 行方向和速度(状态),使之能最省燃料和实现目 的(如软着落问题)。
决策 状态 状态
1
决策 2 状态 状态
决策 n
2020/5/22
§1.2 动态规划问题举例 多阶段决策问题的典型例子:
1 . 生产决策问题:企业在生产过程中,由于需求 是随时间变化的,因此企业为了获得全年的最佳生 产效益,就要在整个生产过程中逐月或逐季度地根 据库存和需求决定生产计划。
2020/5/22
统所处的状态,不断地做出决策; 找到不同时刻的最优决策以及整个过程的最
优策略。
2020/5/22
多阶段决策问题: 是动态决策问题的一种特殊形式; 在多阶段决策过程中,系统的动态过程可以按照 时间进程分为状态相互联系而又相互区别的各 个阶段;
每个阶段都要进行决策,目的是使整个过程的 决策达到最优效果。
相关主题