当前位置：文档之家› 管理运筹学-动态规划

管理运筹学-动态规划

4 5
14
5 8 4
18
13
22
7
36
5
28
8
23
6
11
6
38
5
30
9
17
7
10
3
8
12
8
第7章
7
6
6
4
动态规划
7.3
7.3. 2 资源分配问题
离散确定型典例
例3 某厂为扩大生产能力，拟定购某种成套设备4~6套,以分配给
其所辖三个分厂使用。预计各分厂分得不同套数的设备后每年创造的
利润如下表所示。该厂应订购几套设备并如何分配，才能使每年预计创利总额最大？
积函数
和函数
6
fk(sk,xk) = vi(si,xi)
i= k
n n
fk(sk,xk) = vi(si,xi)
i= k
第7章
动态规划
7.2
七、最优解
基本概念
(1) 最优指标函数 fk*(sk) = opt {fk(sk, pk(sk))}, k=1,2,…,n pk∈Pk (2) 最优策略能使上式成立的子策略pk*称为最优子策略，记为 pk* (sk) = { xk*(sk),… ,xn*(sn)} 特别当k=1时,称为最优策略，记为 p1* (s1) = { x1*(s1),… ,xk*(sk),… ,xn*(sn)} (3) 最优决策构成最优策略的决策称为最优决策，记为xk*。 (4) 最优值：最优策略对应的最优指标 f *1
xk∈Xk
k = n, n-1, …, 2, 1
积
f*n+1(sn+1) = 1 f*k(sk) = opt {vk(sk,xk) ×fk+1*(sk+1)}
xk∈Xk
k = n, n-1, …, 2, 1
8
第7章
动态规划
7.2
1°建立模型
基本概念
7.2. 3 动态规划的基本方法
(1) 划分阶段，设定 k (2) 设定状态变量 sk (3) 设定决策变量 xk (4) 建立状态转移方程 (5) 确定指标函数 vk，fk* (6) 建立函数基本方程
2°递推(逆推)求解
3°得出(顺推)结论
9
第7章
动态规划
7.2
一、按阶段变量k划分
基本概念
7.2. 4 动态规划的基本类型
(1) 定期型: k = 1, 2, … , n (2) 不定期型: k = 1, 2, … , n (解前未知) (3) 无期型: k = 1, 2, … , n , …
二、按状态变量sk划分
离散型连续型
10
确定型随机型
第7章
动态规划
7.3
7.3.1 定价问题
离散确定型典例
例2 某厂要确定一种新产品在今后五年内的价格，并已拟定只在 5、6、7、8 元这四种单价中进行选择。据预测，今后五年不同价格下每年盈利如表所示, 但是各相邻年度价格增减不超过 1 元。问今后五年内每年定价各为多少,可预期五年总利润最大？
一、阶段
基本概念
把所研究的问题恰当的划分成若干个相互联系的阶段。用 k = 1，2，…，n 表示阶段序号，称为阶段变量。
二、状态
状态表示某段的初始条件。用sk表示第k段的状态，称为第k段 sk∈Sk 状态变量。
三、决策
是指人们对某一阶段活动中各种不同的行为或方案或途径等的一种选择。
用xk表示第k段的决策，称为第k段决策变量。由于决策随状态
p 1 ( s1 ) , 有
而
p1(s1) = { x1(s1),x2(s2),… ,xn(sn)} ∈P1 pk(sk) = { xk(sk),xk+1(sk+1),… ,xn(sn)} ∈Pk
称为第k子过程策略，简称子策略。
5
第7章
动态规划
7.2
六、指标函数
基本概念
(1) 阶段指标函数用vk(sk,xk)表示第k段处于sk状态且所作决策为xk∈P1 时的指标，则它就是第k段指标函数，简记为vk。 (2) 过程指标函数用fk(sk,xk)表示第k子过程的指标函数。它是各vk的累积效应。常用函数：
盈利：万元
套数
分厂
0 0 0 0
第7章
1 3 4 2
2 5 6 5
3 6 7 9
4 7 8 8
5 6 9 8
6 5 10 7
1 2 3
13
动态规划
7.3
解 1. 建立DP模型
离散确定型典例
以 k = 1，2，3 表示给三个分厂分配的顺序。设 sk = 在给k分厂分配时尚余的套数； xk = 分给k分厂的套数；可知状态方程为 sk+1 = sk - xk vk ( sk, xk ) = 从现有sk套设备中分给k分厂xk套设备后的预计创利额； fk ( sk, xk ) = 将现有sk套设备从 k - 3 分配后 (其中k分厂分得xk套)的预计创利额之和；
而变,所以决策变量xk是状态变量sk的函数,记为 xk= xk(sk) ∈Xk
4
第7章
动态规划
7.2
四、状态转移方程
基本概念
sk+1与sk,xk之间必须能够建立一种明确的数量对应关系，记为 Tk(sk,xk), 即有 sk+1 = Tk(sk,xk)
这种明确的数量关系称为状态转移方程。
五、策略
由各阶段决策xk构成的决策序列,称为全过程策略,简称策略,记为
第7章
动态规划
7.1 引言 7.2 基本概念 7.3 离散确定型典例 7.4 其他典例
1
第7章
动态规划
7.1
7.1. 1 多阶段决策问题
阶段、决策、策略
引言
7.1. 2 动态规划的基本特性
一、多阶段决策问题的基本特性
Q = S1
S2
…
Sk
Sk+1
…
Sn S’n
T
反证法容易得证。
S’k+1
…
若 {S2 , … , Sk , Sk+1 , … , Sn , T} 全程最优则 {Sk+1 , … , Sn , T} 子程最优
7
第7章
动态规划
7.2
基本概念
7.2.2 动态规划的基本方程
一、最优化原理作为一个全过程最优策略具有这样的性质：无论过去的状态和决策如何，对前面所形成的状态而言，余下的诸决策必构成最优策略。二、函数基本方程
和
f*n+1(sn+1) = 0 f*k(sk) = opt {vk(sk,xk)+fk+1*(sk+1)}
2
第7章
动态规划
7.1
二、动态规划方法的基本思路例1 最短路问题 —— 标号法
引言
11
11 2 4 Q 3
7 A1 4 6 73 A2 2 4 8 41 A 5
3
4
1 B1 4 7 6 B2 3 63 3 B3 2 3 3 C1 3
0
T
4
C2
4
阶段
3
1
第7章
4
动态规划
Байду номын сангаас.2
7.2.1 动态规划的基本概念
盈利：万元
价格 (元 )
年
1 9 7 6 8
第7章
2 2 5 5 7
动态规划
3 4 8 9 6
4 5 6 7 6
5 8 4 3 4
5 6 7 8
11
7.3
年 1 9
35
离散确定型典例
2 2
28
p1* = { 8, 8 , 7, 6 , 5 } (元)
价格 5 6 7
37 24
3 4
f *1 = 38 万元

e商务文档

管理运筹学-动态规划

相关文档推荐：