当前位置：文档之家› 第七章运筹学动态规划()精品PPT课件

第七章运筹学动态规划()精品PPT课件

fk（ sk ）=
Opt
[ Vk，n（sk， pk，n ）]
pk，n Pk，n（ sk ）
12
一、动态规划的基本概念
由此可以得到多阶段决策过程的数学模型多阶段决策过程问题要求出：（1）最优策略或最优决策序列；（2）最优目标函数值；（3）最优路线，即执行最优策略时的状态序
列。
一、动态规划的基本概念
3、决策（decision）当一个阶段的状态确定后，可以作出不同的决定或选择，
从而演变到下一阶段的某个状态，这种决定或选择称为决策。决策变量 —— uk（sk）（decision variable）简记为 uk 决策集合 —— Uk（sk）（set of admissible decision）
4、策略（policy）一组有序的决策序列构成一个策略，从第k阶段至第n阶段
的一个策略称为后部子策略记为 pk，n →（uk，uk+1，…，un）。
9
一、动态规划的基本概念
5、状态转移方程（equation of state transition）在确定型多阶段决策过程中，一旦某阶段的状态和决策为已知，
每个阶段开始时过程所处的自然状况或客观条件。它应能描述过程的特征并具有“无后效性”，即当前阶段状态给定时，这个阶段以后过程的演变与该阶段以前各阶段的状态无关。
状态变量 —— sk（state variable）状态集合 —— Sk（set of admissible states）
8
一、动态规划的基本概念
第一节分级决策方法
动态规划的方法，在工程技术、企业管理、工农业生产及军事等部门中有着广泛的应用，并且获得了显著的效果。在经济管理方面，动态规划可以用来解决最优路径问题、资源分配问题、生产调度问题、库存问题、装载问题、排序问题、设备更新问题、生产过程最优控制问题等等，他是现代企业管理中的一种重要的决策方法。
多阶段决策过程：整个决策过程可按时间或空间顺序
分解成若干相互联系的阶段，每一阶段都需作出决策，全部过程的决策是一个决策序列，也称为序贯决策问题。
例1求从A市到G市的最短路径问题
5
A 18 3
13 1
B1 3
6
8 7
B2 6
16
13
C1 6
8
10 3
C2 5
9
3
C3 3
8 4
C4
7
D1 2
2
15
三、动态规划的数学描述
建立 DP 模型与求解建立动态规划的模型，就是分析问题并建立问题的动态规划基
本方程，成功地应用动态规划方法的关键，在于识别问题本身的多阶段特征，将问题分解成为可用递推关系式联系起来的若干子问题，或者说正确地建立具体问题的基本方程，这不仅需要经验和技巧，也需要对实际问题敏锐的动察力。而正确建立基本递推关系方程的关键又在于正确选择状态变量 sk+1 = Sk（sk，uk），这是建立动态规划的模型的两个要点。
下一阶段的状态便完全确定，用状态转移方程反映这种状态间的演变规律，写作：
sk+1 = Sk（sk，uk） k =1，2，…，n 6、阶段指标值（objective value in a stage）
衡量在一个阶段某个状态下各决策所对应的某种数量指标或效果，通常表示为 Dk（sk，uk）。
10
一、动态规划的基本概念
第七章动态规划
动态规划是一种将复杂问题转化为一系列比较简单问题的最优化方法。它的基本特征是优化过程的多阶段性。
动态规划作为运筹学的一个重要分支是解决多阶段决策过程最优化的一种非常有效的方法。1951年，美国数学家贝尔曼（ R . Bellman ）等人，根据一类多阶段决策问题的特点，把多阶段决策问题变换为一系列相互联系的单阶段决策问题，然后分阶段逐个加以解决。贝尔曼等人在研究和解决了大量实际问题之后，提出了解决这类问题的——所谓“最优性原理”，通常称为“贝尔曼最优化原理”，从而创建了解决最优化问题的一种新的方法 —— 动态规划 ——（Dynamic Programming ）。贝尔曼的名著《动态规划》于1957年出版，这成了动态规划的第一本著作。
7、指标函数（objective function）衡量在选定某策略时，其优劣的数量指标。定义在整个过程（1
到n阶段）上的指标函数记为：d1，n（s1，u1，s2，…，sn，un），定义在后部子过程（k到n阶段）上的指标函数记为： fk（sk， uk，…，sn，un），或简记为：dk，n（sk， pk，n ）。
3. 3. 为求全局的最优解，分级决策总是从最后一级开始的，逐级求出最优解，直到第一级为止。
第二节最优化原理和动态规划的数学描述
一、动态规划的基本概念 1、阶段（stage）
对整个决策过程的自然划分，通常根据时间顺序或空间特征来划分阶段，以便按阶段的次序逐段解决整个过程的优化问题。阶段变量通常用k表示（k = 1，2，3，…，n）。 2、状态（state）
多阶段决策过程具有如下的性质：（1）对于状态变量具有传递性；（2）对于状态描述的过程具有无后效性；（3）对于目标函数具有可分离性。
二、Bellman最优化原理
Bellman 最优化原理： “一个过程的最优策略具有这样的性
质，即无论开始的状态及初始的决策如何，对先前决策所形成的状态而言，其以后所有的决策必构成最优决策——后部子过程最优。”
常见指标函数的形式： fk，n（sk， pk，n ）= ∑ di（si ，ui）（求和形式）
fk，n（sk， pk，n ）= ∏ di（si ，ui）（乘积形式）
11
一、动态规划的基本概念
8、最优指标函数（optimal value function）
从第k阶段状态 sk 出发，采用最优策略 p*k，n 到终止时的后部子过程指标函数值。
6
D2 1
2
3
D3 3
8
7
E1 3
5
5
E2 2
5
6 6
E3
9
该点到G点的最短距离
4
F1 4
G 33
F2
12
第一阶段第二阶段第三阶段
第四阶段第五阶段
第六阶段
6
分级决策方法（动态规划法）的基本特点：
1. 将一个问题分成几个部分（或级）进行分析，使复杂问题简化；
2. 2. 每一个阶段（或级）有自己的输入量和输出量，称为状态变量，又有各自的决策变量以及指标函数；

e商务文档

第七章运筹学动态规划()精品PPT课件

相关文档推荐：

e商务文档

第七章 运筹学动态规划()精品PPT课件

相关文档推荐：

第七章运筹学动态规划()精品PPT课件