当前位置：文档之家› 第四章动态决策分析

第四章动态决策分析

E2
6 6
F1
1 3
F1
1 3
G1 G2
4
G1
3
4 B 3
A 5 4
E1
6 6 F2
B B B B B B B
16 16 17 14
2 4
G1 G2
4 3
F1 4 5 F2
1 3
G1 G2
4 3
2 4
S1 k =1 S2 k =2
S3 k=3
S4 k =4 S5
G1 G2
4 3
16 17
第6 第 6页页
资源分配问题
假设有一种资源其数量为a，现将它分配给n 个使用者。若分配给第i个使用者的数量为xi（i=1，…，n），产生的相应收益为gi（xi），问如何分配使总收益最大？
第 12 第 12页页
《决策理论与方法》
（生产—库存问题）：某工厂要对一种产品制定今后四个时期的
生产计划，据估计在今后四个时期内，市场对该产品的需求量分别为 2 ， 3 ， 2 ， 4 单位，假设每批产品固定成本为 3 千元，若不生产为0，每单位产品成本为1千元，每个时期最大生产能力不超过 6个单位，每期期末未出售产品，每单位需付存贮费0.5千元，假定第 1期初和第 4期末库存量均为 0，问该厂如何安排生产与库存，可在满足市场需求的前提下总成本最小。
决策理论与方法（Decision Making Theory and Methods）
经济管理学院靳晨霞
《决策理论与方法》
第四章
动态决策分析
第2 第 2页页
学习目的

《决策理论与方法》
了解多阶段决策、序贯决策的概念及特点；掌握动态规划与决策树方法及其在多阶段决策、序贯决策中的应用。
第 13 第 13页页
《决策理论与方法》
背包问题
有人携带背包上山，其可携带物品的重量限度为 a公斤，现有 n种物品可供选择，设第 i种物品的单件重量为 ai公斤，其在上山过程中的价值是携带数量xi的函数ci（xi），问应如何安排携带各种物品的数量，使总价值最大。
第 14 第 14页页
r a, E2 f E2
《决策理论与方法》
r a, E2 f E2
图4-1-3 最优性原理示意图
第 10 第 10页页
《决策理论与方法》
动态规划的基本思想：
1、将多阶段决策问题按照空间或时间顺序划分成相互联
系的阶段，即把一个大问题分解成一族同类型的子问题，选取恰当的状态变量和决策变量，写出状态转移方程，定义最优指标函数，写出递推关系式和边界条件。
4.1 动态决策的基本原理
4.1.2 决策树
《决策理论与方法》
决策树(decision tree)就是将决策过程各个阶段之间的结构绘制成一张箭线图，每个决策或事件（即自然状态）都可能引出两个或多个事件，导致不同的结果。决策树的构成有四个要素：1)决策结点；2)方案枝；3)状态结点；4)概率枝。
第 11 第 11页页
《决策理论与方法》
动态规划问题的典型例子：机有两种生产任务。据经验，把机器x1台投入第一种生产任务，则在一个生产周期中将有 1/3 x 1 台机器报废；余下的机器全部投入第二种生产任务，则有1/10的机器报废，如果干第一种生产任务每台机器可以收益 10 ，干第二种生产任务每台机器可以收益 7，问怎样分配机器使总收益最大？
（库存—销售问题）设某公司计划在1至4月份从事某种商品经营
。已知仓库最多可存储 600 件这种商品，已知 1月初存货 200 件，根据预测知1至4月份各月的单位购货成本及销售价格，每月只能销售本月初的库存，当月进货供以后各月销售，问如何安排进货量和销售量，使该公司四个月获得利润最大（假设四月底库存为零）
《决策理论与方法》
第7 第 7页页
《决策理论与方法》
第8 第 8页页
《决策理论与方法》
第9 第 9页页
r a, E2 f E2
4.1 动态决策的基本原理
4.1.1 动态规划最优性原理（ t h e principle of optimality）也称为Bellman原理，是R. Bellman提出的DP的基本原理，其表述为：“一个过程的最优策略具有这样的性质，即无论初始状态和初始决策如何，对于由前面的决策所形成的状态来说，其后各阶段的决策序列必定构成相应子过程的最优策略”。
第5 第 5页页
4.1 动态决策的基本原理
4.1.1 动态规划
《决策理论与方法》
例4-1-1 最优线路问题。由水源地A向城市B的输水线路需通过3个控制点，每个控制点均有两个可选方案，每段线路的输水费用如下图所示。选出一条输水线路，使得总输水费用最小。 B 费用：
E1 4 A 5 E2 4 5 F2 2 4 G2
第3 第 3页页
本讲内容
4.1 动态决策的基本原理 4.2 多阶段决策 4.3 序贯决策
《决策理论与方法》
第4 第 4页页
4.1 动态决策的基本原理
4.1.1 动态规划
《决策理论与方法》
动态规划（dynamic Programming，DP）是解决多阶段决策过程最优化的一种方法，是考察问题的一种途径，而不是一种算法，不像LP那样有一个标准的数学表达式和明确定义的一组规则，必须具体问题具体分析。其基本思路是将多阶段决策过程转化为一系列相互关联的单阶段问题，并依次求解。DP的适用范围比较广，对目标函数和约束条件没有严格的要求。 DP是离散系统最优化的一种有效工具，目前动态规划已广泛用于工业、农业、工程技术、资源、环境、经济、社会等领域。 DP也有一定的局限性。没有标准的模型和算法，必须根据具体的问题来确定其求解方法；当系统状态变量个数太大时，受计算机存储量和计算速度的限制可能无法求解。
2、从边界条件开始，由后向前逐段递推寻找最优，在每
一个阶段的计算中都要用到前一阶段的最优结果，依次进行，求得最后一个子问题的最优解就是整个问题的最优解。
3、在多阶段决策过程中，确定阶段k的最优决策时，不是
只考虑本阶段最优，而是要考虑本阶段及其所有后部子过程的整体最优，也就是说，它是把当前效益和未来效益结合起来考虑的一种方法。

e商务文档

第四章动态决策分析

相关文档推荐：

e商务文档

第四章 动态决策分析

相关文档推荐：

第四章动态决策分析