当前位置:
文档之家› 决策理论第六章序贯决策分析ppt课件
决策理论第六章序贯决策分析ppt课件
3
第一节 多阶段决策
三、应用举例 例6-1 离散情况决策分析。某企业考虑是
否花费4000元钱从某科研机关购买某项技术然后 产销新产品。如果买技术,可以进行大批生产
(a1),中批生产(a2),或小批生产(a3), 可能出现的市场销售情况也分为畅销()1 一般
( 2)和滞销()3 三种。其收益(利润,元)矩
2
第一节 多阶段决策
二、多阶段决策方法 解决多阶段决策问题的主要方法是决策树方法
和动态规划方法,决策树由节点和分支组成,每 一条由树根通往树梢的路线都表示一种决策方案 及可能遇到的一种情况。 进行决策分析时,要由树梢往树根依次计算。 这种从后到前进行决策分析的方法叫做逆序归纳 法。 多阶段决策分析的步骤: (1)根据具体问题适当划分阶段; (2)确定各阶段的状态变量,寻找各阶段之 间的联系; (3)由后到前用逆序归纳法进行决策分析。
5 A
3
1 B1 3
6
8 B2 7
6
C1 6 8
3 C2 5
3 C3 3
84 C4
2 D1
2
D2 1 2
3 D3
3
E1 3
5 5 E2 2
6 6
E3
F1 4
G 3 F2
1
2
3
4
5
6
18
一(一、)动、态基规本划概的念基本思想
1、阶段:
把一个问题的过程,恰当地分为若干个相互联系的 阶段,以便于按一定的次序去求解。
第六章 序贯决策分析
1
第一节 多阶段决策
一、多阶段决策问题 在经济活动中,常常遇到这样的决策问题,由
于它的特殊性,需要将过程分为若干个相互联系 的阶段,在它的每一个阶段都需要做出决策,从 而使整个过程达到最好的活动效果。当各个阶段 决策确定后,就组成了一个决策序列,因而也就 决定了整个过程的一条活动路线,这种把一个问 题可看作是一个前后关联的具有链状结构的多阶 段过程就称为多阶段决策过程。
fn
(Sn
)
min dn
Rn (dn , Sn ) fn1(Sn1)
dn 为第 n 阶段的决策变量,Sn 是第 n 阶段开始的状态,Rn 为
第 n 阶段的即时所得,它是 dn , Sn 的函数,fn (Sn ) 是从第 n 阶
段开始到所有阶段结束的最小总损失。
15
动态规划问题的特点: 系统所处的状态和时刻是进行决策的重要因素; 即在系统发展的不同时刻(或阶段)根据系统 所处的状态,不断地做出决策;
(似然分布矩阵)见表6-2所示。
6
第一节 多阶段决策
表6-2 试销结果的准确度
7
第一节 多阶段决策
如不买此项技术,把这笔费用用在其他方面,在 同样的时期可获利8000元。那么,该公司应该如 何决策?
(1)是否买技术? (2)如果买技术,是否采取试销办法? (3)如果不试销,应大批生产,中批生产还是小
9
第二节 序贯决策
有些决策问题,在进行决策后又产生一些新情 况,需要进行新的决策,接着又有一些新的情况, 又需要进行新的决策。这样决策、情况、决策…, 就构成一个序列,这就是序列决策。解决序列问 题的有利办法仍然是决策树。
10
例6-3 设有某石油勘探队,在一片估计能出 油的荒田钻探,可以先做地震试验,然后决定钻 井与否。或者不做地震试验,只凭经验决定钻井 与否。做地震试验的费用每次30000元,钻井费用 为10000元。若钻井后出油,这井队可收入40000 元;若不出油就没有任何收入。各种情况下出油 的概率已估计出,并标在图6-2上。问钻井队的决 策者如何做出决策使收入的期望值为最大。
找到不同时刻的最优决策以及整个过程的最优策略。 多阶段决策问题:
是动态决策问题的一种特殊形式;
在多阶段决策过程中,系统的动态过程可以按照时间 进程分为状态相互联系而又相互区别的各个阶段; 每个阶段都要进行决策,目的是使整个过程的决策 达到最优效果。
16
决策
决策
决策
状态 1
状态
2 状态 状态 n
11
第二节 序贯决策
图6-2 原决策树
12
动态规划
• 确定型动态规划 • 风险型动态规划
13
动态规划 最优性原理:任何前一阶段决策结果所得的状态,应能使其 同其余阶段的决策共同构成最优决策。 如果决策目标要求收入(利润,产量)最大,则决策目标函 数的递推关系如下:
f
n
(Sn
)
max dn
批生产?如果试销,又应该如何根据试销结果决 定其行动?
8
第一节 多阶段决策
例6-2 连续情形的决策分析。某工厂现有10万元资 金可供生产某种产品使用,生产过程有两个方案可供选择。 方案1:每万元资金,每年可产生0.5万元的利润,年产量为 2000吨。方案2:每万元资金,每年可产生0.2万元的利润, 年产量为3000吨。每年可用一部分资金采取一种方案生产, 另外一部分资金采取另一种方案进行生产,但一年内不变。 假设前一年的利润可作为下一年的资金在两个方案间再行分 配,但一个方案前一年的资金不得在下一年向另一方案转移。 那么,为使四年内的总产量最高,该厂在这四年中应该如何 分配资金?
动态规划问题的典型例子:
1 . 生产决策问题:企业在生产过程中,由于需 求是随时间变化的,因此企业为了获得全年的最佳 生产效益,就要在整个生产过程中逐月或逐季度地 根据库存和需求决定生产计划。
17
2 . 最短路问题:给定一个交通网络图如下,其中两点之 间的数字表示距离(或花费),试求从A点到G点的最短距离 (总费用最小)。
阵如表6-1
4
第一节 多阶段决策
表6-1 某公司产销新产品的收益矩阵
5
第一节 多阶段决策
为了更正确地了解市场情况,正式投产前可先生 产少量产品试销。由于要增添少量生产设备等原 因,试销费需要600元。由于试销前未作广告,顾 客对产品不太了解,加之试销量较小,试销结果
不很准确。假设试销结果分为产品受欢迎(H1), 一般(H2)和不受欢迎(H3)三种,其准确度
Rn (dn , Sn ) fn1(Sn1)
dn 为第 n 阶段的决策变量,Sn 是第 n 阶段开始的状态,Rn 为
第 n 阶段的即时所得,它是 dn , Sn 的函数,fn (Sn ) 是从第 n 阶
段开始到所有阶段结束的最大总收益。
14
如果决策目标要求损失最小,则决策目标函数的递推关系如 下: