不确定情况下的决策分析方法
Ai Sj
按此准则, 应选择方案 A1 , 即左侧攻击方案, 其最大遗 憾 值为 0 . 2 , 是遗憾值最小的方案, 是比较谨慎的决策。 3. 5 决策准则的选用 选择不同的决策准则, 会获得 不 同 的 决 策 结 果。 在实 际 决策时, 军事指挥员应根据当时的 具 体 情 况、 决 策 者 的 经 验、 灵感 和 直 觉 等 , 作为决策的限制条 件, 选 用合 适 的 决 策 准则, 或者作为判断多种决策准则决策价值的重要依据。 在限制条件不明确的情况下, 也 可 以 将 几 个 决 策 准则 计 算的结果进行综合评价, 选最佳次数最 多 的 方 案 作为 首 选 方 案, 如在潜艇群攻击敌护航运输队决策问 题 中, 方 案 A1 被 选 中 3 次, 可以作为首选方案。
按此准则, 应选择方案 A4 , 即两翼攻击方案, 因为在最 有 利的条件下, 此方案可获得 0 . 9 的 突 破 概 率。但 考虑到 此方 案也可能获得 0 . 5 的较低突破概 率, 所 以 该种 选择 是有 较 大 风险的。 3. 3 悲观准则 悲观准则是选择最不利情况下的最 有 利 方 案, 是 一种 比 较稳 妥 和 保 守 的 做 法 , 其方法是先找 出 各 方 案 在 最 不 利 情 况 再选择其中最大益损值所对应的方案, 即 下的益损值, max{ min[ W ij ( A i , Sj ) ] }
2011 年 3 月 第 32 卷 第 3 期 四 川 兵 工 学 报 【其他研究】
不 确 定 情况 下 的 决 策 分析方 法
于雪泳, 吴 超
( 海军潜艇学院 作战指挥系, 山东 青岛 266071 ) 摘要: 按决策理论的模型结构, 对不确定型决策问题进行描述并以 矩 阵方式 表 示。 以 潜 艇 群 攻 击 护 航 运 输 队 决 策 问 题为例, 阐述了不确定情况下 4 种决策准则的原理、 应用方法和取舍原则。 关键词: 不确定; 决策分析; 益损值; 遗憾值 中图分类号: N945 文献标识码: A 决策分析要解决的问题是根据所获得的环境 信 息 ( 往往 是不确定的) , 从一 组 备 选 方 案 中 选择 最 满 意 的 方 案。 根据 决策者对环境 信 息 的了解 程度, 可 将决 策 分 析 问 题 分 为 3 类, 即确定型决 策、 风 险 型 决 策 和 不确定 型 决 策。 不确定 型 决策的特点: 在决 策 过 程中, 环境 信 息 存 在 2 种 以上 的 可 能 状态; 决策者无法估计每种可能状 态出 现的 概 率。 在 侦 察 信 息不完整情况下的军事 指 挥 决 策, 往往 具有 这 样 的 特 点, 也 是军事指挥员常常遇到的决策问题。 文章编号: 1006 - 0707 ( 2011 ) 03 - 0114 - 02 矩阵。该矩阵的最左边按行给出可 能的 备 选 方 案, 矩 阵 的最 上方按列给出可能的自然状态, 矩阵 元 素 则 给出每 一对 备 选 方案 / 自然状态组合下的益损值。 矩阵表示方法以及决策分析过程, 以潜艇群攻击敌护航 运输队的决策问题为例进行。 假设由 2 艘潜 艇 组 成的 潜 艇 群 对某 护 航 运 输 队 有 4 种 A2 、 A3 、 A4 , 备选攻击方案 A1 、 分 别 表 示 左 侧 攻 击、 迎 头 攻 击、 右侧攻击和两翼攻击。敌护航运输 队 由于 护 航 兵 力 的 限 制,
[ 1]
1
不确定型决策分析的描述
S2 、 S3 , 其主要防御方向 可 能 有 3 中 S1 、 分 别 代 表 左 侧 防 御、 前方 防 御 和 右 侧 防 御 。 潜 艇 群 指 挥 员 无 法 估 计 敌 护 航 兵 力 主要防御方向的可能性, 其面临的决 策 问 题 就是不确定 型 决 策 问 题 。潜 艇 群 指 挥 员 对 每 一 备 选 方 案 的 评 价 采 用 潜 艇 突 破敌护航兵力的概 率 来 度 量, 考虑到 海 洋 地 理 环境, 我方兵 力策应等因素, 大 致 可 确定 敌 方不 同 防 御 部 署 下, 每种攻击 方案突破其护航防御的概率, 决策矩阵如表 1 所示。 表1 自然备选 状态方案 A1 : 左侧攻击方案 A2 : 迎头攻击方案 A3 : 右侧攻击方案 A4 : 两翼攻击方案 决策矩阵 S2 : 前 方 防御 0. 7 0. 6 0. 6 0. 9 S3 : 右 侧 防御 0. 8 0. 7 0. 5 0. 5
S1 : 左 侧 防御 0. 6 0. 7 0. 7 0. 5
3
不确定型决策问题的决策准则
不确定情况下的决策分析, 关键 在于 根据 决 策 者 对 风 险
2
不确定型决策问题的矩阵表示
决策分析问题 的一种 形 式 化 表达 是 决 策 矩 阵 或 益 损 值
的态度确定决策准则, 通 过 决 策 准则, 将 不确定 型 问 题 转 化 为确定型决策问题。根据决策者对 风 险 的 态 度, 决 策 准则有 拉普拉斯准则、 乐观准则、 悲观准则和最小遗憾准则。
收稿日期: 2011 - 01 - 09 作者简介: 于雪泳( 1972 —) , 男, 博士研究生, 讲师, 主要从事潜艇战术研究。
115 于雪泳, 等: 不确定情况下的决策分析方法
3. 1 拉普拉斯准则 拉普拉斯 准则 也 叫 做 等 概 率 准则, 该 准则 的 基 本 假 定 是: 既然不能确知 每 一种 自然 状 态出 现的 概 率, 就认为每一 状态出现的概率相同。如果有 J 种 可 能 状 态, 则 每 出每一方案的益损值 Wi =
Ai
参考文献:
[ 1] . 北 京: 军 事 科 学 出 版 张 最 良. 军 事 运 筹 学 [M] 1993. 社, ( 责任编辑 陈 松)
i = 1, 2, …, I ΔW ij = max{ W ij } - W ij ,
Ai
由各方案在各种状态下的遗憾值构成的 矩 阵 称 为 遗 憾 矩 阵, 表 1 所示的决策矩阵的遗憾矩阵如表 2 所示。
应用决策理论中广泛采用决策模型 基 本 结 构, 可 将 不确 定型决策问题表述为: W ij = f( A i , Sj ) i = 1, 2, …, I I≥2 j = 1, 2, …, J J≥2
Ai , S j 体 现了 决 策 分 析 问 题 的 3 个 要 素, 式中 W ij , 即决 策 变 量、 随机自然状态和决策方案的价值。 决策变量 A i , 即 备 选 方 案, 是 决 策 者 可 控 制 的 因 素。 决 策分析的前提条件 之 一 就是 存 在 2 个以上 的 可 供 选择 的 备 选方案。 随机自然状态 S j , 即决策者所了解 而不 能控 制 的 随 机 环 使同 一 备 选 方 案 的 实 施 境信息。正是由于自然状态的存在, 2, …, J) 产生不同的结果。决策者列举 的 自然 状 态 S j ( j = 1 , 应当是互斥与完备的, 即所有可能自然状态只有一个发生。 W ij 是 决 策 方 案 的 价 值, 它 表 示 当 决 策 者 采 用 方 案 Ai 而 自然状态为 S j 时的益损值 ( 收 益 或 损 失 ) 。由于 决 策 目标要 在行动的结果中体现出来, 而进行决 策 时, 行 动 尚 未 开 始, 结 果更 没 有 产 生 , 所以决策方案的价值常常 要 根据 决 策 者 对 决 策方案所能达到的目标程度的主观评价确定。
1 J
J
S) ∑W ( A ,
ij i j j =1
( 1) , i = 1, 2, …, I
所选择的方案为 max{ W i }
Ai
A4 : 两翼攻击方案
J = 3, 在 潜 艇 群 攻 击 敌 护 航 运 输 队 的 决 策 问 题 中, 按式 ( 1 ) 计算得到各攻击方案成功突破概率为 W1 = 0 . 7 W2 = 0 . 67 W3 = 0 . 6 W4 = 0 . 63 0 . 67 , 0. 6, 0 . 63 } = 0 . 7 max{ 0 . 7 ,
Ai ^ ^ ^ ^
对 于 每 种 攻 击方 案, 计 算其 最大 遗 憾 值, 如 表 2 所示。 从所有最大遗憾值中选择最小者所 对应的 方 案, 即 为按 最 小 遗憾准则所获得的决策方案, 即 min{ max[ Sj ) ] } ΔW ij ( A i ,
Ai Sj
可见, 按 拉 普 拉 斯 准 则, 应 选 择 方 案 A1 , 即左侧攻击 方案。 3. 2 乐观准则 乐观准则是当决策者充满乐观与 冒 险 精 神, 不愿放弃任 何一种最好结果 的机 会 时 所 采 取 的 准则。 其方 法 是 首 先 找 出各 备 选 方 案 在 最 有 利 状 态 下 的 益 损 值 , 然后 选择 其中 最大 益损值所对应的方案, 即 max{ max[ W ij ( A i , Sj ) ] }
^ [1 ]
表2 自然备选 状态方案 A1 : 左侧攻击方案 A2 : 迎头攻击方案 A3 : 右侧攻击方案
^
遗憾矩阵
S1 : 左 侧 S2 : 前 方 S3 : 右 侧 最 大 遗 防御 0. 1 0. 0 0. 0 0. 2 防御 0. 2 0. 3 0. 3 0. 0 防御 0. 0 0. 1 0. 3 0. 3 憾值 0. 2 0. 3 0. 3 0. 3
按此准则, 应选择方案 A1 或 A2 , 即左侧攻击或者 迎 头 攻 击方案, 因为至少可以获得 0 . 6 的突破概率。 3. 4 最小遗憾准则 遗憾值是当某一自然状态发生时, 由于 决 策 者 没 有 选 用 收益最大的方案, 而 形 成的 损 失 值, 又被称为机会损失值或 者后悔值。每一备选方案 / 自然状态 组 合对应的 遗 憾 值等 于 相应益损值与该自然 状 态 下 诸 方 案 的 益 损 值 中 最大 益 损 值 之差。若自然状态为 S j , 各方案 益 损 值 为 W ij , 其中 最大 者 为 max{ W ij } , 各方案的遗憾值为