当前位置:文档之家› 运筹与优化 (六)

运筹与优化 (六)


M1
J1
0 M2 2 5 10
J2
11
J3
13 t
J2
M3 0 3 5
J1
8
J3
11 t
J1
0 2
J3
5
J2
10 t
min max{max cik }
1 k m 1i n
s.t. cik pik M (1 aihk ) cih , i 1,2,..., n, h, k 1,2,...m c jk pik M (1 xijk ) p jk , i, j 1,2,..., n, k 1,2,...m cik 0, i 1,2,..., n, k 1,2,...m xijk 0或1,i, j 1,2,..., n, k 1,2,...m
囚徒困境
两个人涉嫌一次犯罪而被捕,分别被关在两 个房间接受审讯,他们面临的形势是:如果两个 人都坦白罪行,那么将被分别判处8年徒刑;如 果一方坦白而另一方不坦白,那么坦白者从宽释 放,而抗拒者从严判处15年徒刑;如果两人都不 坦白,将因证据不足,各被判处1年徒刑。

你认为两个囚徒会怎样选择他们的对策?


动态规划为我们提供了一种优秀的决策思 想:战略上追求全局优化,战术上稳扎稳 打、步步为营。 深刻揭示了局部与全局的统一关系:在局 部中不是最好的,到了全局也不会最好!

动态规划方法是一种通用方法,有广泛应 用。例如:背包问题、资源分配问题、生 产与存储问题、设备更新问题等。
掌握其原理思想很重要!
滚动时域优化方法——在线方法
DY ( K ( t ))
D ( S (t 1))
t
DY ( K (t ))
a.
时刻的滚动窗口
DY ( K (t )) DR ( K (t ))
D R ( K L ( t ))
DR ( K (t )) DR ( KL (t ))
DR ( KL (t ))
DY ( K (t 1))
博弈问题的解


博弈论研究的核心就是要寻找博弈问题的解,即 给定一个博弈问题,分析或预测什么样的博弈结 果将会出现。 博弈问题的解:所有参与人都预测到的博弈结果, 即参与人的一致性预测,将纳什均衡作为博弈问 题的一致性预测,即博弈问题的解。
经典的博弈模型
“囚徒的困境”: 关于博弈论,流传最广的是一个叫做“囚 徒 困 境 ” 的 故 事 。 这 个 博 弈 是 1950 年 图 克 (Tucker)提出的,这个博弈模型提出后曾引 发了大量的相关研究,也有许多关于“囚徒困 境”的版本。“囚徒困境”对博弈论的发展起 到了巨大的推动作用。可以说凡是讲博弈论, 都会说到这个经典的博弈模型。
关于我的研究领域


不确定环境下的鲁棒调度方法 工程经济学的设备更新决策 预测控制原理在生产调度中的推广应用---滚动时域调度方法 基于博弈论的电力市场交易模式分析 基于Petri网的电力系统优化调度建模
博弈论
问题: 1. 什么是博弈? 博弈论研究的主要内容有哪些? 2. 一个博弈模型必须具有哪些方面的要素? 3. 囚徒困境的内在根源是什么? 4. 阐述博弈的主要类型及其具体内容。 5. 阐述博弈中信息和理性人假设的价值。现实中 的博弈相比理想模型的博弈其复杂性体现在哪? (或者说:为什么现实中的博弈结果往往并不是 博弈理论下的博弈解?)
F ·
1, k
………
1, k
………
1, 1
R2 1,2
1, 1
1,2
。 。 Rk

1, k
t=0 t=1 t=2 t=3
1, k
t=T
静态环境下多个挑战者设备更新网络图
设备更新问题的动态规划法
动态规划法的前向递推公式
K : ft 1 (n 1, j ) OM t 1 (n 1, j ) ft (n, j ), n 1: t 1 j J t 1 j j j R : ft 1 (1, k ) min f (i, j ) PVt SVt (i) OM t 1 (1) , 1 i t 1,1 j K
博弈论是人们深刻理解诸如经济行为和社 会问题的基础。现在人们所说的博弈论,一般 指非合作博弈论。非合作博弈强调的是个人理 性、个人最优决策, 其结果可能是有效率的,也 可能是无效率的。它的特征是:人们行为相互 作用时,行为人不能达成一个有约束力的协议。 或者说,行为人之间的合约对于签约人没有实 质性约束力。然而,在各种生活行为中,人与 人之间除了竞争关系,还存在合作关系,常常 是两种关系并存,合理的合作能够给双方带来 共同利益。这是合作型博弈论研究的范畴。
博弈的标准式表达 博弈的标准式表达包括以下八个方面: 1. 博弈的参与者(Players) 2. 各博弈方各自可选择的全部策略 (Strategies)或行为(Actions)的集合 3. 进行博弈的次序(Orders) 4. 博弈方的得益(Payoffs) 5.博弈行为(action) 6.博弈信息(information) 7.结果(outcome) 8.均衡(equilibrium)
课后作业8
一、阅读博弈理论的有关著作或资料,归纳至少两 个不同角度下博弈模型的主要类型并简述其各自 具体内容。 二、结合自己所在学科大类背景,寻找一个完全信 息静态博弈模型的案例,并用博弈理论的基本概 念分析这个案例。
征集

经典而有趣的博弈模型。
博弈模型的基本三要素

局中人(参与人) 策略 收益(支付)
博弈方的能力和理性


博弈论关于人的理性假设包括两个方面: 一是他们决策行为的根本目标;二是他们追求 目标的能力。即认为博弈方都是以个体利益最 大化目标,且有准确的判断选择能力,也不会 “犯错误”。 以个体利益最大为目标被称为“个体理 性”(Individual Rationality),有完美的 分析判断能力和不会犯选择行为的错误称为 “完全理性”。
最近十几年来,博弈论在经济学尤其是微 观经济学中得到了广泛的运用, 博弈论在许多 方面改写了微观经济学的基础, 经济学家们已 经把研究策略相互作用的博弈论当作最合适的 分析工具来分析各类经济问题,诸如公共经济、 国际贸易、自然资源、企业管理等。在现代经 济学里,博弈论已经成为十分标准的分析工具。 除经济学以外, 博弈论目前在生物学、管理学、 国际关系、计算机科学、政治学、军事战略和 其他很多学科都有广泛的应用。现在已经有愈 来愈多的人开始关注、了解并学习博弈理论。
在过去二三十年中,博弈论已成为社会科 学研究的一个重要方法。有人说,如果未来社 会科学还有纯理论的话,那就是博弈论。无论 是合作博弈还是非合作博弈都给我们提供了一 种系统的分析方法,使人们在其命运取决于他 人的行为时制定出相应的战略。特别是当许多 相互依赖的因素共存,没有任何决策能独立于 其它许多决策之外时,博弈论更是价值巨大。
博弈论概述
什么是“博弈”? “博弈论”译自英文“Game Theory”。 “Game”的基本意义是游戏,因此“Game Theory”直译应该是“游戏理论”。

博弈即一些个人、队组或其他组织,面 对一定的环境条件,在一定的规则下,同时 或先后,一次或多次,从各自允许选择的行 为或策略中进行选择并加以实施,各自取得 相应结果的过程。



博弈论(Game Theory)是一种关于游戏的 理论, 又叫做对策论, 是一门以数学为基础的、 研究对抗冲突中最优解问题的学科。事实上, 博弈论也正是衍生于古老的游戏,如象棋、围 棋、扑克等。 博弈论作为一门学科,是在20世纪50~60 年代发展起来的,当非零和博弈理论、特别是 不完全信息博弈理论获得充分发展时,才成为 现实。到20世纪70年代,博弈论正式成为主流 经济学研究的主要方法之一。1994年诺贝尔经 济学奖同时授予了纳什、泽尔腾、海萨尼三位 博弈论专家。2005年诺贝尔经济学奖又授予了 美国经济学家托马斯.谢林(Thomas Schelling)和以色列经济学家罗伯特.奥曼 (Robert Aumann),以表彰他们在合作博弈 方面的巨大贡献。
t
D ( S (t ))
DY ( K (t 1))
t 1
b. 从 时刻向
时刻的窗口滚动
图 4.2. 终端惩罚滚动调度策略
设备更新问题
(i, j )
K K 1,1 R1 S 1,2 R2 1,1 2,1
3, 1
T,1
2, 1 2, 2
T-1,1


1,2
···· ····
………
0
Rk
2, k
R1

课后作业7
7
B1
2 6 3
4
C1
4 6
1
D1
3
A
4
B2
4 4
2
C2
3 3 1 5
E
3
D2
3
4
B3
C3
用动态规划法求从A到E的最短路径
动态规划与在线优化的区别
动态规划:

在线优化:



分阶段 局部最优 全局最优 精确方法 计算量大 存储量大


分阶段 局部最优 全局未必最优 启发式方法 计算量较小 存储量较小


1 t T
初值:
f (S ) f (0) 0; f (1, j) PV0j OM1j (1), 1 j K
目标函数:
f *( F ) min fT (i , j ) SVTj (i ); 1 i T 1,1 j K
生产调度问题
1 2 3
0
4
5
6
相关主题