当前位置：文档之家› 运筹与优化 (六)

运筹与优化 (六)

M1
J1
0 M2 2 5 10
J2
11
J3
13 t
J2
M3 0 3 5
J1
8
J3
11 t
J1
0 2
J3
5
J2
10 t
min max{max cik }
1 k m 1i n
s.t. cik pik M (1 aihk ) cih , i 1,2,..., n, h, k 1,2,...m c jk pik M (1 xijk ) p jk , i, j 1,2,..., n, k 1,2,...m cik 0, i 1,2,..., n, k 1,2,...m xijk 0或1，i, j 1,2,..., n, k 1,2,...m
囚徒困境
两个人涉嫌一次犯罪而被捕，分别被关在两个房间接受审讯，他们面临的形势是：如果两个人都坦白罪行，那么将被分别判处8年徒刑；如果一方坦白而另一方不坦白，那么坦白者从宽释放，而抗拒者从严判处15年徒刑；如果两人都不坦白，将因证据不足，各被判处1年徒刑。

你认为两个囚徒会怎样选择他们的对策？

动态规划为我们提供了一种优秀的决策思想：战略上追求全局优化，战术上稳扎稳打、步步为营。深刻揭示了局部与全局的统一关系：在局部中不是最好的，到了全局也不会最好！

动态规划方法是一种通用方法，有广泛应用。例如：背包问题、资源分配问题、生产与存储问题、设备更新问题等。
掌握其原理思想很重要！
滚动时域优化方法——在线方法
DY ( K ( t ))
D ( S (t 1))
t
DY ( K (t ))
a.
时刻的滚动窗口
DY ( K (t )) DR ( K (t ))
D R ( K L ( t ))
DR ( K (t )) DR ( KL (t ))
DR ( KL (t ))
DY ( K (t 1))
博弈问题的解

博弈论研究的核心就是要寻找博弈问题的解，即给定一个博弈问题，分析或预测什么样的博弈结果将会出现。博弈问题的解：所有参与人都预测到的博弈结果，即参与人的一致性预测，将纳什均衡作为博弈问题的一致性预测，即博弈问题的解。
经典的博弈模型
“囚徒的困境”：关于博弈论，流传最广的是一个叫做“囚徒困境 ” 的故事。这个博弈是 1950 年图克（Tucker）提出的，这个博弈模型提出后曾引发了大量的相关研究，也有许多关于“囚徒困境”的版本。“囚徒困境”对博弈论的发展起到了巨大的推动作用。可以说凡是讲博弈论，都会说到这个经典的博弈模型。
关于我的研究领域

不确定环境下的鲁棒调度方法工程经济学的设备更新决策预测控制原理在生产调度中的推广应用---滚动时域调度方法基于博弈论的电力市场交易模式分析基于Petri网的电力系统优化调度建模
博弈论
问题： 1. 什么是博弈? 博弈论研究的主要内容有哪些? 2. 一个博弈模型必须具有哪些方面的要素? 3. 囚徒困境的内在根源是什么? 4. 阐述博弈的主要类型及其具体内容。 5. 阐述博弈中信息和理性人假设的价值。现实中的博弈相比理想模型的博弈其复杂性体现在哪？（或者说：为什么现实中的博弈结果往往并不是博弈理论下的博弈解？）
F ·
1， k
………
1， k
………
1， 1
R2 1，2
1， 1
1，2
。。 Rk
…
1， k
t=0 t=1 t=2 t=3
1， k
t=T
静态环境下多个挑战者设备更新网络图
设备更新问题的动态规划法
动态规划法的前向递推公式
K : ft 1 (n 1, j ) OM t 1 (n 1, j ) ft (n, j ), n 1: t 1 j J t 1 j j j R : ft 1 (1, k ) min f (i, j ) PVt SVt (i) OM t 1 (1) , 1 i t 1,1 j K
博弈论是人们深刻理解诸如经济行为和社会问题的基础。现在人们所说的博弈论，一般指非合作博弈论。非合作博弈强调的是个人理性、个人最优决策, 其结果可能是有效率的,也可能是无效率的。它的特征是：人们行为相互作用时，行为人不能达成一个有约束力的协议。或者说，行为人之间的合约对于签约人没有实质性约束力。然而，在各种生活行为中，人与人之间除了竞争关系，还存在合作关系，常常是两种关系并存，合理的合作能够给双方带来共同利益。这是合作型博弈论研究的范畴。
博弈的标准式表达博弈的标准式表达包括以下八个方面: 1. 博弈的参与者（Players） 2. 各博弈方各自可选择的全部策略（Strategies）或行为（Actions）的集合 3. 进行博弈的次序（Orders） 4. 博弈方的得益（Payoffs） 5.博弈行为(action) 6.博弈信息(information) 7.结果（outcome） 8.均衡(equilibrium)
课后作业8
一、阅读博弈理论的有关著作或资料，归纳至少两个不同角度下博弈模型的主要类型并简述其各自具体内容。二、结合自己所在学科大类背景，寻找一个完全信息静态博弈模型的案例，并用博弈理论的基本概念分析这个案例。
征集

经典而有趣的博弈模型。
博弈模型的基本三要素

局中人（参与人）策略收益（支付）
博弈方的能力和理性

博弈论关于人的理性假设包括两个方面：一是他们决策行为的根本目标；二是他们追求目标的能力。即认为博弈方都是以个体利益最大化目标，且有准确的判断选择能力，也不会 “犯错误”。以个体利益最大为目标被称为“个体理性”（Individual Rationality），有完美的分析判断能力和不会犯选择行为的错误称为 “完全理性”。
最近十几年来，博弈论在经济学尤其是微观经济学中得到了广泛的运用, 博弈论在许多方面改写了微观经济学的基础, 经济学家们已经把研究策略相互作用的博弈论当作最合适的分析工具来分析各类经济问题，诸如公共经济、国际贸易、自然资源、企业管理等。在现代经济学里，博弈论已经成为十分标准的分析工具。除经济学以外, 博弈论目前在生物学、管理学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。现在已经有愈来愈多的人开始关注、了解并学习博弈理论。
在过去二三十年中，博弈论已成为社会科学研究的一个重要方法。有人说，如果未来社会科学还有纯理论的话，那就是博弈论。无论是合作博弈还是非合作博弈都给我们提供了一种系统的分析方法，使人们在其命运取决于他人的行为时制定出相应的战略。特别是当许多相互依赖的因素共存，没有任何决策能独立于其它许多决策之外时，博弈论更是价值巨大。
博弈论概述
什么是“博弈”？ “博弈论”译自英文“Game Theory”。 “Game”的基本意义是游戏，因此“Game Theory”直译应该是“游戏理论”。

博弈即一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。

博弈论(Game Theory)是一种关于游戏的理论, 又叫做对策论, 是一门以数学为基础的、研究对抗冲突中最优解问题的学科。事实上，博弈论也正是衍生于古老的游戏，如象棋、围棋、扑克等。博弈论作为一门学科，是在20世纪50～60 年代发展起来的，当非零和博弈理论、特别是不完全信息博弈理论获得充分发展时，才成为现实。到20世纪70年代，博弈论正式成为主流经济学研究的主要方法之一。1994年诺贝尔经济学奖同时授予了纳什、泽尔腾、海萨尼三位博弈论专家。2005年诺贝尔经济学奖又授予了美国经济学家托马斯．谢林（Thomas Schelling）和以色列经济学家罗伯特．奥曼（Robert Aumann），以表彰他们在合作博弈方面的巨大贡献。
t
D ( S (t ))
DY ( K (t 1))
t 1
b. 从时刻向
时刻的窗口滚动
图 4.2. 终端惩罚滚动调度策略
设备更新问题
(i, j )
K K 1，1 R1 S 1，2 R2 1，1 2，1
3， 1
T，1
2， 1 2， 2
T-1，1
…
…
1，2
···· ····
………
0
Rk
2， k
R1

课后作业7
7
B1
2 6 3
4
C1
4 6
1
D1
3
A
4
B2
4 4
2
C2
3 3 1 5
E
3
D2
3
4
B3
C3
用动态规划法求从A到E的最短路径
动态规划与在线优化的区别
动态规划：

在线优化：

分阶段局部最优全局最优精确方法计算量大存储量大

分阶段局部最优全局未必最优启发式方法计算量较小存储量较小

1 t T
初值：
f (S ) f (0) 0; f (1, j) PV0j OM1j (1), 1 j K
目标函数：
f *( F ) min fT (i , j ) SVTj (i ); 1 i T 1,1 j K
生产调度问题
1 2 3
0
4
5
6

e商务文档

运筹与优化 (六)

相关文档推荐：