当前位置：文档之家› 运筹学教学对策论

运筹学教学对策论

即指每个局中人在对策中可以选择采用的行动方案，但这个方案必须是一个完整的行动，而不是行动的某一步。每个局中人均有可供选择的多种策略。
基本概念
在策略型博奕中，一个对策有以下几种基本要素：
一．局中人二．策略三．支付或收益(payoffs):
是指一局博奕的得失。或者说是局中人从各种策略组合中获得的效用，它是策略组合的函数。如果局中人得失的总和为零，则称这种对策为零和对策（博弈）；否则，称为非零和对策(博奕)。
则I的赢得矩阵为
a11 a12 a1n
A
a21
a22
a2n
am1 am2
amn
例：甲、乙各出示一枚硬币，在不让对方看见的情况下，将硬币放在桌子上，若两个硬币都呈正面或都呈反面则甲得1分，乙付出1分；若两个硬币一个呈正面另一个呈反面则乙得1分，甲付出1分
局中人：甲、乙
策略： Si {正面，反面}; i 1,2,
I {1,2,...,n}
Si ;i 1,2,..., n
局势----状态
n
S Si i 1
支付函数
支付关于局势的函数----决策依据和标准 H i (s); i 1,2,..., n, s S
模型 I {1,2,..., N }, Si , i I , H i (s), i I
局势： S {（正，反）（正，正）（反，正）（反，反）}
支付函数： H1 (正，反）=-1 ， H1 (正，正）=1 ， H1 (反，正）=-1 ，
H1 (反，反）=1； H 2 (反，正）=1， H 2 (正，正）=-1， H 2 (反，正）=1，
H 2 (反，反）=-1。
甲的赢得矩阵为
运筹学课件
运
决
幄
里
之
之
中
Game Theory
外
第一节对策论的基本概念和分类
发展简史
• 博奕论( Game Theory)也就是运筹学中的对策论。 • 对策思想最早产生于我国古代。 • 早在两千多年前的春秋时期，孙武在《孙子兵法》
中论述的军事思想和治国策略，就蕴育了丰富和深刻的对策论思想。孙武的后代孙膑，为田忌谋划，巧胜齐王，这个著名的“田忌赛马”，就是典型的对策思想的成功运用。
二人：参加对策的局中人有两个；
有限：局中人的策略集都为有限集；
零和：在任一局势下，两个局中人的赢得之和总等于0，即，
一个局中人的所得值恰好是另一个局中人的所失值，双方的利益是完全对抗的。
设局中人I和II的策略集分别为
S1 {1,2,..., m } S2 {1, 2 ,..., n}
对任一纯局势(i , j ) ，记局中人I的赢得值为 aij
局势：一个对策中，每一个局中人所出策略形成的策略组称为一个局势。
设si是第i个局中人的一个策略，则n个局中人的策略形成的策略组s={s1,s2,…,sn},就是一个局势。全部局势的集合S记为：
S S1 S2 ... Sn
模型
局中人两个或两个以上---决策者
策略集合策略----决策
分类
• 局中人
两人对策、多人对策
• 策略
有限对策、无限对策；非合作对策、合作对策
• 支付
零和对策、非零和对策
• 时间
单阶段对策、多阶段对策
对策模型众多，但占有重要地位的是二人有限零和对策（矩阵对策）。它是一类最简单的对策模型，它的结果也是研究其他对策模型的基础。
第二节二人有限零和对策模型
二人有限零和对策
1
布
1
0
-1
剪刀
-1
1
0
第三节矩阵对策的纯策略
例：设有一矩阵对策 G {S1, S2; A} 其中
6 1 8
A
3
2
4
9 1 10
3
0
6
解：对局中人I而言，最大赢得是9，若想得到这个赢得，
他要选择纯策略， 3由于局中人II也是理智的竞争者，他已考虑到局中人I打算出的心3 理，则准备以 3对付之，使局中人I不但得不到9，反而失掉10. 局中人I当然也会猜到局中人II的心理，故而出 4
1912年E.Zermelo “关于集合论在象棋对策中的应用” 1921年E.Borel 引入最优策略 1928年J.V.Neumann证明了一些猜想
• 产生标志
作为一门学科的创立，则是以美国数学家冯.诺依曼 (John Von Neumann)和经济学家奥斯卡.摩根斯坦 (Oskar Morgenstern)合著的《博奕论与经济行为》 (The Game Theory and Economic Behavior) (1944) 一书出版为标志，他们奠定和形成了这门学科的理论与方法论基础。
来对付，使局中人II得不到10，反而失掉6，……
1
1
1
1 1 3 1 1 1
A 1 1
1
3
1
1
1 1 1 1 3 1
1 1 1 1 1 3
例：甲乙两人玩猜拳游戏，游戏中双方同时分别出石头、布或剪刀。规则是剪刀赢布，布赢石头，石头赢剪刀，赢者得一分。若出的相同，算和局都不得分。试列出甲的赢得矩阵。
乙
石头
布
剪刀
甲
石头
0
-1
局中人称为“i的对手”，记为-i。
对策中利益一致的参加者只能看成一个局中人，例：桥牌中的东、西两方。对策论中对局中人的一个重要假设：每个局中人都是“理智的”，即每一个局中人都不存在侥幸心理，不存在利用其他局中人决策的失误来扩大自身利益的行为。
基本概念
在策略型博奕中，一个对策有以下几种基本要素：一．局中人二．策略(strategies)：
• 发展成熟
• Nash均衡、经济博奕论、信息不对称对策和广义对策
基本概念
在策略型博奕中，一个对策有以下几种基本要素：
一．局中人(players)：
即博奕的参与者，他们是博奕的决策主体。根据自己的利益要求决定自己的决策，记第i个局中人为i，局中人集合为 {1,2,…,I}，即共有I个局中人。我们将某个局中人以外的其它
A
1 1
1
1
例（齐王与田忌赛马）
这个问题中齐王和田忌各自拥有的策略为：
S1={(上中下),(上下中),(中上下),(中下上),(下中上),(下上中)} S2={(上中下),(上下中),(中上下),(中下上),(下中上),(下上中)} 则对应的齐王的赢得矩阵为
3 1 1 1 1 1
1
3
1

e商务文档

运筹学教学对策论

相关文档推荐：