运筹学教学对策论
即指每个局中人在对策中可以选择采用的行动 方案,但这个方案必须是一个完整的行动,而不是 行动的某一步。每个局中人均有可供选择的多种策 略。
基本概念
在策略型博奕中,一个对策有以下几种基本要素:
一.局中人 二.策略 三.支付或收益(payoffs):
是指一局博奕的得失。或者说是局中人从各种策 略组合中获得的效用,它是策略组合的函数。如果 局中人得失的总和为零,则称这种对策为零和对策 (博弈);否则,称为非零和对策(博奕)。
则I的赢得矩阵为
a11 a12 a1n
A
a21
a22
a2n
am1 am2
amn
例:甲、乙各出示一枚硬币,在不让对方看见的情况 下,将硬币放在桌子上,若两个硬币都呈正面或都 呈反面则甲得1分,乙付出1分;若两个硬币一个呈 正面另一个呈反面则乙得1分,甲付出1分
局中人:甲、乙
策略: Si {正 面, 反 面}; i 1,2,
I {1,2,...,n}
Si ;i 1,2,..., n
局势----状态
n
S Si i 1
支付函数
支付关于局势的函数----决策依据和标准 H i (s); i 1,2,..., n, s S
模型 I {1,2,..., N }, Si , i I , H i (s), i I
局势: S {(正,反)(正,正)(反,正)(反,反)}
支 付 函 数 : H1 (正,反)=-1 , H1 (正,正)=1 , H1 (反,正)=-1 ,
H1 (反,反)=1; H 2 (反,正)=1, H 2 (正,正)=-1, H 2 (反,正)=1,
H 2 (反,反)=-1。
甲的赢得矩阵为
运筹学课件
运
决
幄
里
之
之
中
Game Theory
外
第一节 对策论的基本概念和分类
发展简史
• 博奕论( Game Theory)也就是运筹学中的对策论。 • 对策思想最早产生于我国古代。 • 早在两千多年前的春秋时期,孙武在《孙子兵法》
中论述的军事思想和治国策略,就蕴育了丰富和深 刻的对策论思想。孙武的后代孙膑,为田忌谋划, 巧胜齐王,这个著名的“田忌赛马”,就是典型的 对策思想的成功运用。
二人:参加对策的局中人有两个;
有限:局中人的策略集都为有限集;
零和:在任一局势下,两个局中人的赢得之和总等于0,即,
一个局中人的所得值恰好是另一个局中人的所失值,双方的 利益是完全对抗的。
设局中人I和II的策略集分别为
S1 {1,2,..., m } S2 {1, 2 ,..., n}
对任一纯局势(i , j ) ,记局中人I的赢得值为 aij
局势:一个对策中,每一个局中人所出策略形成的 策略组称为一个局势。
设si是第i个局中人的一个策略,则n个局中人的策略 形成的策略组s={s1,s2,…,sn},就是一个局势。 全部局势的集合S记为:
S S1 S2 ... Sn
模型
局中人 两个或两个以上---决策者
策略集合 策略----决策
分类
• 局中人
两人对策、多人对策
• 策略
有限对策、无限对策;非合作对策、合作对策
• 支付
零和对策、非零和对策
• 时间
单阶段对策、多阶段对策
对策模型众多,但占有重要地位的是二人有限零和 对策(矩阵对策)。它是一类最简单的对策模型, 它的结果也是研究其他对策模型的基础。
第二节 二人有限零和对策模型
二人有限零和对策
1
布
1
0
-1
剪刀
-1
1
0
第三节 矩阵对策的纯策略
例:设有一矩阵对策 G {S1, S2; A} 其中
6 1 8
A
3
2
4
9 1 10
3
0
6
解:对局中人I而言,最大赢得是9,若想得到这个赢得,
他要选择纯策略 , 3由于局中人II也是理智的竞争 者,他已考虑到局中人I打算出 的 心3 理,则准备 以 3对付之,使局中人I不但得不到9,反而失掉10. 局中人I当然也会猜到局中人II的心理,故而出 4
1912年E.Zermelo “关于集合论在象棋对策中的应用” 1921年E.Borel 引入最优策略 1928年J.V.Neumann证明了一些猜想
• 产生标志
作为一门学科的创立,则是以美国数学家冯.诺依曼 (John Von Neumann)和经济学家奥斯卡.摩根斯坦 (Oskar Morgenstern)合著的《博奕论与经济行为》 (The Game Theory and Economic Behavior) (1944) 一书出版为标志,他们奠定和形成了这门学科的理 论与方法论基础。
来对付,使局中人II得不到10,反而失掉6,……
1
1
1
1 1 3 1 1 1
A 1 1
1
3
1
1
1 1 1 1 3 1
1 1 1 1 1 3
例:甲乙两人玩猜拳游戏,游戏中双方同时分别出石 头、布或剪刀。规则是剪刀赢布,布赢石头,石头 赢剪刀,赢者得一分。若出的相同,算和局都不得 分。试列出甲的赢得矩阵。
乙
石头
布
剪刀
甲
石头
0
-1
局中人称为“i的对手”,记为-i。
对策中利益一致的参加者只能看成一个局中人,例:桥牌中 的东、西两方。 对策论中对局中人的一个重要假设:每个局中人都是“理智 的”,即每一个局中人都不存在侥幸心理,不存在利用其他 局中人决策的失误来扩大自身利益的行为。
基本概念
在策略型博奕中,一个对策有以下几种基本要素: 一.局中人 二.策略(strategies):
• 发展成熟
• Nash均衡、经济博奕论、信息不对称对策和广义 对策
基本概念
在策略型博奕中,一个对策有以下几种基本要素:
一.局中人(players):
即博奕的参与者,他们是博奕的决策主体。根据自己的利益 要求决定自己的决策,记第i个局中人为i,局中人集合为 {1,2,…,I},即共有I个局中人。我们将某个局中人以外的其它
A
1 1
1
1
例(齐王与田忌赛马)
这个问题中齐王和田忌各自拥有的策略为:
S1={(上中下),(上下中),(中上下),(中下上),(下中上),(下上中)} S2={(上中下),(上下中),(中上下),(中下上),(下中上),(下上中)} 则对应的齐王的赢得矩阵为
3 1 1 1 1 1
1
3
1