当前位置：文档之家› 对策论基础

对策论基础

-1
1
1
3
1
1
1
1
-1
1
3
1
1
1
1
-1
1
3
田忌的赢得矩阵是什么？
锤头、剪刀、布游戏
设游戏双方为甲、乙，则甲的赢得
乙
甲的赢得
包
剪
锤
甲
包
0
-1
1
剪
1
0
-1
锤
-1
1
0
二、最优纯策略
现有一矩阵对策 G S1, S2 , A
S1 {1,2 ,3,4}, S2 {1, 2 , 3}
其中
1 2 3
例子的最优纯策略
在上述定理中
aij*
min j
(aij
),
ai* j miax(aij )
因此符合条件
max(a
i
ij
*
)
min j
(ai*
j
)
的即为最优纯策略。
上述例子的最优纯策略为：最优局势
(2, 2 )
且G=2为局中人I的赢得值。
再看一例
已知
G
(S1, S2 ,
A)，
其中S1
{1，
零和对策
如果各局中人的赢得函数之和为零，则称之为零和对策，反之为非零和对策
矩阵对策
有限二人零和对策
三个特征：局中人只有2个；每个局中人只有有限个可选择的策略；在任一局势中，两个局中人的得失之和为零
二、对策分类
（一）按对策双方是否存在有约束力的协议来分：合作对策非合作对策（二）按局中人数分类：二人对策多人对策（三）按策略数分类：
在儿童游戏中，锤子、剪刀、布就分别是一个策略，｛锤子、剪刀、布｝就是一个策略集。
如果每个局中人只有有限个策略，则相应的对策称为有限对策，否则称为无限对策
局势
在一局对策中，每个局中人采用的策略所形成的策略组称为一个局势，用s表示。
赢得函数（支付、支付函数，Payoff）
当局势出现后，对策的结果也就确定。即：对任一局势 s S，局中人i可以得到一个赢得 Hi (s) ，显然，H i (s) 是局势s的函数，称之为第i个局中人的赢得函数
运筹学
讲课教师：汤建影
南京航空航天大学经济与管理学院
第六章对策论基础
概论矩阵对策的基本理论
第一节概论
对策与决策决策是由单方做出的对策是由利害冲突的多方做出的 1944年，Von Neumann &
D.Morgenstern合作出版《对策论与经济行为》，标志着对策论的诞生
博弈现象
1 6 1 8
A
2
3
2
4
3 4
9 3
1 0
10
6
纯策略与纯局势
如果局中人I，II的策略集分别为
S1 {a1, a2 , , am}, S2 {1, 2 , , n}
称 i为I
的纯策略，
为
j
II
的纯策略，
对于纯策略i , j 构成的策略偶( i , j )称
为纯局势
矩阵对策的纯策略解（鞍点解）
，
2
，
3
4}
S2
{1，
，
2
，
3
4}
8 6 8 6
A
1
3
4
3
9 6 7 6
3 1 10
3
求解此矩阵对策
对策的解可能不是唯一的,但是对策的值是唯一的,对策的解不唯一时,满足以下两条性质:
无差别性:若 (i1, j1)与 i2 , j2 是矩阵对策G
的两个解,则 ai1, j1 ai2, j 2
下棋与打牌体育比赛战争市场进入谈判生产管理决策竞拍
几个典型的博弈案例
锤子、剪刀、布的儿童游戏囚徒困境智猪博弈强盗分金币
一、基本概念与名词
局中人策略与策略集局势赢得函数零和对策矩阵对策：二人有限零和对策
局中人
在一个对策行为（或一局对策）中，有权决定自己行动方案的对策参加者，称为局中人（Player）
对策的数学表示
二人矩阵对策用下列式子表示
G I, II , S1, S2, A或G S1, S2, A
其中I、II表示两个局中人，S1、S2分别表示局中人I、II的策Байду номын сангаас集，A则表示赢得
矩阵： A (aij )
齐王的赢得矩阵(支付矩阵)A
3
1
1
1
1
-1
1
3
1
1
-1
1
A=
1
-1
3
1
1
1
对于局中人I来说，各策略中最坏的结果分别为｛-8, 2, -10, -3｝
在这些最坏的情况中，最好的结果是
max{-8, 2, -10, -3}=2
即：只要局中人I采用 2 ，无论II采用何
种策略，I都可以保证赢得不少于2
在这种情况下，II应采用策略 2 ,否则
输得更多
最优纯策略的表述
有限策略对策无限策略对策
二人有限零和对策是讨论的重点。
第二节矩阵对策的基本理论
矩阵对策的数学模型最优纯策略混合策略与混合扩充
一、矩阵对策的数学模型
以齐王赛马为例说明：齐王赛马—二人有限零和对策
局中人—齐王和田忌
策略— 上中下三种等级的马的组合，比三次，有六组
策略：( 上，中，下) 、 ( 中，上，下) 、 ( 上，下，中) 、
通常用I表示局中人的集合，如果有n个局中人，则I＝｛1,2,3,…,n｝
在一个对策中，至少要有两个局中人局中人，不一定是单个人，也可以是利益完
全一致的一个集体只有两个局中人的对策，称为两人对策
策略和策略集
一局对策中，可供局中人选择的一个实际可行的完整的行动方案，称为一个策略，它的集合称为策略集S。
若满足
max i
mjin{aij
}
min j
miax{aij
}
则上述条件规定的局势
(i*,
* j
)
叫做最优纯局势，也是矩阵对策的最优解，
是局中人I、II的最优纯策略,即鞍点
定理：矩阵对策G={S1,S2,A}有纯策略解的
充要条件是存在一个纯局势
(i*
,
* j
)使得
aij* ai* j* ai* j ,i 1,2, , m; j 1,2, , n
可交换性:若 (i1, j1)与 i2 , j2 是矩阵对策的两个解,则 (i1, j2 )与 i2 , j1 也是对策的解
( 中，下，上) 、 ( 下，上，中) 、 ( 下，中，上) ，对齐王
，表这示六，组对策田略忌用，则i , i用
1,2,3,4,5,6 i , i 1,2,3,4,5,6
表示。
支付函数—赢了得一千金，输了付一千金。
齐王赛马赢得函数
田忌
1 2 3 4 5 6
(上中下) 1 3 1 1 1 1 -1 (上下中) 2 1 3 1 1 -1 1 齐 (中上下) 3 1 -1 3 1 1 1 王 (中下上) 4 -1 1 1 3 1 1 (下中上) 5 1 1 -1 1 3 1 (下上中) 6 1 1 1 -1 1 3

e商务文档

对策论基础

相关文档推荐：