当前位置:文档之家› 对策论基础

对策论基础


-1
1
1
3
1
1
1
1
-1
1
3
1
1
1
1
-1
1
3
田忌的赢得矩阵是什么?
锤头、剪刀、布游戏
设游戏双方为甲、乙,则甲的赢得

甲的赢得





0
-1
1

1
0
-1

-1
1
0
二、最优纯策略
现有一矩阵对策 G S1, S2 , A
S1 {1,2 ,3,4}, S2 {1, 2 , 3}
其中
1 2 3
例子的最优纯策略
在上述定理中
aij*
min j
(aij
),
ai* j miax(aij )
因此符合条件
max(a
i
ij
*
)
min j
(ai*
j
)
的即为最优纯策略。
上述例子的最优纯策略为:最优局势
(2, 2 )
且G=2为局中人I的赢得值。
再看一例
已知
G
(S1, S2 ,
A),
其中S1
{1,
零和对策
如果各局中人的赢得函数之和为零,则称之 为零和对策,反之为非零和对策
矩阵对策
有限二人零和对策
三个特征:局中人只有2个;每个局中人只 有有限个可选择的策略;在任一局势中,两 个局中人的得失之和为零
二、对策分类
(一)按对策双方是否存在有约束力的协议 来分:合作对策 非合作对策 (二)按局中人数分类:二人对策 多人对策 (三)按策略数分类:
在儿童游戏中,锤子、剪刀、布就分别是一 个策略,{锤子、剪刀、布}就是一个策略 集。
如果每个局中人只有有限个策略,则相应的 对策称为有限对策,否则称为无限对策
局势
在一局对策中,每个局中人采用的策略所形 成的策略组称为一个局势,用s表示。
赢得函数(支付、支付函数,Payoff)
当局势出现后,对策的结果也就确定。即: 对任一局势 s S,局中人i可以得到一个赢得 Hi (s) ,显然,H i (s) 是局势s的函数,称之 为第i个局中人的赢得函数
运筹学
讲课教师:汤建影
南京航空航天大学经济与管理学院
第六章 对策论基础
概论 矩阵对策的基本理论
第一节 概论
对策与决策 决策是由单方做出的 对策是由利害冲突的多方做出的 1944年,Von Neumann &
D.Morgenstern合作出版《对策论与经济 行为》,标志着对策论的诞生
博弈现象
1 6 1 8
A
2
3
2
4
3 4
9 3
1 0
10
6
纯策略与纯局势
如果局中人I,II的策略集分别为
S1 {a1, a2 , , am}, S2 {1, 2 , , n}
称 i为I
的纯策略,

j
II
的纯策略,
对于纯策略i , j 构成的策略偶( i , j )称
为纯局势
矩阵对策的纯策略解(鞍点解)

2

3
4}
S2
{1,

2

3
4}
8 6 8 6
A
1
3
4
3
9 6 7 6
3 1 10
3
求解此矩阵对策
对策的解可能不是唯一的,但是对策的值 是唯一的,对策的解不唯一时,满足以下两 条性质:
无差别性:若 (i1, j1)与 i2 , j2 是矩阵对策G
的两个解,则 ai1, j1 ai2, j 2
下棋与打牌 体育比赛 战争 市场进入 谈判 生产管理决策 竞拍
几个典型的博弈案例
锤子、剪刀、布的儿童游戏 囚徒困境 智猪博弈 强盗分金币
一、基本概念与名词
局中人 策略与策略集 局势 赢得函数 零和对策 矩阵对策:二人有限零和对策
局中人
在一个对策行为(或一局对策)中,有权决 定自己行动方案的对策参加者,称为局中人 (Player)
对策的数学表示
二人矩阵对策用下列式子表示
G I, II , S1, S2, A或G S1, S2, A
其中I、II表示两个局中人,S1、S2分别 表示局中人I、II的策Байду номын сангаас集,A则表示赢得
矩阵: A (aij )
齐王的赢得矩阵(支付矩阵)A
3
1
1
1
1
-1
1
3
1
1
-1
1
A=
1
-1
3
1
1
1
对于局中人I来说,各策略中最坏的结果 分别为{-8, 2, -10, -3}
在这些最坏的情况中,最好的结果是
max{-8, 2, -10, -3}=2
即:只要局中人I采用 2 ,无论II采用何
种策略,I都可以保证赢得不少于2
在这种情况下,II应采用策略 2 ,否则
输得更多
最优纯策略的表述
有限策略对策 无限策略对策
二人有限零和对策是讨论的重点。
第二节 矩阵对策的基本理论
矩阵对策的数学模型 最优纯策略 混合策略与混合扩充
一、矩阵对策的数学模型
以齐王赛马为例说明: 齐王赛马—二人有限零和对策
局中人—齐王和田忌
策略— 上 中下三种等级的马的组合 ,比三次,有六组
策略:( 上,中,下) 、 ( 中,上,下) 、 ( 上,下,中) 、
通常用I表示局中人的集合,如果有n个局中 人,则I={1,2,3,…,n}
在一个对策中,至少要有两个局中人 局中人,不一定是单个人,也可以是利益完
全一致的一个集体 只有两个局中人的对策,称为两人对策
策略和策略集
一局对策中,可供局中人选择的一个实际可 行的完整的行动方案,称为一个策略,它的 集合称为策略集S。
若满足
max i
mjin{aij
}
min j
miax{aij
}
则上述条件规定的局势
(i*,
* j
)
叫做最优纯局势,也是矩阵对策的最优解,
是局中人I、II的最优纯策略,即鞍点
定理:矩阵对策G={S1,S2,A}有纯策略解的
充要条件是存在一个纯局势
(i*
,
* j
)使得
aij* ai* j* ai* j ,i 1,2, , m; j 1,2, , n
可交换性:若 (i1, j1)与 i2 , j2 是矩阵对策的 两个解,则 (i1, j2 )与 i2 , j1 也是对策的解
( 中,下,上) 、 ( 下,上,中) 、 ( 下,中,上) ,对齐王
,表这示六,组对策田略忌用,则i , i用
1,2,3,4,5,6 i , i 1,2,3,4,5,6
表示。
支付函数—赢了得一千金,输了付一千金。
齐王赛马赢得函数
田忌
1 2 3 4 5 6
(上中下) 1 3 1 1 1 1 -1 (上下中) 2 1 3 1 1 -1 1 齐 (中上下) 3 1 -1 3 1 1 1 王 (中下上) 4 -1 1 1 3 1 1 (下中上) 5 1 1 -1 1 3 1 (下上中) 6 1 1 1 -1 1 3
相关主题