当前位置:文档之家› 《运筹学教程》胡云权第五版运筹学6对策论矩阵对策 34页

《运筹学教程》胡云权第五版运筹学6对策论矩阵对策 34页

x* ( 3 , 8 )T 11 11
由图可见局中人II的混合策 略只有β2和β3组成。
I
II ① 数轴上坐标为0和1的两点分
11 别做两条垂线I-I和II-II。
7
② 画出局中人II的不同策略下 局中人I的赢得线段。
5
3
β1: v11 = 2x+7(1-x)
2
2
β2 : v12 = 3x+5(1-x)
0
1
β3 : v13 = 11x+2(1-x)
I
II
图解法
③由于局中人II理性,局中人 I从最少可能收入中选择最大 的一个,为局中人I的最优对 策。B2
矩阵对策的混合策略
1、混合策略
对于 G {S1, S2; A}
局中人Ⅰ有把握的赢得至少为 v1

max min
i
j
aij
局中人Ⅱ有把握的支付至多为 v2

min j
max i
aij
一般为 v1 v2 ,特别地当 v1 v2 时,则称对策 G 在
纯策略意义下的解,即VG v1 v2 。实际多 v1 v2 ,根


1 1 1 1 1 3
矩阵对策的纯策略
2、矩阵对策解的引例
例: 设 G {S1, S2; A} ,
其中 S1 {1,2,3,4} , S2 {1, 2, 3},
6
A


3
9
3
1 2 1 0
8 -8
4

2
10 -
6

10
S1* {(x1, x2 ) | x1, x2 0, x1 x2 1}, S2* {( y1, y2 ) | y1, y2 0, y1 y2 1}
局中人 I 的赢得期望值
E(x,
y)

3x1 y1
6x1y2
5x2 y1

4x2 y2

4(x1

1 4
)(
y1
4、混合策略对策模型
一个新的对策 G*

{S1*
,
S
* 2
;
E}
,则称
G
*

G
的混合扩充。
矩阵对策的混合策略
5、最优混合策略

G*

{S1*
,
S
* 2
;
E}
,是矩阵对策
G

{S1,
S2;
A}
的混合扩充。
x {x1, x2 ,, xm} S1* 是局中人Ⅰ的一个混合策略;
y

{ y1 ,
y2
9 2 6 -3
理智行为:从各自最不利情形中选择最有利 I:最大最小原则 II:最小最大原则
平衡局势:双方均可接受,且对双方都是最稳妥的结果。 (α2 ,β2),局中人I和II的最优纯策略。
矩阵对策的纯策略
3、矩阵对策的最优纯策略
定义 1:设 G {S1, S2; A}为矩阵对策,其中
S1 {1,2 ,,m} , S2 {1, 2 ,, n}, A {aij }mn ,
a22既是其所在行的最小元素,也是其所在列的最大元素,
即有 ai2≤a22 ≤ a2j i=1,2,3,4 j=1,2,3
矩阵对策的纯策略
3、矩阵对策的最优纯策略
定理 1: 矩阵对策 G {S1, S2; A}在纯策略意义下有解的充要条
件是:存在纯局势
( i
*
,

j*
)
使得对一切
i

1,2,, m;
Ⅱ的策略集为: S2 {1, 2 , j , , n} 。
当Ⅰ、Ⅱ分别选择纯策略i , j 时,形成了一个纯局势
(i , j ) S S1 S2 ,则对任一 (i , j ) S ,记Ⅰ的赢得 值为 ai j ,即Ⅱ赢得值为 ai j (i 1,2,, m; j 1,2,, n) .
j

1,2,, n
均有
a ij
*
ai* j*
ai* j
2 7 2 1 1
例: G {S1, S2; A},其中 A 2
3
2 5
3 4
4 2 4 3
2 2 1 6 1
3746

max i
min j
aij

min j
max i
aij
a31
3 则VG

3 ,G 的解
为3, 1分别是局中人Ⅰ、Ⅱ的最优纯策略。
事实:对策 G 的值VG ai* j* 是 A a 中 i* j* 所在的行的最小
元素,又是所在列的最大元素,即
a ij
*
ai* j*
ai* j 。
矩阵对策的纯策略
4、矩阵对策的鞍点与解
对于一个对策G={S1, S2, A}, 若

max i
矩阵对策的策略
纯策略:确定的选择某策略 混合策略:以某一概率分布选择各策略。
矩阵对策的纯策略
1、矩阵对策的一般表达
设用Ⅰ、Ⅱ分别表示两局中人,Ⅰ有 m 个纯策略
1,2 ,,m ,Ⅱ有 n 个纯策略 1, 2 ,, n ,则
Ⅰ的策略集为: S1 {1,2 , i , ,m},


max i
min j
aij

min j
max i
aij

ai* j*
成立,记 VG
ai* j*
,则
称VG ai* j* 为矩阵对策 G 的值.
相应的纯局势 (i* , j* ) 为 G 在纯策略下的解,i* 与 j*
分别称为局中人Ⅰ与Ⅱ的最优纯策略。
从上例看出,矩阵A中平衡局势(α2 ,β2)对应的元素
注:当Ⅰ取纯策略 k 时,等价于混合策略 x {x1, x2 ,, xm} S1*
其中 xi

1,i k 0,i k

矩阵对策的混合策略
2、最优混合策略 定理2:矩阵对策G在混合策略意义下有解的充要条件是:
存在 x* S1*, y* S2* ,使得对于任意 x S1*, y S2* ,有
第六章 对策论
基本概念
对策论又称博弈论,研究冲突对抗条件下最优决策问题
的理论。
策略形势:不完全竞争条件下的对抗行为,各方收益由
自身行为和其他方行为共同决定。
基本要素
局中人(I ):有权决定自己行动方案的对策参加者,理性人 策略集(S ):供局中人选择的实际可行完整行动方案的集合,
一局对策中,各局中人选定策略的集合,称局势
据定义 1,不存在纯策略意义下的解。 无鞍点
例:
G

{S1,
S2;
A} ,其中AFra bibliotek3 5
63 44
56
局中人Ⅰ和Ⅱ在策略集 S1 和 S 2 中采取每一策略都有一
定的可能性,即有一定的概率,则构成了混合策略。
矩阵对策的混合策略
1、混合策略
定义 2:设矩阵对策 G {S1, S2; A},其中 S1 {1,2,,m} ,
,,
yn}
S
* 2
是局中人Ⅱ的一个混合策略;
局中人Ⅰ选取
x S1* 使得保证赢得不少于 v1

max min
xS1* yS2*
E(x,
y) ,
局中人Ⅱ力争保证自己的所失至多 v2

min max E(x, y) 。
yS2* xS1*
矩阵对策的混合策略
5、最优混合策略
定义 4:设 G*
a11 a12 a1n

A


a21
a22

a2n


am1
am2

amn

Ⅰ的赢得矩阵 或Ⅱ的支付矩阵
Ⅱ的赢得矩阵为-A 。
矩阵对策的纯策略
1、矩阵对策的一般表达
如果局中人Ⅰ、Ⅱ的策略集为 S1, S2 ,局中人Ⅰ的赢得矩阵
为 A,则矩阵对策的模型为
G {, ; S1, S2; A} 或 G {S1, S2; A}

1)+ 2
9 2
取 x* {1 ,3}, y* {1 ,1}
44
22
则 E(x*, y*) 9 ,E(x*, y) E(x, y*) 9 ,即 E(x, y*) E(x*, y*) E(x*, y)
2
2
故 x* {1 ,3}, y* {1 ,1} 分别为局中人 I 和局中人 II 的最优混合策略,

{S1*
,
S
* 2
;
E}
是矩阵对策
G
{S1, S2; A}的混合扩充。
如果
max min
xS1* yS2*
E(x,
y)

min
yS2*
max
xS1*
E(x,
y)
,其值为 VG
,则称
VG 为
对策 G* 的值,相应的混合局势 (x*, y*) 称为在混合策略意义下的
解, x* , y* 分别称为局中人Ⅰ和Ⅱ的最优混合策略(最优策略)。
44
22
对策的值(局中人
I
的赢得期望值)VG

9 2

矩阵对策的解法
图解法
仅适用于赢得矩阵为2×n或m×2阶的矩阵对策问题。
例:求解矩阵对策G={S1 , S2 ; A} ,其中
A
相关主题