当前位置：文档之家› 《运筹学教程》胡云权第五版运筹学6对策论矩阵对策 34页

《运筹学教程》胡云权第五版运筹学6对策论矩阵对策 34页

x* ( 3 , 8 )T 11 11
由图可见局中人II的混合策略只有β2和β3组成。
I
II ① 数轴上坐标为0和1的两点分
11 别做两条垂线I-I和II-II。
7
② 画出局中人II的不同策略下局中人I的赢得线段。
5
3
β1: v11 = 2x+7(1-x)
2
2
β2 : v12 = 3x+5(1-x)
0
1
β3 : v13 = 11x+2(1-x)
I
II
图解法
③由于局中人II理性，局中人 I从最少可能收入中选择最大的一个，为局中人I的最优对策。B2
矩阵对策的混合策略
1、混合策略
对于 G {S1, S2; A}
局中人Ⅰ有把握的赢得至少为 v1

max min
i
j
aij
局中人Ⅱ有把握的支付至多为 v2

min j
max i
aij
一般为 v1 v2 ，特别地当 v1 v2 时，则称对策 G 在
纯策略意义下的解，即VG v1 v2 。实际多 v1 v2 ，根

1 1 1 1 1 3
矩阵对策的纯策略
2、矩阵对策解的引例
例：设 G {S1, S2; A} ，
其中 S1 {1,2,3,4} ， S2 {1, 2, 3}，
6
A

3
9
3
1 2 1 0
8 -8
4

2
10 -
6

10
S1* {(x1, x2 ) | x1, x2 0, x1 x2 1}， S2* {( y1, y2 ) | y1, y2 0, y1 y2 1}
局中人 I 的赢得期望值
E(x,
y)

3x1 y1
6x1y2
5x2 y1

4x2 y2

4(x1

1 4
)(
y1
4、混合策略对策模型
一个新的对策 G*

{S1*
,
S
* 2
;
E}
，则称
G
*
为
G
的混合扩充。
矩阵对策的混合策略
5、最优混合策略
设
G*

{S1*
,
S
* 2
;
E}
，是矩阵对策
G

{S1,
S2;
A}
的混合扩充。
x {x1, x2 ,, xm} S1* 是局中人Ⅰ的一个混合策略；
y

{ y1 ,
y2
9 2 6 -3
理智行为：从各自最不利情形中选择最有利 I：最大最小原则 II：最小最大原则
平衡局势：双方均可接受，且对双方都是最稳妥的结果。（α2 ，β2），局中人I和II的最优纯策略。
矩阵对策的纯策略
3、矩阵对策的最优纯策略
定义 1：设 G {S1, S2; A}为矩阵对策，其中
S1 {1,2 ,,m} ， S2 {1, 2 ,, n}, A {aij }mn ，
a22既是其所在行的最小元素，也是其所在列的最大元素，
即有 ai2≤a22 ≤ a2j i=1,2,3,4 j=1,2,3
矩阵对策的纯策略
3、矩阵对策的最优纯策略
定理 1: 矩阵对策 G {S1, S2; A}在纯策略意义下有解的充要条
件是：存在纯局势
( i
*
,

j*
)
使得对一切
i

1,2,, m;
Ⅱ的策略集为： S2 {1, 2 , j , , n} 。
当Ⅰ、Ⅱ分别选择纯策略i , j 时，形成了一个纯局势
(i , j ) S S1 S2 ，则对任一 (i , j ) S ，记Ⅰ的赢得值为 ai j ，即Ⅱ赢得值为 ai j (i 1,2,, m; j 1,2,, n) .
j

1,2,, n
均有
a ij
*
ai* j*
ai* j
2 7 2 1 1
例： G {S1, S2; A}，其中 A 2
3
2 5
3 4
4 2 4 3
2 2 1 6 1
3746
由
max i
min j
aij

min j
max i
aij
a31
3 则VG

3 ，G 的解
为3, 1分别是局中人Ⅰ、Ⅱ的最优纯策略。
事实：对策 G 的值VG ai* j* 是 A a 中 i* j* 所在的行的最小
元素，又是所在列的最大元素，即
a ij
*
ai* j*
ai* j 。
矩阵对策的纯策略
4、矩阵对策的鞍点与解
对于一个对策G={S1, S2, A}, 若
有
max i
矩阵对策的策略
纯策略：确定的选择某策略混合策略：以某一概率分布选择各策略。
矩阵对策的纯策略
1、矩阵对策的一般表达
设用Ⅰ、Ⅱ分别表示两局中人，Ⅰ有 m 个纯策略
1,2 ,,m ，Ⅱ有 n 个纯策略 1, 2 ,, n ，则
Ⅰ的策略集为： S1 {1,2 , i , ,m}，
如
果
max i
min j
aij

min j
max i
aij

ai* j*
成立，记 VG
ai* j*
，则
称VG ai* j* 为矩阵对策 G 的值.
相应的纯局势 (i* , j* ) 为 G 在纯策略下的解，i* 与 j*
分别称为局中人Ⅰ与Ⅱ的最优纯策略。
从上例看出，矩阵A中平衡局势（α2 ，β2）对应的元素
注：当Ⅰ取纯策略 k 时，等价于混合策略 x {x1, x2 ,, xm} S1*
其中 xi

1,i k 0,i k
。
矩阵对策的混合策略
2、最优混合策略定理2：矩阵对策G在混合策略意义下有解的充要条件是：
存在 x* S1*, y* S2* ，使得对于任意 x S1*, y S2* ，有
第六章对策论
基本概念
对策论又称博弈论，研究冲突对抗条件下最优决策问题
的理论。
策略形势：不完全竞争条件下的对抗行为，各方收益由
自身行为和其他方行为共同决定。
基本要素
局中人（I ）：有权决定自己行动方案的对策参加者，理性人策略集（S ）：供局中人选择的实际可行完整行动方案的集合，
一局对策中，各局中人选定策略的集合，称局势
据定义 1，不存在纯策略意义下的解。无鞍点
例：
G

{S1,
S2;
A} ，其中AFra bibliotek3 5
63 44
56
局中人Ⅰ和Ⅱ在策略集 S1 和 S 2 中采取每一策略都有一
定的可能性，即有一定的概率，则构成了混合策略。
矩阵对策的混合策略
1、混合策略
定义 2：设矩阵对策 G {S1, S2; A}，其中 S1 {1,2,,m} ，
,,
yn}
S
* 2
是局中人Ⅱ的一个混合策略；
局中人Ⅰ选取
x S1* 使得保证赢得不少于 v1

max min
xS1* yS2*
E(x,
y) ，
局中人Ⅱ力争保证自己的所失至多 v2

min max E(x, y) 。
yS2* xS1*
矩阵对策的混合策略
5、最优混合策略
定义 4：设 G*
a11 a12 a1n
记
A

a21
a22

a2n

am1
am2

amn

Ⅰ的赢得矩阵或Ⅱ的支付矩阵
Ⅱ的赢得矩阵为-A 。
矩阵对策的纯策略
1、矩阵对策的一般表达
如果局中人Ⅰ、Ⅱ的策略集为 S1, S2 ，局中人Ⅰ的赢得矩阵
为 A，则矩阵对策的模型为
G {, ; S1, S2; A} 或 G {S1, S2; A}

1)+ 2
9 2
取 x* {1 ，3}, y* {1 ，1}
44
22
则 E(x*, y*) 9 ，E(x*, y) E(x, y*) 9 ，即 E(x, y*) E(x*, y*) E(x*, y)
2
2
故 x* {1 ，3}, y* {1 ，1} 分别为局中人 I 和局中人 II 的最优混合策略，

{S1*
,
S
* 2
;
E}
是矩阵对策
G
{S1, S2; A}的混合扩充。
如果
max min
xS1* yS2*
E(x,
y)

min
yS2*
max
xS1*
E(x,
y)
，其值为 VG
，则称
VG 为
对策 G* 的值，相应的混合局势 (x*, y*) 称为在混合策略意义下的
解， x* , y* 分别称为局中人Ⅰ和Ⅱ的最优混合策略（最优策略）。
44
22
对策的值（局中人
I
的赢得期望值）VG

9 2
。
矩阵对策的解法
图解法
仅适用于赢得矩阵为2×n或m×2阶的矩阵对策问题。
例：求解矩阵对策G={S1 , S2 ; A} ,其中
A

e商务文档

《运筹学教程》胡云权第五版运筹学6对策论矩阵对策 34页

相关文档推荐：