06 零和博弈模型
q1 0.25 q2 0.75 q3 0
所以,甲的最优混合策略为(0.372,0.384,0.244) 所以,乙的最优混合策略为(0.25,0.75,0)
最优期望收益为 v 练习1:教材P119例题
9 1 4 2 2
10 6 3 A 8 5 5 12 10 8
v
,
令 x1
p3 p1 p2 p3 1 p1 p2 , x2 , x3 , 则x1 x2 x3 v v v v v
p1a11 p2 a21 p3 a31 v p1a12 p2 a22 p3 a32 v p1a13 p2 a23 p3 a33 v
7 8 A 7 6
解:设甲的混合策略为
( x,1 x) , x [0,1] 乙的混合策略为 ( y,1 y) , y [0,1]
8
8
则
7
701ຫໍສະໝຸດ x01y
-6 -7
-6 -7
计算得 x 13/ 28,VG 1 / 2
y 1 / 2,VG 1 / 2
x 3 / 11 V 49 / 11 G
根据图可分析出,乙不可能选择策略1,因此y1=0
49 / 11 3 y2 11y3 49 / 11 5 y2 2 y3 y 2 y3 1
y2 9 / 11 y 2 / 11 3
3 8 因此,该博弈中,甲的混合策略为 x ( , ) 11 11 9 2 * 乙的混合策略为 y (0, , ) 11 11
x1 0.0826 x2 0.0854 x3 0.0542 1 2 min v 9
p1 0.372 p2 0.384 p3 0.244
同理,乙的混合策略求解的线性规划模型为
y1 0.0556 y2 0.1667 y3 0 1 2 max v 9
v* 1 / 0.08589 12 0.357
因此,甲的混合策略为(13/28,15/28),乙的混合策略为(1/2,1/2)
例3:求解下面零和博弈矩阵的混合策略
2 3 11 A 7 5 2 解:设甲的混合策略为 ( x,1 x) , x [0,1]
11
则
7 5 3 2 0 X* 2 1
VG 9 x 2 V 2 x 5 G
A3 A4
B1 -420 210 630 -210
B厂 B2 70 140
-70 -70
B3 -560 280 -630 420
min -560 140 -630 -210 练习:教材P116
-420 70 -70
140 280
-210 -70
max
630
140 420
maxmin minmax
例2:求二人零和博弈的均衡值(鞍点)
*
49 最优期望收益为 VG 11
练习:求解下面零和博弈矩阵的混合策略
2 7 A 6 6 11 2 解:设乙的混合策略为 ( y,1 y) , y [0,1]
11
7 6
B1 B2 6
1 4 y ( y,1 y ), 其中 y [ , ] 5 9
*
甲希望期望收益 v
1 最大化,则应将 x1 x2 x3 最小化 v
根据收益矩阵情况,所有元素可加上适当的数使得v非负, 这样,线性规划模型的变量取值即可要求全为非负,即 得到
1 min x1 x2 x3 v x1a11 x2 a21 x3 a31 1 x1a12 x2 a22 x3 a32 1 x a x a x a 1 1 13 2 23 3 33 x1 0, x2 0, x3 0
请问:A、B两厂分别会选择生产哪种型号电视机呢?
二人有限零和博弈是指参加博弈的参与人只有两个,每个参与人 都只有有限多个策略可供选择,而且在任何一个局势中,两个参 与人的收益之和总是等于零。
设两参与人分别为甲和乙,甲有 m个纯策略 1 , 2 ,, m可供选择, 乙有n个纯策略
1 , 2 ,可供选择,则甲乙的策略集分别为 , n
相应,乙的赢得为-A
通常,将二人有限零和博弈记成
G {S1 , S2 ; A}
(1)构建二人零和博弈模型 减去平均收益800万元 (2)求解模型:最大最小 原则(最小最大原则), 即考虑最坏的可能性的基 础上争取最好的结果 B1 A1 A2 A3 A4 210 630 B2 B3 -560 -630 420 A 厂 A1 A2
1 min x1 x2 x3 v 22x1 20x2 1 6 x1 17x2 2 x3 1 15x 7 x 20x 1 2 3 1 x1 0, x2 0, x3 0
求解线性规划模型,得到甲乙两人的最优混合策略分别为
( p1, p2 , p3 ) (0,0.643 ,0.357) (q1 , q2 , q3 ) (0,0.464,0.536)
解:将原收益矩阵各元素均加上12,得到
构建线性规划模型为
22 6 15 A' 20 17 7 0 2 20
1 max y1 y2 y3 v 22 y1 6 y2 15y3 1 20 y1 17 y2 7 y3 1 2 y 20 y 1 2 3 y1 0, y2 0, y3 0
因此原收益矩阵加上4可变为
0 6 9 A' 6 4 7 9 3 0
代入甲的线性规划模型,得到
1 min x1 x2 x3 v 6 x2 9 x3 1 6 x1 4 x2 3 x3 1 9x 7x 1 1 2 x1 0, x2 0, x3 0 1 max y1 y2 y3 v 6 y 2 9 y3 1 6 y1 4 y2 7 y3 1 9 y 3y 1 1 2 y1 0, y2 0, y3 0
S1 {1 , 2 , , m } S 2 {1 , 2 ,, n }
当甲选定 i 、乙选定 j 后,就形成了一个策略组合(也称局 势) (i , j ) ,对任一局势,记甲的赢得收益为 aij ,则甲的赢
得收益矩阵为
a11 a1n A am1 amn
零和博弈模型
“博弈”描述性定义:博弈就是一些个人、队组或其他组织, 面对一定的环境条件,在一定的规则下,同时或先后,一次
或多次,从各自允许选择的行为或策略中进行选择并加以实
施,各自取得相应结果的过程。 • 零和博弈:也称“严格竞争博弈”。博弈方之间利益始 终对立 —猜硬币,田忌赛马,石头-剪刀-布 • 常和博弈:博弈方之间利益的总和为常数。博弈方之间 的利益是对立的且是竞争关系 —分配固定数额的奖金、利润,遗产官司 • 变和博弈:零和博弈和常和博弈以外的所有博弈。合作 利益存在,博弈效率问题的重要性。 —囚徒困境、产量博弈等
x* (0,1,0)
2 2
VG 6
线性规划解法 求解零和博弈 G {S1 , S2 ; A},其中 S1 {1, 2 ,3}, S2 {1 , 2 , 3}
5 4 2 A 2 0 3 5 1 4
解:设参与人甲的最优混合策略为 p1 , p2 , p3 ,期望收益为 则得到如下一组不等式
二人有限策略零和博弈
例1:某城市有A、B两家电视机厂,A厂设计了4种型号的电视 机A1,A2,A3,A4;B厂设计了3种型号的电视机B1,B2,B3,由于资 金所限,两厂均只能选择一种型号的电视机投产,根据权威市 场研究机构调查,该市居民将用1600万元购买本地产电视机, 而对双方不同的型号,预测A厂的销售额如表1所示(单位:万 元) B厂 B1 B2 B3 A1 380 870 240 A厂 A2 1010 940 1080 A3 1430 730 170 A4 590 730 1220