当前位置:文档之家› 运筹学--对策论

运筹学--对策论


当盟军获悉此情报后,盟军统帅麦克阿 梭命令太平洋战区空军司令肯尼将军组织空 中打击。
日本统帅山本五十六大将心里很明白: 在日本舰队穿过俾斯麦海的三天航行中,不 可能躲开盟军的空中打击,他要策划的是尽 可能减少损失。
日美双方的指挥官及参谋人员都进行了 冷静的思考与全面的谋划。
自然条件对于双方 都是已知的。基本情况如下: 从蜡包尔出发开往莱城的海上航线有南北两条。通过时 间均为3天。
S2= 1 , 2 , 3 ,4
min
6 5 6 5 5* max
A= 1 4 2 -1 -1
8 5 7 5 5* max
0 2 620
max 8 5* 7 5*
min
min
显然 ai2 a12 a1j ai2 a32 a3j 对 i=1,2,3,4 j=1,2,3,4 都成立: a12 = a32 =5由定理5-1,对策 值=5,对策的解( 1 , 2 ),( 3 , 2 ),( 1 , 4 ),( 3 , 4 )
案例中,肯尼将军与山本五十六大 将的赢得(支付)函数都可以用矩 阵A、B表示。
(盟军)北线 南线
(日军)北线 南线
(日军)
北线
南线
2
2 =A
1
3
(盟军)
北线
南线
-2
-2 =B
-1
-3
在本例中的每一个对局,双方的 赢得的代数之和为零,这样的对 策称为“有限零和二人对策”
设两个局中人为I,II,局中人I有 m 个策略:1、 2… m ;用S1表 示这些策略的集合:
I
j
ji
该最优策略为(3, 3),即秋季购煤20 吨。
练习:“二指莫拉问题”,甲乙两人游戏,每人出一个或 两 个手指头,同时又把猜测对方所出的手指数叫出来,若只 有一个人猜测正确,则他所赢得数为二人所出手指之和, 否则,重新开始。写出该对策各局中人的策略集合及甲的 赢得矩阵,并回答局中人是否存在某种出法比其他出法更 为有利。
max min aij
i
j
同样,局中人II可以保证局中人I的 赢得不超过
min max aij
j
i
案例中局中人I(盟军)应当选择 (北线)策略1,这样能保证赢得2。局 中人II(日军)应当选择(北线)策略1 使盟军赢得不超过2。实际上,在( 1, 1)局势下,有
max min aij= min max aij
气象预报表明:未来3天中,北线阴雨,能见度差; 而南线天气晴好,能见度好。
肯尼将军的轰炸机布置在南线的机场,侦察机全天
候进行侦察,但有一定的搜索半径。
经测算,双方均可得到如下估计:
局势1: 盟军的侦察机重点搜索北线,日本舰队也恰好走 北线。由于气候恶劣,能见度差,盟军只能实施两天的 轰炸。
局势2:盟军的侦察机重点搜索北线,日本舰队走南线。 由于发现晚,尽管盟军的轰炸机群在南线,但有效轰炸 也只有两天。
A
28
解:(i, j) 表示自己出 i个手指,猜测对方出 j个手指。
练习:“二指莫拉问 题”,甲乙两人游戏, 每人出一个或两个手 指头,同时又把猜测 对方所出的手指数叫 出来,若只有一个人 猜测正确,则他所赢 得数为二人所出手指 之和,否则,重新开 始。写出该对策各局 中人的策略集合及甲 的赢得矩阵,并回答 局中人是否存在某种 出法比其他出法更为 有利。
i
j
j
i
上式蕴涵的思想是朴素自然的,可以概 括为:“从最坏处着想,去争取最好的 结果”
定义14-1:对给定的矩阵对策
G = S1,S2;A 若等式
max min aij= min max aij
i
j
j
i
成立,则称这个公共值为对策G的值, 记为VG,而达到的局势( i, j ) 称为对策G在纯策略意义下的解,记 为( i*, j *)而i*和 j *分别称为 局中人I和局中人II的最优纯策略。
对策的三要素:
局中人:有权决定自己行为方案的对 局参加者称为局中人。案例中,美日 双方的决策者为局中人。当对局中局 中人只有两人时,称为二人对策。
策略:对局中一个实际可行的方案称 为一个策略。案例中,美日双方各有 二个策略。
赢得矩阵(支付):当每个局中人 在确定了所采取的策略后,他们就 会获得相应的收益或损失,此收益 或损失的值称为赢得(支付)。赢 得与策略之间的对应关系称为赢得 (支付)函数。
北线 1 南线2
(盟军)北线 1 2
2 =A
南线2 1
3
在矩阵中,盟军的最大赢得是3,而要得到3, 必须选择策略 2,而日军的目的是使盟军的赢得尽 量的小,必须选择策略1 ,使盟军的赢得只有1。
在局中人I设法使自己的赢得尽可能大的同时, 局中人II也设法使局中人I的赢得尽可能小。
所以局中人I应首先考虑用 所能赢 得的最小,然后在这些最小赢得中 选择最大。局中人I可以保证赢得
ij
ji
j
已知 E( i, Y*) V E(X*, j )
所以
E ( x ,y * )E (i,y * x i ) E ( x * y * ,x ) i E ( x * y * , )
i
i
E ( x * y ) , E ( x *j) , y j E ( x * y * ,y ) j E ( x * y * , )
第十四章 对策论
对策论概论
对策论(The Game Theory)也称竞赛论或博
弈论,是研究具有竞争、对抗、利益分配等方面 的数量化方法,并提供寻求最优策略的途径。
20世纪40年代形成并发展。1944年以来,对策 论在投资分析、价格制定、费用分摊、财政转移 支付、投标与拍卖、对抗与追踪、国际冲突、双 边贸易谈判、劳资关系以及动物行为进化等领域 得到广泛应用。
解:
局中人I(采购员)有三个策略:
策略1: 10吨,策略2: 15吨,策略3 :20吨。 局中人II(环境):
策略1 较暖 ,策略2 正常,策略3较冷 现把该单位冬天取暖用煤全部费
用(秋季购煤费用与冬天不够时再补购 煤费用)作为采购员的赢得矩阵。
1(10) 2 (15) 3 (20)
1较暖
2正常
E ( x ,j) E ( x ,j ) ( x 1 , ,x m ) a i) ( j 0 , ( , 1 , 0 ) T a ix i j
i
则 E ( x ,y ) a ix j iy j ( a iy jj) x iE (i,y ) x i
ij
ij
i
E ( x ,y ) a ix j iy j( a ix j i) y jE ( x ,j)
14-1矩阵对策的基本概念
案例:俾斯麦海的海空对抗
1943年2月,第二次世界大战中的日本, 在太平洋战区已经处于劣势。为扭转局势, 日本统帅山本五十六大将统率下的一支舰队 策划了一次军事行动:由集结地——南太平 洋的新不列颠群岛的蜡包尔出发,穿过俾斯 麦海,开往新几内亚的莱城,支援困守在那 里的日军。
S1= 1、 2…… m
同样,局中人II有n个策略:1、 2。。。 n ;用S2表示这些策略的集合: S2= 1、 2… n 局中人I的赢得矩阵是:
a11 a12 …… a1n a21 a22 …… a2n A= …… …… …… a m1 a m2 … a mn
局中人II的赢得矩阵是 -A 把一个对策记为G: G= S1,S2;A
在混合策略意义下有解的充分必要条件是:
存在混合局势( X*,Y*),使得对一切 X S1* Y S2*均有 E(X,Y*) E(X*,Y*) E(X*,Y)
定理14-3:对给定的矩阵对策
G = S1,S2;A 设X* S1* Y* S2*则混合局势( X*,Y*)是G的解且 V=VG*的充分必要条件是: 对一切 i,j均有
j
j

E (x ,y * E )(x * y * , E )(x * y ),
定理3把无限个不等式的证明转化为对有限个(mn)个不等式
的证明问题。
定理14-1:矩阵对策 G = S1,S2;A
在纯策略意义下有解的充分必要条 件是:
存在一个局势( *i*, *j *),使 得对一切 i=1,2,… m, j=1, 2…n 均有
aij*<=ai*j*<= ai*j
定理14-1表明矩阵对策
G = S1,S2;A
有解的充分必要条件是在A中存在元
素 ai*j*是其所在行中最小的同时又 是其所在列中最大的。这时ai*j*即 是对策值,因此ai*j*也称为“鞍
0 2 3 0
赢得矩阵为 A 2 0 3 0
0
3
0 4
0
3
4
0
A
29
14.2 矩阵对策的混合策略
定义:对给定的矩阵对策
G = Ⅰ,Ⅱ;S1,S2;A
其中 S1= 1, 2…m
S2= 1 , 2… n
A=(aij)mn
把纯策略集合对应的概率向量
X=(x1, x2 … xm) 其中 xi 0 xi=1 和 Y=(y1 , y2 … yn ) 其中 yj 0 yj=1
例14-4:某单位采购员在秋天时要决定
冬天取暖用煤的采购量。已知在正常气 温条件下需要用煤15吨,在较暖和较冷 气温条件下需要用煤10吨和20吨。假定 冬季的煤价随着天气寒冷的程度而变化,
在较暖、正常、较冷气温条件下每吨煤 价为100元、150元、200元。又秋季每吨 煤价为100元。在没有关于当年冬季气温 情况下,秋季应购多少吨煤,能使总支 出最少?
分别称为局中人I和局中人II的混合策略。
如果局中人I选取的策略为
X=(x1, x2 … xm) 局中人II选取的策略为
Y=(y1 , y2 … yn ),则期望值 E(X,Y)= xi aij yj=XAYT 称为局中人I期望赢得,而局势(X,Y) 称为“混合局势”,局中人I,II的混合 策略集合记为S1*, S2*。
相关主题