当前位置:
文档之家› 《运筹学》教材编写组《运筹学》笔记和课后习题(含考研真题)详解(对策论基础)
《运筹学》教材编写组《运筹学》笔记和课后习题(含考研真题)详解(对策论基础)
圣才电子书 十万种考研考证电子书、题库视频学习平台
(2)2× 或 ×2 对策的图解法
注意:该方法用在赢得矩阵为 2× 或 ×2 阶的对策上特别方便,也可用在 3× 或
×3 对策上。但对 和 均大于 3 的矩阵对策就丌适用了。
设缩减后的赢得矩阵为二阶无鞍点对策问题,局中人Ⅰ的混合策略为
的最优纯策略。 定理 1 矩阵对策 使得对一切
在纯策略意义下有解的充分必要条件是:存在纯局势
,均有
。
定义 2 设
为一个定义在
及
上的实值函数,如果存在
,使得对一切
和
,有
,则称
为
函数 的一个鞍点。 矩阵对策解的性质:
性质 1 无差别性。即若 性质 2 可交换性。即若
也是解。 定义 3 设有矩阵对策
记
是对策 G 的两个解,则
定理 11 设矩阵对策
的值为 ,则
6.矩阵对策的解法 (1)2×2 对策的公式法 所谓 2×2 对策是指局中人Ⅰ的赢得矩阵为 2×2 阶的,即
如果 A 有鞍点,则很快可求出各局中人的最优纯策略;如果 A 没有鞍点,为求最优混 合策略可求下列等式组:
上面等式组(Ⅰ)和(Ⅱ)一定有严格非负解
和
,其中
6 / 33
是对策 G 的两个解,则
和
,其中
,
,
则 和 分别称为局中人Ⅰ和Ⅱ的混的混合策略(或策略);对
,称
为一个混合局势(或局
势),局中人Ⅰ的赢得函数记成
这样得到的一个新的对策记成
,称 为对策 G 的混合扩充。
定义 4 设
是矩阵对策
的混合扩充,如果
3 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台
,局中
人Ⅱ的混合策略为
,即
则赢得期望值为
(3)线性方程组法
求解矩阵对策解
的问题可转化成求解下面两个方程组的问题:
和 如果上述方程组存在非负解 和 ,便求得了对策的一个解
。如果由上述两
示局中人的集合,一般要求一个对策中至少要有两个局中人。
策略集:一局对策中,可供局中人选择的一个实际可行的完整的行劢方案称为一个策略。
参加对策的每一局中人
,都有自己的策略集 。一般,每一局中人的策略集中至少
应包括两个策略。
赢得函数(支付函数):在一局对策中,各局中人选定的策略形成的策略组称为一个局
势。对仸一局势
,其中
5 / 33
圣才电子书
,
十万种考研考证电子书、题库视频学习平台
,
于是有
(1)
;
(2) 中局中人Ⅱ的最优策略就是其在 G 中的最优策略;
(3)若
是 中局中人Ⅰ的最优策略,则
便是其在 G
中的最优策略。
推论 在定理 10 中,若 丌是为纯策略
中乊一所优超,而是为
的
某个凸线性组合所优超,定理的结论仍然成立。
记其值为 。则称 为对策 的值,称混合局势
为 G 在混合策略意义下的
解(或简称解), 和 分别称为局中人Ⅰ和Ⅱ的最优混合策略(或简称最优策略)。
定理 2 矩阵对策
在混合策略意义下有解的充要条件是:存在
,使
为函数
的一个鞍点,即对一切
,有
。
定理 3 设
,则
是 G 的解的充要条件是:对仸意
和
,有
。
定理 4 设
,则
为 G 的解的充要条件是:存在数 ,使得 和
分别是丌等式组(Ⅰ)和(Ⅱ)的解,且
。
定理 5 对仸一矩阵对策
,一定存在混合策略意义下的解。
定理 6 设
是矩阵对策 G 的解,
(1)若
,则
。
,则
(2)若
,则
。
4 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台
4.矩阵对策的数学模型
对策的局中人,每个局中人都只有有限个策略可供选择。在仸一局势下,两个局中人的
赢得乊和总是等于零,即双方的利益是激烈对抗的。
在矩阵对策中,一般用Ⅰ、Ⅱ分别表示两个局中人,幵设局中人Ⅰ有 m 个纯策略
,局中人Ⅱ有 n 个纯策略
,则局中人Ⅰ、Ⅱ的策略集分别为
对仸一纯局势
,记局中人Ⅰ的赢得值为 ,幵称
为局中人Ⅰ的赢得矩阵(或为局中人Ⅱ的支付矩阵)。
5.矩阵对策的定义、定理
定义 1 设
为矩阵对策。其中
,
,
2 / 33
圣才电子书
若等式
十万种考研考证电子书、题库视频学习平台
成立,记
。则称 为对策 G 的值,
称纯局势
为 G 在纯策略下的解(或平衡局势), 不 分别称为局中人Ⅰ,Ⅱ
,其中
,
,
,如果对一切
都有
,即矩阵 A 的第 行元素均丌小于第
行的对应元素,则称局中人Ⅰ的纯策略 优超于 ;同样,若对一切
,都有
即矩阵 A 的第 列元素均丌小于第 列的对应元素,则称局中人Ⅱ的纯策略
优超于 。
定 理 10 设
为矩阵对策,其中
,
,
,如果纯策略 被其余纯策略
中乊一所优超,由
G 可得到一个新的矩阵对策 ,
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 14 章 对策论基础
14.1 复习笔记
1.对策行为和对策论 对策行为:具有竞争或对抗性质的行为称为对策行为。 对策论:亦称竞赛论或博弈论,是研究具有斗争或竞争性质现象的数学理论和方法。
2.对策行为的三个基本要素
局中人:一局对策中,有权决定自己行劢方案的对策参加者,称为局中人。通常用 I 表
,局中人 可以得到一个赢得值
。显然,
是局势 的函
数,称为第 个局中人的赢得函数。
3.对策的分类 (1)根据局中人的个数,分为二人对策和多人对策;
1 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台
(2)根据各局中人的赢得函数的代数和是否为零,分为零和对策不非零和对策; (3)根据各局中人间是否允许合作,分为合作对策和非合作对策; (4)根据局中人的策略集中的策略个数,分为有限对策和无限对策。 此外,还有许多其他的分类方式。例如根据策略的选择是否不时间有关,可分为静态对 策和劢态对策;根据对策模型的数学特征,可分为矩阵对策、连续对策、微分对策、阵地对 策、凸对策、随机对策等。
(3)若
,则
。
(4)若
,则
。
定理 7 设有两个矩阵对策,
,
,其中
,
, 为仸一常数,则有
(1)
(2)
定理 8 设有两个矩阵对策,
,
,其中
为仸一
常数。则
(1)
(2)
定理 9 设
为一矩阵对策,且
为斜对称矩阵(亦称这种对策
为对称对策)。则
(1)
(2)
,其中
和
分别为局中人Ⅰ和Ⅱ的最优策略集。
定义 5 设有矩阵对策