第七章 对策论
表 7.1
赢B
石头
剪子
布
A
石头
0
1
-1
剪子
-1
0
1
布
1
-1
0
3.对策论的产生
1944 年,纽曼与曼彻斯特发表了题为《对策论和经济行为》。二次大战前后,由于军事
需要,抽象成数学模型。
50 年代是对策论发展的鼎盛时期,纳什和夏普利等提出了讨价还价模型和合作对策的
“核”的概念。同时,非合作对策也开始创立。纳什于 1950 和 1951 年发表了两篇关于非合作
Ⅰ,Ⅱ的最优纯策略, ai* j* 称为 G 的值,记为VG 。
( ) ( ) (2)
鞍点:若局势 αi* , β j*
对应的 ai* j*
=
max i
min j
aij
=
min j
max i
aij
,则称
αi* , β
j*
为
鞍点。
分析上例中 a23 ,它就满足 ai3 ≤ a23 ≤ a2 j
( ) ( ) 定理 1: G 在纯策略中有解 αi* , β j* ⇔ αi* , β j* 是鞍点
7.1 基本概念
7.1.1 对策现象与对策论
1.对策和对策论 在日常生活中及各种领域内,经常可以看到一些充满着竞争、对抗、冲突的现象。对策 论是研究上述现象的数学理论和方法。它是一种理论模型,其中包括参加者所掌握的全部信 息及可能采取的行动等。 对策论把各式各样的冲突现象抽象成一种数学模型,然后给出分析这些问题的方法和 解。应该说明的是,所谓解是指对策中的所有参与者都按最佳策略行动而得到的结果。对策 论的研究中一般都假设:在对策中所有参与者都是“完全理智”的,在采取的策略上没有任 何失误。 2.对策现象 (1)下棋:围棋源于我国殷代。 (2)齐王赛马:齐王与大将田忌赛马,各自的马都分为三等,但齐王的同等马均强于 田忌。孙膑给田忌出主意,用下----上,上----中,中----下,结果田忌胜出。 (3)猜手:小孩 A 与 B 猜手,若规定赢得 1 分,平得 0 分,输得 -1 分,则 A 的赢得可 用下表来表示
⎛ 0 −2
2⎞
−2 •
例 7.2
⎜ ⎜⎜⎝
5 2
4 3
−−43 ⎟⎟⎟⎠
−3 −4
54 2
min
j
max i
aij
=
2,
max i
min j
aij
=
−2 ,鞍点不存在,即在纯策略意义下无解
⎛6 5 6 5 ⎞ 5
⎜•
•⎟ •
⎜ 1 4 2 −1⎟ −1
例 7.3
⎜ ⎜
8
5
•
7
5
•
⎟ ⎟
5
•
⎜⎝ 0 2 6 2 ⎟⎠ 0
第七章 对策论
(Game Theory)
本章重点:基本概念、矩阵对策的混合扩充 本章难点:矩阵对策的混合扩充
Game Theory 也可译为博弈论,是研究决策主体的行为发生直接相互作用时的决策以及 这种决策的均衡问题的学科。
1994 年诺贝尔经济学奖授给了三位博弈论专家:纳什、泽尔腾、海萨尼。博弈论已经 成为当代经济学的基石。博弈论博大精深,它不仅在经济学领域得到广泛应用,在军事、政 治、商业征战、社会科学领域以及生物学等自然科学领域都有非常重大的影响,工程学中如 控制论工程也少不了它。
一个混合局势。
(4)对一个混合局势 (X, Y) ,用 E(X, Y) = XTAY 表示局中人Ⅰ的收益期望值。 (5)用G* = (S1*,S*2 ,E) 表示G= (S1,S2 ,A) 的混合扩充。
(6) 混合扩充的解与值
若G* 的值VG* = E( X *,Y *) 满足 E( X ,Y *) ≤ E( X *,Y *) ≤ E( X *,Y ) * 式 G* 的解 ( X *,Y *) 也称 G 在混合策略意义下的解。
7.2.1 矩阵对策的最优纯策略
1.矩阵对策 设二人有限零和对策问题中的局中人为Ⅰ,Ⅱ,
策略集为 S 1
=
{α1 , α 2
,αm}, S2 = {β1,β 2
, βn},
α1 则支付可以用矩阵 A =
αm
β1, ⎜⎛ a11, ⎜ ⎜⎝ am1,
, βn , a1n ⎟⎞ 表示,
⎟ , amn ⎟⎠
min j
aij
=
2
,即对策解是(α3, β1)VG
=
2。
根据性质 3,则 X* = (0, 0,1, 0),Y * = (1, 0, 0, 0),VG* = 2
性质 4: G1 = (S1, S2 , A1), G2 = (S1, S2 , A2 ), A1 = (aij ), A2 = (aij + d ) ,则:
分析*式:
E(X ,Y*) ≤ E(X *,Y*) ≤ E(X *,Y)
E( X *,Y * ) = X *T AY *
分析左式:
= (x1*
⎛ a11
xm*
)
⎜ ⎜
…
a1n
⎞⎛ ⎟⎜
y1*
⎞ ⎟
⎟⎜ ⎟
⎜⎝ am1
amn ⎟⎠ ⎜⎝ yn* ⎟⎠
E( X ,Y *) = X T AY * = (x1
也可以写成:
⎛
xm
)
⎜ ⎜
A1
⎞⎛ ⎟⎜ ⎟⎜
y1*
⎞ ⎟ ⎟
=
( x1
⎜⎝ Am ⎟⎠ ⎜⎝ yn* ⎟⎠
⎛ ⎜
A1Y
*
⎞ ⎟
xm ) ⎜
⎟
⎜⎝ AmY * ⎟⎠
y1*
x1
⎛ ⎜
a11
⎜ xm ⎜⎝ am1
yn*
…
a1n
⎞ ⎟
⎟ amn ⎟⎠
x1 A1Y *
Y * 已固定Ⅰ将在 X 中选
xm AM Y *
证明: ⇐
记
min j
ai*
j
=
min j
max i
aij
=
max i
min j
aij
=
max i
aij*
min j
ai*
j
=
ai*
j*
,
max i
aij*
=
ai* j*
故 aij* ≤ a , a i* j* i* j* ≤ ai* j i = 1, , m j = 1, , n
( ) ∴ aij* ≤ ai* j* ≤ ai* j ,即 αi* , β j* 是 G 的解
使得受益最大
x1* A1Y * ≤
xm* AmY *
x1* A1Y *
进一步:
中必有每个 AiY * ≤ VG*
xm* AmY *
( 因为若有某个 Ai0Y* > VG* ,则Ⅰ出αi0 ,即取 X = 0
1
0) ,
i0
此时Vi0 > VG* 矛盾。而且若有某 i0 ,使 Ai0Y* <VG* ,则必有 X i0=0 。
对策的文章,图克于 1950 年定义了“囚徒困境”问题。 60 年代,泽尔腾(1965)引入动态分析,提出“精练纳什均衡”概念。海萨尼(1967-1968)
则把不完全信息引入对策论的研究。
7.1.2 对策问题的组成
1. 局中人(参加者):一局对策的参加者。如齐王赛马例中局中人为齐王和田忌。 2. 策略:局中人在一局对策中对付对手的一个完整的方案。 策略集:局中人在一局对策中所有策略的全体。记为 S(分为有限和无限) 问:田忌和齐王的 S=? 答:(S={(上中下),(上下中),(中上下),(中下上),(下上中),(下中上)}) 3. 局势:在一局对策中,每个局中人都选定一策略后的各策略总和。
(1) VG = VG' (2) y*' = y* 若 X *' = (x1* xk*−1,xk*+1 xm* ) ,则 X * = (x1* xk*−1,0,xk*+1 xm* )
例 7.5 用优超原理求解下列对策问题
⎛ 1 0 3 4⎞
A
=
⎜ ⎜
-1
⎜2
4 2
0 2
1
⎟ ⎟
3⎟
⎜ ⎝
0
4
1
1
⎟ ⎠
其中 aij 为Ⅰ的得(也是Ⅱ的失),Ⅱ的得即为 − aij 。
( ) 故又称二人有限零和对策为矩阵对策,记为 G = S1, S2, A
2.理智局中人的选择
在矩阵对策中,局中人将如何选取自己的策略呢?
α1 举例说明,若 A = α2
α3
β1, β2 , β3 ⎜⎛ −1 3 − 2⎟⎞ ⎜4 3 2⎟ ⎜⎝ 6 1 − 8 ⎟⎠
⇒
∵ aij* ≤ ai* j* ≤ ai* j i = 1, , m j = 1, , n
∴
max i
aij*
≤
ai* j*
≤
min j
ai*
j
min j
max i
aij
≤
max i
aij*
≤
ai* j*
≤
min j
ai*
j
≤
max i
min j
aij
但对于任意
A
,有
max i
min j
aij
≤
min j
max i
aij
( ) ∴只有 ai* j*
=
min j
max i
aij
=
max min
i
j
aij
,即
αi* , β
j*
是鞍点