当前位置：文档之家› 混合策略纳什均衡(上)2013

混合策略纳什均衡(上)2013

随机地从纯策略集合中选择一种纯策略作为实际的行动。
新浪微博：一花一世界economics
2013年10月29日
混合策略包括原来的纯策略
10
混合策略概念是原来纯策略概念的推广。混合策略（mixed strategy）纯策略（pure strategy）不确定性（uncertainty）期望支付（expected payoff）
2013年10月29日
新浪微博：一花一世界economics
混合策略与纯策略有很大区别
9
在局中人只有两个纯策略可以选择的情形，混合策略是一种按照什么概率选择这个纯策略，按照什么策略选择那种纯策略的策略选择指示。纯策略给每个局中人具体明确了一个非随机性的行
动计划。
而混合策略则表明，局中人可以按照一定的概率，
新浪微博：一花一世界economics
2013年10月29日
与混合策略相伴随的一个问题
11
是局中人支付的不确定性。为了刻画不确定情形下局中人的支付，我们需要借助期望支付的概念。在博弈论中，当局中人并不清楚其他局中人的实际策
略选择时，他的支付便具有不确定性，为此，他只能通过计算期望支付的方式来预测自己的得益情况，确定自己的策略选择。
新浪微博：一花一世界economics
2013年10月29日
重新定义纳什均衡
23
从二人同时决策博弈看，混合策略纳什均衡必须是两个局中人的相对最优混合
策略的组合，所谓相对最优混合策略，是指在给定对方选择该相对最优混合策略的条件下，能使局中人自身的期望支付达到最大的混合策略。
27
从定义3.2可以看出，第二章中定义2.4给出的纳什均衡，是现在给出的混合策略纳什均衡的特例。所以相对于现在定义的比较广泛的混合
策略纳什均衡，原来定义2.4定义的纳什均衡，可以特别叫做纯策略纳什均衡。
新浪微博：一花一世界economics
2013年10月29日
具体来说，
表示局中人i之外所有其他局中人的混合策略组合。至此，局中人i的期望支付可以具体定义为：
π i ( p ) = ∑s∈S (∏ j =1 p j ( s j ))ui ( s )
n
其中 ui ( s)是我们在纯策略情况熟悉的当所有局中人采取s这个策略组合的时候局中人i之支付， n 而正是所有局中人各自的策略选择正好 p ( s ) ∏ j j 组成纯策略组合s的概率。 j =1
新浪微博：一花一世界economics
对于任意的 p2 ∈ ∑ 2
2013年10月29日
更一般地，
25
对于一个有n个局中人参与的同时
决策博弈，其混合策略纳什均衡 Nash equilibrium of mixed strategies 的定义可具体表述为：定义3.2
新浪微博：一花一世界economics
2013年10月29日
定义3.2混合策略纳什均衡
26
设
p* = ( p1*, , pi *, , pn *)
是n人策略式博弈
G = {S1 , , S n ; u1 , , un }
的一个混合策略组合。如果对于所有的 i = 1, , n, π i ( pi *, p−i *) ≥ π i ( pi , p−i *)
混合策略纳什均衡
北京邮电大学本科选修课程《信息经济学》高丛 1HUA1SHIJIE100@
在纳什均衡不存在或者不唯一的情形，
2
前面介绍的纳什均衡的定义和寻找纳什均衡的方法，就不足以帮助我们对博弈的最终结果作出明确的预
测，无法给参与博弈的局中人提供明确的决策建议。因此，我们需要拓展纳什均衡的概念，引入新的分析工具，
对存在多个纳什均衡的博弈和“不存在”纳什均衡
的博弈作进一步的讨论。
新浪微博：一花一世界economics
2013年10月29日
本章内容：
3
本章首先引入混合策略和期望支付的概念，在此基础上定义混合策略纳什均衡，然后具体介绍求解纳什均衡的反应函数法，并给出混合策略纳什均衡的直观解释。我们讨论多重纳什均衡的问题及其筛选标准。
需要说明的是，
14
期望支付的标准写法是EU，从而甲的期望支付的标准写法是EUA，但是在概率p和q明显出现的时候，我们约定也可以写成UA(p,q)，表达式里面已经有期望的意思。 UB(p,q)与EUB的关系也是这样。
新浪微博：一花一世界economics
2013年10月29日
新浪微博：一花一世界economics
2013年10月29日
对有n个局中人参与的策略式博弈的混合策略给出如下定义3.1 混合策略
20
在一个有n个局中人参与的策略式博弈中，
G = {S1 , , S n ; u1 , , un }
pi = ( pil , , piK )
假定局中人i有K个纯策略，即则概率分布其中
5
我们考虑一个“扑克牌对色游戏”
（game of color matching）：两人博弈，每人从自己的扑克牌中抽一张出来，一起翻开。如果颜色一样，甲输给乙一根火柴；如果颜色不一样，甲赢得乙一根火柴。为了确定起见，我们不允许出“大鬼”和“小鬼”。
2013年10月29日
更一般地，二人博弈矩阵表示
15
S S
局中人1
2 1
1 1
b11
a11 a21
…
ห้องสมุดไป่ตู้
2 S2
局中人2
…
a1n a2 n
2 Sn
b12 … a12 b22 …
b1n b2 n
…
S
1 2
b21
a22
… …
新浪微博：一花一世界economics
…
S
1 m
am1
bm1
am 2
bm 2 …
amn
bmn
2013年10月29日
新浪微博：一花一世界economics
2013年10月29日
用比较学术化的语言，
24
如果
p* = ( p1*, p2 *)
是二人博弈的一个纳什均衡，它必须满足：
π 1 ( p1*, p2 *) ≥ π 1 ( p1 , p2 *)
和
对于任意的 p1 ∈ ∑ 1
π 2 ( p1*, p2 *) ≥ π 1 ( p1*, p2 )
二人博弈的数学表达
16
因为行局中人有m种可以选择的纯策略，所以他的混合策略可以紧凑地表示为一个向量
p = ( p1 , p2 , , pm )
要求对每一个纯策略i都有 pi
∑i =1 pi = 1 。 ≥ 0 ，并且满足
m
同样，因为列局中人有n种可以选择的纯策略，所以他的混合策略可以紧凑地表示为一个向量要求对每一个纯策略j都有 q j
pi = 1，而 pk = 0 对任意 k ≠ i 都成立，
，以0的概率选择其他任何策略。这时候，行局中人的纯策略可表述为
p = (0,0, .0,1,0, ,0)
其中1只在i的位置出现一次。这样的向量一共有m个，正好对应局中人的m个纯策略。
新浪微博：一花一世界economics
Si = {sil , , siK }
0 ≤ pik ≤ 1,
∑
k k =1
pik = 1
称为局中人i的一个混合策略，这里表示局中人i选择纯策略
新浪微博：一花一世界economics
pik = p ( sik )
Sik 的概率 k = 1, , K
2013年10月29日
本课程约定
21
用
28
如果 p* = ( p1*, , pi *, , pn *) 是一个现在定义的混合策略的纳什均衡，但是对于每个 i = 1, , n * 概率分布 pi = ( pi1*, , piki *) 的分量中，都只有一个是1，其余都是0，即所有概率分布 * * pi = ( pi1*, , piki *) 都取 pi = (1,0, ,0) * * pi = (0, ,0,1,0, ,0) 或者 pi = (0, ,0,1) 的形式，那么这个“混合”策略纳什均衡就是原来定义2.4的（纯策略）纳什均衡。
∑ 表示局中人i的混合策略空间
i
Space of mixed strategies 于是，
p = ( p1 , , pi , , pn ), pi ∈ ∑i
就表示博弈的一个混合策略组合 Mixed strategy profile
pi 都是一个混合策略向量。这时候，我们用 π i ( p ) = π i ( p1 , , pi , , pn ) 表示局中人i在混合策略组合 p = ( p1 , , pi , , pn )
新浪微博：一花一世界economics
“扑克牌对色游戏”
6
乙
红
黑
1
红甲黑
－1 1 1 －1
2013年10月29日
－1 －1 1
新浪微博：一花一世界economics
博弈论最重要的问题就是寻求博弈的稳定结果
7
上面这个简单的例子，给我们提出了一个很重要的问题，就是如何解决按照前面两章的定义
q = ( q1 , q2 , , qn )
≥ 0 ，并且满足∑ j =1 q j = 1 。
n
新浪微博：一花一世界economics
2013年10月29日
纯策略的数学表达
17
若对于某个纯策略i, 我们有那么混合策略p对于行局中人来说就是i这一纯策略。也就是说，行局中人i 相当于行局中人以1的概率选择策略i

e商务文档

混合策略纳什均衡(上)2013

相关文档推荐：