当前位置:文档之家› 混合策略纳什均衡(上)2013

混合策略纳什均衡(上)2013


随机地从纯策略集合中选择一种纯策略作为实际的 行动。
新浪微博:一花一世界economics
2013年10月29日
混合策略包括原来的纯策略
10
混合策略概念是原来纯策略概念的推广。 混合策略(mixed strategy) 纯策略(pure strategy) 不确定性(uncertainty) 期望支付(expected payoff)
2013年10月29日
新浪微博:一花一世界economics
混合策略与纯策略有很大区别
9
在局中人只有两个纯策略可以选择的情形, 混合策略是一种按照什么概率选择这个纯策略, 按照什么策略选择那种纯策略的策略选择指示。 纯策略给每个局中人具体明确了一个非随机性的行
动计划。
而混合策略则表明,局中人可以按照一定的概率,
新浪微博:一花一世界economics
2013年10月29日
与混合策略相伴随的一个问题
11
是局中人支付的不确定性。 为了刻画不确定情形下局中人的支付, 我们需要借助期望支付的概念。 在博弈论中,当局中人并不清楚其他局中人的实际策
略选择时,他的支付便具有不确定性, 为此,他只能通过计算期望支付的方式来预测自己的 得益情况, 确定自己的策略选择。
新浪微博:一花一世界economics
2013年10月29日
重新定义纳什均衡
23
从二人同时决策博弈看, 混合策略纳什均衡必须是两个局中人的相对最优混合
策略的组合, 所谓相对最优混合策略, 是指在给定对方选择该相对最优混合策略的条件下, 能使局中人自身的期望支付达到最大的混合策略。
27
从定义3.2可以看出, 第二章中定义2.4给出的纳什均衡, 是现在给出的混合策略纳什均衡的特例。 所以相对于现在定义的比较广泛的混合
策略纳什均衡, 原来定义2.4定义的纳什均衡, 可以特别叫做纯策略纳什均衡。
新浪微博:一花一世界economics
2013年10月29日
具体来说,
表示局中人i之外所有其他局中人的混合策略组合。 至此,局中人i的期望支付可以具体定义为:
π i ( p ) = ∑s∈S (∏ j =1 p j ( s j ))ui ( s )
n
其中 ui ( s)是我们在纯策略情况熟悉的当所有局中人 采取s这个策略组合的时候局中人i之支付, n 而 正是所有局中人各自的策略选择正好 p ( s ) ∏ j j 组成纯策略组合s的概率。 j =1
新浪微博:一花一世界economics
对于任意的 p2 ∈ ∑ 2
2013年10月29日
更一般地,
25
对于一个有n个局中人参与的同时
决策博弈, 其混合策略纳什均衡 Nash equilibrium of mixed strategies 的定义可具体表述为:定义3.2
新浪微博:一花一世界economics
2013年10月29日
定义3.2混合策略纳什均衡
26

p* = ( p1*, , pi *, , pn *)
是n人策略式博弈
G = {S1 , , S n ; u1 , , un }
的一个混合策略组合。 如果对于所有的 i = 1, , n, π i ( pi *, p−i *) ≥ π i ( pi , p−i *)
混合策略纳什均衡
北京邮电大学 本科选修课程 《信息经济学》 高丛 1HUA1SHIJIE100@
在纳什均衡不存在或者不唯一的情形,
2
前面介绍的纳什均衡的定义和寻找纳什均衡的方法, 就不足以帮助我们对博弈的最终结果作出明确的预
测, 无法给参与博弈的局中人提供明确的决策建议。 因此,我们需要拓展纳什均衡的概念, 引入新的分析工具,
对存在多个纳什均衡的博弈和“不存在”纳什均衡
的博弈作进一步的讨论。
新浪微博:一花一世界economics
2013年10月29日
本章内容:
3
本章首先引入混合策略和期望支付的概念, 在此基础上定义混合策略纳什均衡, 然后具体介绍求解纳什均衡的反应函数法, 并给出混合策略纳什均衡的直观解释。 我们讨论多重纳什均衡的问题及其筛选标准。
需要说明的是,
14
期望支付的标准写法是EU, 从而甲的期望支付的标准写法是EUA, 但是在概率p和q明显出现的时候, 我们约定也可以写成UA(p,q), 表达式里面已经有期望的意思。 UB(p,q)与EUB的关系也是这样。
新浪微博:一花一世界economics
2013年10月29日
新浪微博:一花一世界economics
2013年10月29日
对有n个局中人参与的策略式博弈的 混合策略给出如下定义3.1 混合策略
20
在一个有n个局中人参与的策略式博弈中,
G = {S1 , , S n ; u1 , , un }
pi = ( pil , , piK )
假定局中人i有K个纯策略,即 则概率分布 其中
5
我们考虑一个“扑克牌对色游戏”
(game of color matching): 两人博弈, 每人从自己的扑克牌中抽一张出来,一起翻开。 如果颜色一样,甲输给乙一根火柴; 如果颜色不一样,甲赢得乙一根火柴。 为了确定起见, 我们不允许出“大鬼”和“小鬼”。
2013年10月29日
更一般地,二人博弈矩阵表示
15
S S
局中人1
2 1
1 1
b11
a11 a21

ห้องสมุดไป่ตู้
2 S2
局中人2

a1n a2 n
2 Sn
b12 … a12 b22 …
b1n b2 n

S
1 2
b21
a22
… …
新浪微博:一花一世界economics

S
1 m
am1
bm1
am 2
bm 2 …
amn
bmn
2013年10月29日
新浪微博:一花一世界economics
2013年10月29日
用比较学术化的语言,
24
如果
p* = ( p1*, p2 *)
是二人博弈的一个纳什均衡,它必须满足:
π 1 ( p1*, p2 *) ≥ π 1 ( p1 , p2 *)

对于任意的 p1 ∈ ∑ 1
π 2 ( p1*, p2 *) ≥ π 1 ( p1*, p2 )
二人博弈的数学表达
16
因为行局中人有m种可以选择的纯策略, 所以他的混合策略可以紧凑地表示为一个向量
p = ( p1 , p2 , , pm )
要求对每一个纯策略i都有 pi
∑i =1 pi = 1 。 ≥ 0 ,并且满足
m
同样,因为列局中人有n种可以选择的纯策略, 所以他的混合策略可以紧凑地表示为一个向量 要求对每一个纯策略j都有 q j
pi = 1,而 pk = 0 对任意 k ≠ i 都成立,
,以0的概率选择其他任何策略。 这时候,行局中人的纯策略可表述为
p = (0,0, .0,1,0, ,0)
其中1只在i的位置出现一次。 这样的向量一共有m个,正好对应局中人的m个纯策略。
新浪微博:一花一世界economics
Si = {sil , , siK }
0 ≤ pik ≤ 1,

k k =1
pik = 1
称为局中人i的一个混合策略,这里 表示局中人i选择纯策略
新浪微博:一花一世界economics
pik = p ( sik )
Sik 的概率 k = 1, , K
2013年10月29日
本课程约定
21

28
如果 p* = ( p1*, , pi *, , pn *) 是一个现在定义的混合策略的纳什均衡, 但是对于每个 i = 1, , n * 概率分布 pi = ( pi1*, , piki *) 的分量中, 都只有一个是1,其余都是0,即所有概率分布 * * pi = ( pi1*, , piki *) 都取 pi = (1,0, ,0) * * pi = (0, ,0,1,0, ,0) 或者 pi = (0, ,0,1) 的形式,那么这个“混合”策略纳什均衡就是 原来定义2.4的(纯策略)纳什均衡。
∑ 表示局中人i的混合策略空间
i
Space of mixed strategies 于是,
p = ( p1 , , pi , , pn ), pi ∈ ∑i
就表示博弈的一个混合策略组合 Mixed strategy profile
pi 都是一个混合策略向量。 这时候,我们用 π i ( p ) = π i ( p1 , , pi , , pn ) 表示局中人i在混合策略组合 p = ( p1 , , pi , , pn )
新浪微博:一花一世界economics
“扑克牌对色游戏”
6



1
红 甲 黑
-1 1 1 -1
2013年10月29日
-1 -1 1
新浪微博:一花一世界economics
博弈论最重要的问题就是寻求博弈的稳定结果
7
上面这个简单的例子, 给我们提出了一个很重要的问题, 就是如何解决按照前面两章的定义
q = ( q1 , q2 , , qn )
≥ 0 ,并且满足∑ j =1 q j = 1 。
n
新浪微博:一花一世界economics
2013年10月29日
纯策略的数学表达
17
若对于某个纯策略i, 我们有 那么混合策略p对于行局中人来说就是i这一纯策略。 也就是说,行局中人i 相当于行局中人以1的概率选择策略i
相关主题