当前位置：文档之家› 混合策略纳什均衡

混合策略纳什均衡

(陈明德语 r 陈明德语) 陈明德语 1 3/4 q*=R(r)
0 1/4 1 q 钟信德语）（钟信德语）
博弈论第三章混合策略纳什均衡
第三节寻找多重纳什均衡
德语 r
二、反应对应法：情侣博弈反应对应法：
陈明法语 1-r
钟信德语 q 法语 1-q 2 1 3 1 0 3 0 2
反应对应曲线有三个交点：三个：反应对应曲线有三个交点：三个NE： r*=0, q*=0 纯策略（确定性）纯策略（确定性）
(红) r 红 1 1/2 0 1/2 1 q （红） r*=R(q) q*=R(r)
博弈论第三章混合策略纳什均衡
第二节混合策略纳什均衡的求解方法
二、反应对应法
作业：社会福利博弈。使用反应对应法找到纳什均衡。作业：社会福利博弈。使用反应对应法找到纳什均衡。
流浪汉寻找工作游荡救济政府不救济
s1
第四节纳什均衡的存在性
问题：是否所有的博弈都存在（纯的或混合的）？问题：是否所有的博弈都存在NE（纯的或混合的）？（纯策略）纳什均衡的存在性定理(Debreu,1952；纯策略）纳什均衡的存在性定理； Glicksberg,1952；Fan,1952)：；：考虑一个n人策略式博弈, 考虑一个n人策略式博弈,如果每个参与人的纯策略空间S 是欧氏空间中的非空、闭而有界）的凸集, 空间Si是欧氏空间中的非空、紧（闭而有界）的凸集,支付函数u 连续且对拟凹,则博弈存在一个纯策略Nash 连续且对s 付函数 i(s)连续且对si拟凹,则博弈存在一个纯策略Nash 均衡。均衡。（混合策略）纳什均衡的存在性定理 (Glicksberg,1952)：混合策略）：在n人策略式博弈中,如果每个参与人的纯粹策略空人策略式博弈中, 是欧氏空间中的非空、闭而有界）的凸集, 间Si是欧氏空间中的非空、紧（闭而有界）的凸集,如果支付函数u 为连续函数为连续函数, 支付函数 i(s)为连续函数,那么博弈至少存在一个混合策 Nash均衡均衡. 略Nash均衡.
乙
第二节混合策略纳什均衡的求解方法红q 黑 1-q
红r 1 -1 -1 1 -1 1 1 -1
二、反应对应法
例：扑克牌对色游戏(p77) 扑克牌对色游戏黑 1-r 无纯策略NE 无纯策略给定混合策略p 给定混合策略甲=(r,1-r); p乙=(q,1-q)
π甲(p甲, p乙)= 2r(1-2q)+(2q-1) 整理原则：一项含r，一项不含r 整理原则：一项含，一项不含 π乙(p甲, p乙)= 2q(2r-1)-(2r-1) 整理原则：一项含q，一项不含q 整理原则：一项含，一项不含甲
乙
第二节混合策略纳什均衡的求解方法红q 黑 1-q
二、支付最大化法
例：扑克牌对色游戏(p77) 扑克牌对色游戏
甲红r 1 -1 -1 1 1 -1 无纯策略NE 无纯策略黑 1-r 1 -1 给定混合策略p 给定混合策略甲=(r,1-r); p乙=(q,1-q) π甲(p甲, p乙)=r[q⋅(-1)+(1-q) ⋅1]+ (1-r)[q⋅1+(1-q)⋅(-1)] ⋅ ⋅ ⋅ = 2r(1-2q)+(2q-1) π乙(p甲, p乙)=q [r⋅1+(1-r)⋅(-1)]+ (1-q)[r⋅(-1)+(1-r)⋅1] ⋅ ⋅ ⋅ ⋅ =2q(2r-1)-(2r-1) 解：Max π甲(p甲, p乙) r Max π乙(p甲, p乙) q f.o.c. 1-2q=0 f.o.c. 2r-1=0 q*=1/2 r*=1/2
夫妻之争博弈
丈夫时装妻时装子足球 2， 1 ， 0， 0， 0 足球 0， 0 ， 1， 1， 3
博弈论第三章混合策略纳什均衡
第四节纳什均衡的存在性
不同均衡概念的关系
优势均衡
纯策略纳什均衡
混合策略纳什均衡
博弈论第三章混合策略纳什均衡
第四节纳什均衡的存在性
问题：是否所有的博弈都存在（纯的或混合的）？问题：是否所有的博弈都存在NE（纯的或混合的）？
一、支付最大化法
给定混合策略p 给定混合策略陈明=(r,1-r); p钟信=(q,1-q) Max π陈明(p陈明, p钟信)=r[3q+(1-q) ]+ (1-r)[0+2(1-q)] =r(4q-1)+2(1-q) r Max π钟信(p陈明, p钟信)=q (2r+0)+ (1-q)[r+3(1-r)] =q(4r-3)+(3-2r) q NE：(r*, q*)=(3/4, 1/4) ：
r*=3/4, q*=1/4 混合策略（不确定性）混合策略（不确定性） r*=1, q*=1 纯策略（确定性）纯策略（确定性）
q*=R(r)
(陈明德语 r 陈明德语) 陈明德语 1 3/4
r*=R(q)
0 1/4 1 q 钟信德语）（钟信德语）
博弈论第三章混合策略纳什均衡
第三节寻找多重纳什均衡
博弈论第三章混合策略纳什均衡
第四节纳什均衡的存在性
例：凹但不连续的支付函数二人博弈：策略空间为S 二人博弈：策略空间为S1=S2= (0, 1) 支付函数：支付函数：
s1= s2=
反应对应：反应对应：
s2
无纳什均衡
反应对应曲线：反应对应曲线：
1/3
1/3 博弈论第三章混合策略纳什均衡
（纯策略）纳什均衡的存在性定理(Debreu,1952；纯策略）纳什均衡的存在性定理； Glicksberg,1952；Fan,1952)：；：考虑一个n人策略式博弈, 考虑一个n人策略式博弈,如果每个参与人的纯策略空间S 是欧氏空间中的非空、闭而有界）的凸集, 空间Si是欧氏空间中的非空、紧（闭而有界）的凸集,支付函数u 连续且对拟凹,则博弈存在一个纯策略Nash 连续且对s 付函数 i(s)连续且对si拟凹,则博弈存在一个纯策略Nash 均衡。均衡。
按照NE的条件，一个策略组合如过是一个，按照的条件，一个策略组合如过是一个NE，那么其中的的条件每一个策略都是参与人针对其他参与人策略组合的最优反应，每一个策略都是参与人针对其他参与人策略组合的最优反应，在纯策略NE中这个“最优反应” 在纯策略中，这个“最优反应”可能是一个具体的纯策略 (离散情形，也可能是一个反应函数离散情形)，离散情形也可能是一个反应函数(reaction function,如连如连续情形、古诺模型)。而在一个混合策略NE中这个“ 续情形、古诺模型。而在一个混合策略中，这个“最优反应”将是一个概率或很多个概率——被称为“反应对被称为“ 反应”将是一个概率或很多个概率被称为应”(reaction correspondence)
3，2 -1，3 ，， -1，1 0，0 ，，
博弈论第三章混合策略纳什均衡
第三节寻找多重纳什均衡
例：情侣博弈
德语 r 陈明法语 1-r 钟信德语 q 法语 1-q 2 1 3 1 0 3 0 2
两个（多个）两个（多个）纯策略纳什均衡问题：纳什均衡找完了吗？有无混合策略纳什均衡？问题：纳什均衡找完了吗？有无混合策略纳什均衡？
博弈论第三章混合策略纳什均衡
乙
第二节混合策略纳什均衡的求解方法红q 黑 1-q
红r 1 -1 -1 1 -1 1 1 -1
二、反应对应法
例：扑克牌对色游戏(p77) 扑克牌对色游戏
甲黑 1-r 先看甲的最优反应，记为r 先看甲的最优反应，记为 *=R(q)：：观察π 观察甲(p甲, p乙)= 2r(1-2q)+(2q-1)
反应对应曲线
博弈论第三章混合策略纳什均衡
第二节混合策略纳什均衡的求解方戏
作为NE，各个参与人的反应应该同时为最优，作为，各个参与人的反应应该同时为最优，只有两个反应对应的交点满足 NE：r*=1/2, q*=1/2 ： NE支付为： π甲(p甲, p乙)= 2r(1-2q)+(2q-1)=0 支付为：支付为 π乙(p甲, p乙)= 2q(2r-1)-(2r-1)=0
双方NE支付双方支付: π陈明*=3，π钟信*=2 支付，
r*=3/4, q*=1/4 混合策略（不确定性）混合策略（不确定性）
双方NE支付双方支付: π陈明*=3/2，π钟信*=3/2 支付，
r*=1, q*=1
纯策略（确定性）纯策略（确定性）
双方NE支付双方支付: π陈明*=2，π钟信*=3 支付，
0 1/4 1 q 钟信德语）（钟信德语）
博弈论第三章混合策略纳什均衡
第三节寻找多重纳什均衡q 钟信法语 1-q 德语
二、反应对应法：情侣博弈反应对应法：
陈明再看钟信的最优反应，记为q 再看钟信的最优反应，记为 *=R(r)：：德语 r 法语 1-r 2 3 0 0 1 2 1 3
π钟信(p陈明, p钟信)=q(4r-3)+(3-2r)
若 r > 3 / 4 ⇔ 4 r − 3 > 0 , q 越大越好 1, q * = R ( r ) = [ 0 ,1], 若 r = 3 / 4 ⇔ 4 r − 3 = 0，无论 q 选什么都无影响 0, 若 r < 3 / 4 ⇔ 4 r − 3 < 0 , q 越小越好
反应对应曲线
博弈论第三章混合策略纳什均衡
乙
第二节混合策略纳什均衡的求解方法红q 黑 1-q
红r 1 -1 -1 1 -1 1 1 -1
二、反应对应法
例：扑克牌对色游戏(p77) 扑克牌对色游戏
甲黑 1-r 再看乙的最优反应，记为q 再看乙的最优反应，记为 *=R(r)：：观察π 观察乙(p甲, p乙)= 2q(2r-1)-(2r-1)

e商务文档

混合策略纳什均衡

相关文档推荐：