当前位置:文档之家› 混合策略纳什均衡

混合策略纳什均衡

(陈明德语 r 陈明德语) 陈明德语 1 3/4 q*=R(r)
0 1/4 1 q 钟信德语) (钟信德语)
博弈论 第三章 混合策略纳什均衡
第三节 寻找多重纳什均衡
德语 r
二、反应对应法:情侣博弈 反应对应法:
陈明 法语 1-r
钟信 德语 q 法语 1-q 2 1 3 1 0 3 0 2
反应对应曲线有三个交点:三个 : 反应对应曲线有三个交点:三个NE: r*=0, q*=0 纯策略(确定性) 纯策略(确定性)
(红) r 红 1 1/2 0 1/2 1 q (红) r*=R(q) q*=R(r)
博弈论 第三章 混合策略纳什均衡
第二节 混合策略纳什均衡的求解方法
二、反应对应法
作业:社会福利博弈。使用反应对应法找到纳什均衡。 作业:社会福利博弈。使用反应对应法找到纳什均衡。
流浪汉 寻找工作 游荡 救济 政府 不救济
s1
第四节 纳什均衡的存在性
问题:是否所有的博弈都存在 (纯的或混合的)? 问题:是否所有的博弈都存在NE(纯的或混合的)? (纯策略)纳什均衡的存在性定理(Debreu,1952; 纯策略)纳什均衡的存在性定理 ; Glicksberg,1952;Fan,1952): ; : 考虑一个n人策略式博弈, 考虑一个n人策略式博弈,如果每个参与人的纯策略 空间S 是欧氏空间中的非空、 闭而有界)的凸集, 空间Si是欧氏空间中的非空、紧(闭而有界)的凸集,支 付函数u 连续且对 拟凹,则博弈存在一个纯策略Nash 连续且对s 付函数 i(s)连续且对si拟凹,则博弈存在一个纯策略Nash 均衡。 均衡。 (混合策略)纳什均衡的存在性定理 (Glicksberg,1952): 混合策略) : 在n人策略式博弈中,如果每个参与人的纯粹策略空 人策略式博弈中, 是欧氏空间中的非空、 闭而有界)的凸集, 间Si是欧氏空间中的非空、紧(闭而有界)的凸集,如果 支付函数u 为连续函数 为连续函数, 支付函数 i(s)为连续函数,那么博弈至少存在一个混合策 Nash均衡 均衡. 略Nash均衡.

第二节 混合策略纳什均衡的求解方法 红q 黑 1-q
红r 1 -1 -1 1 -1 1 1 -1
二、反应对应法
例:扑克牌对色游戏(p77) 扑克牌对色游戏 黑 1-r 无纯策略NE 无纯策略 给定混合策略p 给定混合策略 甲=(r,1-r); p乙=(q,1-q)
π甲(p甲, p乙)= 2r(1-2q)+(2q-1) 整理原则:一项含r,一项不含r 整理原则:一项含 ,一项不含 π乙(p甲, p乙)= 2q(2r-1)-(2r-1) 整理原则:一项含q,一项不含q 整理原则:一项含 ,一项不含 甲

第二节 混合策略纳什均衡的求解方法 红q 黑 1-q
二、支付最大化法
例:扑克牌对色游戏(p77) 扑克牌对色游戏
甲 红r 1 -1 -1 1 1 -1 无纯策略NE 无纯策略 黑 1-r 1 -1 给定混合策略p 给定混合策略 甲=(r,1-r); p乙=(q,1-q) π甲(p甲, p乙)=r[q⋅(-1)+(1-q) ⋅1]+ (1-r)[q⋅1+(1-q)⋅(-1)] ⋅ ⋅ ⋅ = 2r(1-2q)+(2q-1) π乙(p甲, p乙)=q [r⋅1+(1-r)⋅(-1)]+ (1-q)[r⋅(-1)+(1-r)⋅1] ⋅ ⋅ ⋅ ⋅ =2q(2r-1)-(2r-1) 解:Max π甲(p甲, p乙) r Max π乙(p甲, p乙) q f.o.c. 1-2q=0 f.o.c. 2r-1=0 q*=1/2 r*=1/2
夫妻之争博弈
丈夫 时装 妻 时装 子 足球 2, 1 , 0, 0, 0 足球 0, 0 , 1, 1, 3
博弈论 第三章 混合策略纳什均衡
第四节 纳什均衡的存在性
不同均衡概念的关系
优势均衡
纯策略纳什均衡
混合策略纳什均衡
博弈论 第三章 混合策略纳什均衡
第四节 纳什均衡的存在性
问题:是否所有的博弈都存在 (纯的或混合的)? 问题:是否所有的博弈都存在NE(纯的或混合的)?
一、支付最大化法
给定混合策略p 给定混合策略 陈明=(r,1-r); p钟信=(q,1-q) Max π陈明(p陈明, p钟信)=r[3q+(1-q) ]+ (1-r)[0+2(1-q)] =r(4q-1)+2(1-q) r Max π钟信(p陈明, p钟信)=q (2r+0)+ (1-q)[r+3(1-r)] =q(4r-3)+(3-2r) q NE:(r*, q*)=(3/4, 1/4) :
r*=3/4, q*=1/4 混合策略(不确定性) 混合策略(不确定性) r*=1, q*=1 纯策略(确定性) 纯策略(确定性)
q*=R(r)
(陈明德语 r 陈明德语) 陈明德语 1 3/4
r*=R(q)
0 1/4 1 q 钟信德语) (钟信德语)
博弈论 第三章 混合策略纳什均衡
第三节 寻找多重纳什均衡
博弈论 第三章 混合策略纳什均衡
第四节 纳什均衡的存在性
例:凹但不连续的支付函数 二人博弈:策略空间为S 二人博弈:策略空间为S1=S2= (0, 1) 支付函数: 支付函数:
s1= s2=
反应对应: 反应对应:
s2
无纳什均衡
反应对应曲线: 反应对应曲线:
1/3
1/3 博弈论 第三章 混合策略纳什均衡
(纯策略)纳什均衡的存在性定理(Debreu,1952; 纯策略)纳什均衡的存在性定理 ; Glicksberg,1952;Fan,1952): ; : 考虑一个n人策略式博弈, 考虑一个n人策略式博弈,如果每个参与人的纯策略 空间S 是欧氏空间中的非空、 闭而有界)的凸集, 空间Si是欧氏空间中的非空、紧(闭而有界)的凸集,支 付函数u 连续且对 拟凹,则博弈存在一个纯策略Nash 连续且对s 付函数 i(s)连续且对si拟凹,则博弈存在一个纯策略Nash 均衡。 均衡。
按照NE的条件,一个策略组合如过是一个 , 按照 的条件,一个策略组合如过是一个NE,那么其中的 的条件 每一个策略都是参与人针对其他参与人策略组合的最优反应, 每一个策略都是参与人针对其他参与人策略组合的最优反应, 在纯策略NE中 这个“最优反应” 在纯策略 中,这个“最优反应”可能是一个具体的纯策略 (离散情形 ,也可能是一个反应函数 离散情形), 离散情形 也可能是一个反应函数(reaction function,如连 如连 续情形、古诺模型)。而在一个混合策略NE中 这个“ 续情形、古诺模型 。而在一个混合策略 中,这个“最优 反应”将是一个概率或很多个概率——被称为“反应对 被称为“ 反应”将是一个概率或很多个概率 被称为 应”(reaction correspondence)
3,2 -1,3 , , -1,1 0,0 , ,
博弈论 第三章 混合策略纳什均衡
第三节 寻找多重纳什均衡
例:情侣博弈
德语 r 陈明 法语 1-r 钟信 德语 q 法语 1-q 2 1 3 1 0 3 0 2
两个(多个) 两个(多个)纯策略纳什均衡 问题:纳什均衡找完了吗?有无混合策略纳什均衡? 问题:纳什均衡找完了吗?有无混合策略纳什均衡?
博弈论 第三章 混合策略纳什均衡

第二节 混合策略纳什均衡的求解方法 红q 黑 1-q
红r 1 -1 -1 1 -1 1 1 -1
二、反应对应法
例:扑克牌对色游戏(p77) 扑克牌对色游戏
甲 黑 1-r 先看甲的最优反应,记为r 先看甲的最优反应,记为 *=R(q): : 观察π 观察 甲(p甲, p乙)= 2r(1-2q)+(2q-1)
反应对应曲线
博弈论 第三章 混合策略纳什均衡
第二节 混合策略纳什均衡的求解方戏
作为NE,各个参与人的反应应该同时为最优, 作为 ,各个参与人的反应应该同时为最优,只有两个反应对应 的交点满足 NE:r*=1/2, q*=1/2 : NE支付为: π甲(p甲, p乙)= 2r(1-2q)+(2q-1)=0 支付为: 支付为 π乙(p甲, p乙)= 2q(2r-1)-(2r-1)=0
双方NE支付 双方 支付: π陈明*=3,π钟信*=2 支付 ,
r*=3/4, q*=1/4 混合策略(不确定性) 混合策略(不确定性)
双方NE支付 双方 支付: π陈明*=3/2,π钟信*=3/2 支付 ,
r*=1, q*=1
纯策略(确定性) 纯策略(确定性)
双方NE支付 双方 支付: π陈明*=2,π钟信*=3 支付 ,
0 1/4 1 q 钟信德语) (钟信德语)
博弈论 第三章 混合策略纳什均衡
第三节 寻找多重纳什均衡q 钟信法语 1-q 德语
二、反应对应法:情侣博弈 反应对应法:
陈明 再看钟信的最优反应,记为q 再看钟信的最优反应,记为 *=R(r): : 德语 r 法语 1-r 2 3 0 0 1 2 1 3
π钟信(p陈明, p钟信)=q(4r-3)+(3-2r)
若 r > 3 / 4 ⇔ 4 r − 3 > 0 , q 越大越好 1, q * = R ( r ) = [ 0 ,1], 若 r = 3 / 4 ⇔ 4 r − 3 = 0, 无论 q 选什么都无影响 0, 若 r < 3 / 4 ⇔ 4 r − 3 < 0 , q 越小越好
反应对应曲线
博弈论 第三章 混合策略纳什均衡

第二节 混合策略纳什均衡的求解方法 红q 黑 1-q
红r 1 -1 -1 1 -1 1 1 -1
二、反应对应法
例:扑克牌对色游戏(p77) 扑克牌对色游戏
甲 黑 1-r 再看乙的最优反应,记为q 再看乙的最优反应,记为 *=R(r): : 观察π 观察 乙(p甲, p乙)= 2q(2r-1)-(2r-1)
相关主题