当前位置:文档之家› 混合策略纳什均衡概述

混合策略纳什均衡概述

空间 ❖ 如果有:πi(pi*,p-i*)≥πi(pi’,p-i*) ❖ 则:混合策略组合p*=(p1*,…,pi*,…pn*)
为G的混合策略纳什均衡
13
第二节 研究方法:反应函数法
❖ ——最佳反应函数曲线交叉法
❖ 一、案例:麦琪的礼物

Dela

剪发q 保留(1-q)

卖表p
❖ Jim
❖ 保留(1-p)
2020/4/29
博弈论第三章
19
第一讲 概念与方法
友军博弈



支持巴顿
❖ 支持巴顿
❖ 美国
❖ 支持蒙帅
国 支持蒙帅
2020/4/29
博弈论第三章
20
第一讲 概念与方法
友军博弈特征
两个(多个)纳什均衡 问题:博弈的最终结果?
2020/4/29
博弈论第三章
21
第一讲 概念与方法
第三章 混合策略纳什均衡
2020/4/29
博弈论第三章
15
第一讲 概念与方法
二、研究方法:反应函数法
❖ 三、反应函数 ❖ 1.Jim:Dela剪发的概率越小,Jim卖表越
好 UJim=2p(1-3q)+2q
1,i f q1/3,此时 13q0, p越大越好 p[0,1],ifq1/3
0,i f q1/3,此时 13q0, p越小越好
社会福利博弈的特征
❖ 不存在纳什均衡 ❖ 类似:父母与啃老族 ❖ 回望:另一个不正常的博弈
情侣博弈——两个纳什均衡
2020/4/29
博弈论第三章
1
第一讲 概念与方法
思考
如何分析“不存在”纳什均衡或存 在多个纳什均衡的博弈?
2020/4/29
博弈论第三章
2
第一讲 概念与方法
第三章 混合策略纳什均衡
第一节 基本概念:混合策略与期 望支付
2020/4/29
博弈论第三章
3
第一讲 概念与方法
第一节 混合策略与期望支付
❖ 一、混合策略
❖ (一)案例:小偷与守卫的猫鼠博弈

守卫

睡 不睡



小偷

不偷
4
小偷与守卫博弈
无纳什均衡,如何分析?
2020/4/29
博弈论第三章
5
第一讲 概念与方法
第一节 混合策略与期望支付
❖ 1.交点(1,0) p
双方支付为2
1
❖ 2.交点(0,1)
互相为对方着 想,期望支付
变小
双方支付为2
❖ 3.交点(1/3,1/3)
双方支付为2/3
1/3
2020/4/29
1/3
博弈论第三章 第一讲 概念与方法
q 1
18
作业
❖ 利用反应函数法求解“社会福利博弈”
是否需要调整数据? 可得出有关社会保障体系改革的结论?
2020/4Biblioteka 29博弈论第三章11
第一讲 概念与方法
第一节 混合策略与期望支付
❖ 二、期望支付 ❖ (二)数学刻画
mn
1 ( p, q )
pi q j aij
i 1 j 1
mn
2( p, q )
pi q j bij
i 1 j 1
12
❖第三、一混节合策混略纳合什策均衡略与期望支付
❖ 给 以定及策混略合式策博略弈 组合G=p{*=S(1,p1…*,…,S,np;iu*,1…,…p,nu*n)} ❖ 对于所有i和pi∈∑i, ∑i——i的混合策略
第三节 多重纳什均衡的选择标准
2020/4/29
博弈论第三章
22
第一讲 概念与方法
第三节 多重纳什均衡的选择标准
❖ 一、帕累托优势标准:得益更大
❖ (一)案例:战争与和平

C国

鹰战略 鸽战略

鹰战略
❖ A国

鸽战略
2020/4/29
博弈论第三章
23
第一讲 概念与方法
第三节 多重纳什均衡的选择标准
10
第一讲 概念与方法
第一节 混合策略与期望支付
❖ 二、期望支付
❖ (一)分析
❖ 2.期望支付 ❖ U小偷=8pq+(-2)p(1-q)+0(1-p)q+0(1-p)(1-
q)=2p(5q-1) ❖ U守卫= (-2) pq+0p(1-q)+8(1-p)q+0(1-p)(1-
q)=2q(4-5p)
2020/4/29
博弈论第三章
7
第一讲 概念与方法
第一节 混合策略与期望支付
❖ 一、混合策略 ❖ (二)混合策略 ❖ 2.相对概念:纯策略 ❖ 每个参与人的非随机性选择
纯粹行动计划,p=100%,1-p=0
2020/4/29
博弈论第三章
8
第一讲 概念与方法
第一节 混合策略与期望支付
❖ 一、混合策略
❖ 一、混合策略
❖ (二)混合策略
❖ 1.表述
参与人按照一定概率,随机从策略组合中选择一 种策略作为实际行动
❖ 随机行动的目的:使自己的行为不被对手预 测
2020/4/29
博弈论第三章
6
第一讲 概念与方法
混合策略
❖ 小偷的混合策略
以p的概率偷,(p,1-p)
❖ 守卫的混合策略
以q的概率睡(q,1-q)
❖ 一、帕累托优势标准:得益更大 ❖ (二)纳什均衡的选择标准
帕累托优势标准
❖ 按照支付大小筛选纳什均衡
2020/4/29
博弈论第三章
24
第一讲 概念与方法
第三节多重纳什均衡的选择标准
❖ 二、风险优势标准:风险更小?
16
二、研究方法:反应函数法
❖ 三、反应函数 ❖ 2. Dela : Jim卖表的概率越小, Dela 剪
发越好 UDel=2q(1-3p)+2p
1,ifp1/3,此时 13p0,q越大越好 q[0,1],ifp1/3
0,ifp1/3,此时 13p0,q越小越好
17
❖ 四二、、反应研函究数曲方线法:反应函数法
2020/4/29
博弈论第三章
9
第一讲 概念与方法
第一节 混合策略与期望支付
❖ 二、期望支付 ❖ (一)分析 ❖ 1.概率 ❖ (偷,睡)的概率:pq ❖ (偷,不睡)的概率:p(1-q) ❖ (不偷,睡)的概率:(1-p)q ❖ (不偷,不睡)的概率:(1-p)(1-q)
2020/4/29
博弈论第三章
❖ (二)混合策略
❖ 3.数学刻画
❖ 给定博弈G={S1,…,Sn;u1,…,un}以及参 与人i的纯策略Si= {si1,…,sik}
❖ 概率分布pi=(pi1,…,pik)为混合策略 ❖ 其中:0≤ pik ≤1,∑ pik=1, pik=p( sik ) ❖ 混合策略组合p=(p1,…,pi,…pn)
14
二、研究方法:反应函数法
❖ 二、期望支付
❖ 1.UJim=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1q)=2p(1-3q)+2q
整理原则:一项含p,一项不含p
❖ 2.UDel=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1q)=2q(1-3p)+2p
整理原则:一项含q,一项不含q
相关主题