当前位置：文档之家› 混合策略纳什均衡概述

混合策略纳什均衡概述

空间 ❖ 如果有：πi(pi*,p-i*)≥πi(pi’,p-i*) ❖ 则：混合策略组合p*=（p1*,…,pi*,…pn*）
为G的混合策略纳什均衡
13
第二节研究方法：反应函数法
❖ ——最佳反应函数曲线交叉法
❖ 一、案例：麦琪的礼物
❖
Dela
❖
剪发q 保留（1-q）
❖
卖表p
❖ Jim
❖ 保留（1-p）
2020/4/29
博弈论第三章
19
第一讲概念与方法
友军博弈
❖
英
❖
支持巴顿
❖ 支持巴顿
❖ 美国
❖ 支持蒙帅
国支持蒙帅
2020/4/29
博弈论第三章
20
第一讲概念与方法
友军博弈特征
两个（多个）纳什均衡问题：博弈的最终结果？
2020/4/29
博弈论第三章
21
第一讲概念与方法
第三章混合策略纳什均衡
2020/4/29
博弈论第三章
15
第一讲概念与方法
二、研究方法：反应函数法
❖ 三、反应函数 ❖ 1.Jim：Dela剪发的概率越小，Jim卖表越
好 UJim=2p(1-3q)+2q
1,i f q1/3,此时 13q0, p越大越好 p[0,1],ifq1/3
0,i f q1/3,此时 13q0, p越小越好
社会福利博弈的特征
❖ 不存在纳什均衡 ❖ 类似：父母与啃老族 ❖ 回望：另一个不正常的博弈
情侣博弈——两个纳什均衡
2020/4/29
博弈论第三章
1
第一讲概念与方法
思考
如何分析“不存在”纳什均衡或存在多个纳什均衡的博弈？
2020/4/29
博弈论第三章
2
第一讲概念与方法
第三章混合策略纳什均衡
第一节基本概念：混合策略与期望支付
2020/4/29
博弈论第三章
3
第一讲概念与方法
第一节混合策略与期望支付
❖ 一、混合策略
❖ （一）案例：小偷与守卫的猫鼠博弈
❖
守卫
❖
睡不睡
❖
偷
❖
小偷
❖
不偷
4
小偷与守卫博弈
无纳什均衡，如何分析？
2020/4/29
博弈论第三章
5
第一讲概念与方法
第一节混合策略与期望支付
❖ 1.交点（1，0） p
双方支付为2
1
❖ 2.交点（0，1）
互相为对方着想，期望支付
变小
双方支付为2
❖ 3.交点（1/3，1/3）
双方支付为2/3
1/3
2020/4/29
1/3
博弈论第三章第一讲概念与方法
q 1
18
作业
❖ 利用反应函数法求解“社会福利博弈”
是否需要调整数据？可得出有关社会保障体系改革的结论？
2020/4Biblioteka 29博弈论第三章11
第一讲概念与方法
第一节混合策略与期望支付
❖ 二、期望支付 ❖ （二）数学刻画
mn
1 ( p, q )
pi q j aij
i 1 j 1
mn
2( p, q )
pi q j bij
i 1 j 1
12
❖第三、一混节合策混略纳合什策均衡略与期望支付
❖ 给以定及策混略合式策博略弈组合G=p｛*=S（1，p1…*,…,S,np;iu*,1…,…p,nu*n）｝ ❖ 对于所有i和pi∈∑i， ∑i——i的混合策略
第三节多重纳什均衡的选择标准
2020/4/29
博弈论第三章
22
第一讲概念与方法
第三节多重纳什均衡的选择标准
❖ 一、帕累托优势标准：得益更大
❖ （一）案例：战争与和平
❖
C国
❖
鹰战略鸽战略
❖
鹰战略
❖ A国
❖
鸽战略
2020/4/29
博弈论第三章
23
第一讲概念与方法
第三节多重纳什均衡的选择标准
10
第一讲概念与方法
第一节混合策略与期望支付
❖ 二、期望支付
❖ （一）分析
❖ 2.期望支付 ❖ U小偷=8pq+（-2）p(1-q)+0(1-p)q+0(1-p)(1-
q)=2p(5q-1) ❖ U守卫= （-2） pq+0p(1-q)+8(1-p)q+0(1-p)(1-
q)=2q(4-5p)
2020/4/29
博弈论第三章
7
第一讲概念与方法
第一节混合策略与期望支付
❖ 一、混合策略 ❖ （二）混合策略 ❖ 2.相对概念：纯策略 ❖ 每个参与人的非随机性选择
纯粹行动计划，p=100%,1-p=0
2020/4/29
博弈论第三章
8
第一讲概念与方法
第一节混合策略与期望支付
❖ 一、混合策略
❖ 一、混合策略
❖ （二）混合策略
❖ 1.表述
参与人按照一定概率，随机从策略组合中选择一种策略作为实际行动
❖ 随机行动的目的：使自己的行为不被对手预测
2020/4/29
博弈论第三章
6
第一讲概念与方法
混合策略
❖ 小偷的混合策略
以p的概率偷，（p，1-p）
❖ 守卫的混合策略
以q的概率睡（q，1-q）
❖ 一、帕累托优势标准：得益更大 ❖ （二）纳什均衡的选择标准
帕累托优势标准
❖ 按照支付大小筛选纳什均衡
2020/4/29
博弈论第三章
24
第一讲概念与方法
第三节多重纳什均衡的选择标准
❖ 二、风险优势标准：风险更小？
16
二、研究方法：反应函数法
❖ 三、反应函数 ❖ 2. Dela ： Jim卖表的概率越小， Dela 剪
发越好 UDel=2q(1-3p)+2p
1,ifp1/3,此时 13p0,q越大越好 q[0,1],ifp1/3
0,ifp1/3,此时 13p0,q越小越好
17
❖ 四二、、反应研函究数曲方线法：反应函数法
2020/4/29
博弈论第三章
9
第一讲概念与方法
第一节混合策略与期望支付
❖ 二、期望支付 ❖ （一）分析 ❖ 1.概率 ❖ （偷，睡）的概率：pq ❖ （偷，不睡）的概率：p(1-q) ❖ （不偷，睡）的概率：(1-p)q ❖ （不偷，不睡）的概率：(1-p)(1-q)
2020/4/29
博弈论第三章
❖ （二）混合策略
❖ 3.数学刻画
❖ 给定博弈G=｛S1，…,Sn;u1,…,un｝以及参与人i的纯策略Si= ｛si1,…,sik｝
❖ 概率分布pi=（pi1,…,pik）为混合策略 ❖ 其中：0≤ pik ≤1，∑ pik=1， pik=p（ sik ） ❖ 混合策略组合p=（p1,…,pi,…pn）
14
二、研究方法：反应函数法
❖ 二、期望支付
❖ 1.UJim=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1q)=2p(1-3q)+2q
整理原则：一项含p，一项不含p
❖ 2.UDel=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1q)=2q(1-3p)+2p
整理原则：一项含q，一项不含q

e商务文档

混合策略纳什均衡概述

相关文档推荐：