当前位置:文档之家› 混合策略纳什均衡概述

混合策略纳什均衡概述


2020年6月11日
博弈论第三章
31
第二讲多重纳什均衡
第三节多重纳什均衡的选择标准
➢三、聚点均衡 ➢(一)案例:城市分组博弈 ➢参与人: 甲 乙 ➢策略:把上海、长春、南京、哈尔滨
四个城市分成两组,每组2个城市 ➢支付:甲乙分法相同——奖励100元;
甲乙分法不同——奖励0元
2020年6月11日
博弈论第三章
-5,-5 -10,8
8,-10 10,10
2020年6月11日
博弈论第三章
25
第二讲多重纳什均衡
第三节多重纳什均衡的选择标准
➢二、风险优势标准:风险更小?
➢(一)案例:串通作弊博弈

帕累托优 势?
学生乙

作弊 不作弊

作弊
➢学生甲
9,9

不作弊 8,0
0,8 7,7
2020年6月11日
博弈论第三章
21
第二讲多重纳什均衡
友军博弈特征
两个(多个)纳什均衡 问题:博弈的最终结果?
2020年6月11日
博弈论第三章
22
第二讲多重纳什均衡
第三章 混合策略纳什均衡
第三节 多重纳什均衡的选择 标准
2020年6月11日
博弈论第三章
23
第二讲多重纳什均衡
第三节 多重纳什均衡的选择标准
➢一、帕累托优势标准:得益更大

企业乙Leabharlann ➢好产品 差产品➢
好产品 4,4
➢企业甲
-2,-8

差产品
-8,-2 -2,-2
2020年6月11日
博弈论第三章
34
第二讲多重纳什均衡
第三节多重纳什均衡的选择标准
➢四、相关均衡
➢(二)相关均衡
➢参与人主动设计某种形式的选择机制, 形成制度安排,从而确定最终均衡
➢“三鹿”事件出现后,河北省其他食品 企业以后如何做?
4,4 -8,-2 -2,-8 -2,-2
2020年6月11日
博弈论第三章
35
第二讲多重纳什均衡
第三节多重纳什均衡的选择标准
➢五、抗共谋均衡
➢(一)案例:抽象 的选择
➢丙:A


左右
➢上 ➢甲 ➢下
0,0,10 -5,-5,0
-5,-5,0 1,1,-5
➢ ➢ ➢上 ➢甲 ➢下
乙 左右
-2,-2,0 -5,-5,0 -5,-5,0 -1,-1,5
社会福利博弈:无纳什均衡
➢ ➢ ➢ ➢政府 ➢
救济
流浪汉 寻找工作 游荡
3,2
-1,3
不救济
-1,1
0,0
你救济,他就游 荡;你游荡,他
就不救济
2020年6月11日
博弈论第三章
1
第一讲 概念与方法
社会福利博弈的特征
➢不存在纳什均衡 ➢类似:父母与啃老族 ➢回望:另一个不正常的博弈
➢情侣博弈——两个纳什均衡
32
第二讲多重纳什均衡
第三节多重纳什均衡的选择标准
➢三、聚点均衡 ➢(二)聚点均衡 ➢1.标准
➢使用社会文化习惯、博弈历史等信 息达到均衡
➢1、10、66、888 ➢2.实质
➢规律性
2020年6月11日
博弈论第三章
33
第二讲多重纳什均衡
第三节多重纳什均衡的选择标准
➢四、相关均衡
➢(一)案例:“地域连坐”下的产品 质量博弈
2020年6月11日
博弈论第三章
12
第一讲 概念与方法
第一节 混合策略与期望支付
➢二、期望支付 ➢(二)数学刻画
mn
1( p, q)
pi q j aij
i 1 j 1
mn
2( p, q)
pi q jbij
i 1 j 1
2020年6月11日
博弈论第三章
13
第一讲 概念与方法
第一节 混合策略与期望支付
2020年6月11日
博弈论第三章
16
第一讲 概念与方法
二、研究方法:反应函数法
➢三、反应函数 ➢1.Jim:Dela剪发的概率越小,Jim卖
表越好
➢UJim=2p(1-3q)+2q
1, ifq 1/ 3, 此时1 3q 0, p越大越好 p [0,1],ifq 1/ 3
0, ifq 1/ 3, 此时1 3q 0, p越小越好
更大:49 ➢(2)不偏离(不作弊,不作弊)
2020年6月11日
9,9
博弈论第三章 8,0
第二讲多重纳什均衡
0,8 7,7
30
第三节多重纳什均衡的选择标准
➢二、风险优势标准:风险更小 ➢(三)纳什均衡的选择标准:风险优
势标准 ➢比较不同纳什均衡之间的风险状况,
风险小的纳什均衡优先
9,9 0,8 8,0 7,7
博弈论第三章
41
第二讲多重纳什均衡
第三节多重纳什均衡的选择标准
➢六、颤抖手精炼均衡 ➢Trembl一in个g人-用h手a抓n东d西perfect
equilibr时可iu,能手抓m一 不颤 住抖 他, 想就 抓 ➢(一)颤的东抖西:手误非蓄意错 ➢某一参与人的非蓄意错误
➢博弈偏离均衡路径的原因
2020年6月11日
博弈论第三章
39
第二讲多重纳什均衡
金无足赤,人无 完人
➢人总是要犯错误 的,所以要对别 人宽容
2020年6月11日
博弈论第三章
40
第二讲多重纳什均衡
经得起考验的纳什均衡
➢下在,其某他参参与与人人仍选能择实了他 你现错人能纳误不实什策犯现均略错最衡的误优,;情况
他人犯错误, 你仍能实现最

2020年6月11日
➢(一)案例:战争与和平

C国

鹰战略 鸽战


鹰战略 -5,-5
8,-10
➢ A国
-10,8 10,10

鸽战略
2020年6月11日
博弈论第三章
24
第二讲多重纳什均衡
第三节 多重纳什均衡的选择标准
➢一、帕累托优势标准:得益更大 ➢(二)纳什均衡的选择标准
➢帕累托优势标准 ➢按照支付大小筛选纳什均衡
2020年6月11日
博弈论第三章
14
第一讲 概念与方法
第二节 研究方法:反应函数法
➢——最佳反应函数曲线交叉法
➢一、案例:麦琪的礼物

Dela

剪发q 保留(1-q)

卖表p
-2,-2
2,2
➢Jim
2,2
0,0
➢ 保留(1-p)
2020年6月11日
博弈论第三章
15
第一讲 概念与方法
二、研究方法:反应函数法
2020年6月11日
博弈论第三章
18
第一讲 概念与方法
二、研究方法:反应函数法
➢四、反应函数曲
线
p
➢1.交点(1,0) 1
互相为对方着 想,期望支付
变小
➢双方支付为2
➢2.交点(0,1)
➢双方支付为2 1/3
➢3.交点(1/3,1/3)
➢双方支付为2/3
1/3
q 1
2020年6月11日
博弈论第三章
第一节 混合策略与期望支付
➢一、混合策略 ➢(二)混合策略 ➢2.相对概念:纯策略 ➢每个参与人的非随机性选择
➢纯粹行动计划,p=100%,1-p=0
2020年6月11日
博弈论第三章
9
第一讲 概念与方法
第一节 混合策略与期望支付
➢一、混合策略
➢(二)混合策略
➢3.数学刻画
➢给定博弈G={S1,…,Sn;u1,…,un}以及参 与人i的纯策略Si= {si1,…,sik}
2020年6月11日
博弈论第三章
11
第一讲 概念与方法
第一节 混合策略与期望支付
➢二、期望支付 ➢(一)分析 ➢2.期望支付 ➢U小偷=8pq+(-2)p(1-q)+0(1-p)q+0(1-
p)(1-q)=2p(5q-1) ➢U守卫= (-2) pq+0p(1-q)+8(1-
p)q+0(1-p)(1-q)=2q(4-5p)
26
第二讲多重纳什均衡
第三节多重纳什均衡的选择标准
➢二、风险优势标准:风险更小 ➢(二)分析:偏离损失比较法 ➢1.甲:单独偏离均衡的损失 ➢(1)偏离“作弊”:9-8=1 ➢(2)偏离“不作弊”:7-0=7
9,9 0,8
8,0 7,7
2020年6月11日
博弈论第三章
27
第二讲多重纳什均衡
第三节多重纳什均衡的选择标准
➢-1→-5, 5→0 ➢ (3)若乙、丙集体偏离,选(下,左,A)
➢-1→-5, 5→0 ➢ (4)结论:缺乏集体偏离的激励, (下,右,B)为
抗共谋均衡
2020年6月11日
博弈论第三章
38
第二讲多重纳什均衡
猎鹿博弈:何为抗共谋均衡?



猎鹿
打兔

猎鹿
10,10 0,4
➢甲

打兔
4,0
4,4
2020年6月11日
2020年6月11日
博弈论第三章
17
第一讲 概念与方法
二、研究方法:反应函数法
➢三、反应函数 ➢2. Dela : Jim卖表的概率越小,
Dela 剪发越好
➢UDel=2q(1-3p)+2p
1,ifp 1/ 3,此时1 3p 0, q越大越好 q [0,1],ifp 1/ 3
相关主题