当前位置:
文档之家› F-博弈论专题-4-1混合纳什均衡
F-博弈论专题-4-1混合纳什均衡
二、混合战略Nash均衡
问题: 在“猜硬币”游戏中,我们往往会以50%
的概率选择正面(O),以50%的概率选择反面(R), 即选择混合战略σ=(0.5,0.5)。那么有没有参与 人会偏离混合战略σi=(0.5,0.5)呢?
O 1
R
2
O
R
-1,1
1,-1
1,-1
-1,1
在“猜硬币”博弈中,当双方都选择混合战略
为准)
守
左边 右边
左边 -1,1 1,-1 攻
右边 1,-1 -1,1
例:石头、剪子、布
(3)石头、剪子、布
再看猎鹿博弈
风险与均衡
某种行动的概率
与期望收益:
猎鹿?猎兔? 如果猎兔的概率 Nhomakorabea猎 人鹿
是0.5时,均衡 1 兔子
是什么?0.6呢?
猎人2
鹿
兔子
5, 5 3, 0
0, 3 3, 3
猎鹿博弈 风险上策均衡(兔子,兔子)
社会福利博弈
流浪汉
政 府 救济
不救济
找工作 (3,2) (-1,1)
游荡 (-1,3) (0,0)
课堂测试:
求解猎人的混
合纳什均衡策
略。
即,选择两种策 略的期望收益
猎 人鹿
无差异的概率。 1 兔子
猎人2
鹿
兔子
5, 5 3, 0
0, 3 3, 3
猎鹿博弈 风险上策均衡(兔子,兔子)
察不能同时兼顾两个地方。商店价值2万元,
酒馆价值1万元。警察在这头时小偷会去另一
头行窃,但双方到底在哪边是不确定的。双方
的策略应是什么?
小偷
酒馆 商店
警察
酒馆 商店
3,0 2,1
1,2 3,0
警察要使损失最小化,小偷寻求收益最大 化
1、如果警察以0.5的概率分别巡视两个地方, 那么小偷的策略是什么?
课堂讨论
l 如果雇主能够没收雇员的抵押金F,前述 两个问题的答案会发生怎样变化?如何理解 这种变化?
l 根据上述分析,雇主是否会收取抵押金, 如何收取?雇员是否愿交抵押金?
l 两个其它方面完全相同的企业在相互竞争 中,一个收取抵押金,一个不收,说更有竞 争优势?
l 从社会福利最大化角度看,作为政府是否 应禁止雇主向雇员收取抵押金?为什么?
F-博弈论专题-4-1混合纳什均衡
混合纳什均衡
一、混合策略 二、混合策略纳什均衡 三、应用分析
一、混合策略
“对硬币”博弈的例子
两个参与人各握有一枚硬币,双方同时选择是
正面向上(记作O)还是背面向上(记作R),即他们 的策略空间都是{O, R}。若两枚硬币是一致的(即
全部背面向上或者全部正面向上),参与人2赢得 参与人1的硬币;若两枚硬币不一致,则参与人1 赢得参与人2的硬币。
博弈矩阵
O 1
R
2
O
R
-1,1
1,-1
1,-1
-1,1
对硬币博弈的特征: 每位参与人都想猜透对方的策略,而每位
参与人又都不能让对方猜透自己的策略
在“对硬币”游戏中,我们会以50%的概
率选择正面(O),以50%的概率选择反面 (R)。像这种以一定的概率分布来选择自己
策略的行为,在博弈论中称之为混合策略 (mixed strategy)。
2、警察以2/3及1/3的概率分别巡视商店和 酒馆,小偷该如何?
3、混合纳什均衡策略是 警察:P商店=2/3,P酒馆=1/3 小偷:相反
案例
推牌九及赌场 每次加倍押赌,会有
什么样的结果? 喝酒中的老虎、杠子、
鸡、虫,有无纯策略?
(二)监督博弈
• 税收机关与纳税人 • 雇主与雇员
这里,V是雇员的贡献,W是雇员的工资,H是雇员的 付出,C是检查的成本。同时,我们假定H<W<V,W>C。 在这个假设下,该博弈不存在纯战略纳什均衡。 • 求解混合战略纳什均衡得知:雇主检查的概率*=H/W, 雇员偷懒的概率*=C/W。 • 求解雇主支付W为多少时,其期望收益最大。
同理,偏离也不能给参与人1带来好处。
因此,在“猜硬币”博弈中,双方都不会偏离混 合战略组合σ=((0.5,0.5),(0.5,0.5))。像这样的 混合战略组合我们称之为混合战略Nash均衡。
三、混合策略应用分析
(一)警察与小偷 (二)监督博弈 (三)社会福利博弈
(一)警察与小偷
某镇有一酒馆和商店,分在小镇的东西头,警
纯策略与混合策略
纯策略: 参与人在给定信息下只选择一种特定策略(或
行动)。 混合策略:
参与人给定信息下以某种概率分布随机地选 择不同的行动。它可以定义为策略空间(集)上概 率分布。
对比:智猪博弈与猜硬币博弈
例:点球射门
攻方的策略是:攻左边,或攻右边 守方的策略是:守左边,或守右边(以守方的方向
σi=(0.5,0.5)时,双方的期望收益都为0。
E(1O)=-1×0.5+1×0.5=0
E(1R) =1×0.5+-1×0.5=0
如果参与人1保持混合战略σ1=(0.5,0.5) ,那么 无论参与人2选择其它什么样的混合战略,只要参 与人1保持混合战略σ1=(0.5,0.5)不变,参与人2 的期望收益都为0,不会增大。也就是说,偏离并 不能给参与人2带来好处。