当前位置:文档之家› 12纳什均衡

12纳什均衡


(2,3)对应的策略是(下,左),这一策略组合是 对对方策略的最佳对策
只有一条线的策略组合得益是不稳定的,其中一方将 会背叛
如果猜测甲方选择(下),乙方就会选择(左)
如果乙方选择(左),甲方就真的会选择(下)
纳什均衡
博弈G={S1,…,Sn ; u1,…,un},如果策略组合(s1*,…,sn*) 满足如下不等式对任意sij都称成立 (s1*,…, si-1*, si*, si+1*,…,sn*) >= (s1*,…, si-1*, sij*, si+1*,…,sn*) 称(s1*,…,sn*)为G的一个纳什均衡 纳什均衡的一致预测性质。如果所有博弈方都预测一 个特定的博弈结果会出现,那么没有哪个博弈方有偏 离这个预测结果的愿望。因此这个结果最终真会成为 博弈的结果--稳定性和自我强制性 一致预测意味着对对方的猜测是准确的,并不着一定 能意味着对结果的准确预测
a
b
c
B -,+ -,+ +,-
C +,-,+ -,+
严格下策反复消去
守方 攻方
a
c
B -,+ +,-
C +,-,+
静态博弈与纳什均衡
静态博弈的描述 严格下策反复消去法 纳什均衡 反应函数 混合策略纳什均衡 多重纳什均衡的分析
划线法
乙方 甲方


左 1,1 2,3
中 4,2 1,2
右 1,3 2,1
参与者为一头大猪,一头小猪。食槽在一端,开关在另一端 每按一次开关有10单位猪食落入食槽,但按开关者有2单位成本 行动(策略)集:按或者不按 支付函数:
大猪先到,大猪吃9单位,小猪1单位 小猪先到,大猪吃6单位,小猪4单位 两猪同时,大猪吃7单位,小猪3单位
智猪博弈
大猪按钮 大猪等待
小猪按钮
5,1 9,-1
守方战略 A=三个师集中守甲方向 B=两个师守甲方向,一个师守乙方向 C=一个师守甲方向,两个师守乙方向 D=三个师集中守乙方向
严格下策反复消去
守方 攻方
a
A -,+
b
+,-
c
+,-
用+,-表示胜利和失败
B -,+ -,+ +,-
C +,-,+ -,+
D +,+,-,+
严格下策反复消去
守方 攻方
乙方 甲方


左 1,0 0,4
中 1,3 0,2
右 0,1 2,0
严格下策反复消去
两支军队,一攻一守
攻方军力2个师 守方军力3个师 进攻道路有甲和乙两条
假定军队只能整师调动,两军相遇时
人数居多的一方取胜 当两方人数相等时,守方获胜
严格下策反复消去
攻方战略 a=两个师集中沿甲方向进攻 b=一个师沿甲方向进攻,另一个师沿乙方向进攻 c=两个师集中沿乙方向进攻
Q2=12-2P2+P1
其中P1和P2分别为两个企业的产品价格,Q1和Q2分别为市场 对两个企业产品的需求量。又知道两个企业的产品固定成本
均为20元。问企业如何定价。
伯特兰德寡头模型
价格竞争的寡头模型,产品有替代性。企业产 品成本为0,两企业面临的市场需求分别是
q1 a bP1 dP2 q2 a bP2 dP1
竞争与合作
合作的前提
事前是否允许沟通和信息交流不是关键因素 只要存在利益的分配就存在竞争 只要存在共同的利益就存在合作
合作的条件
外在的强制机构对契约的保护 自实施契约保证可信威胁或信息传递
自实施契约
有两家销售音像商品的商店,疯狂爱迪Crazy Eddie和纽马克路易斯Newmark-Lewis
疯狂艾迪作出了承诺,不可能有人卖得比我们更低,我们保 证价格最低,而且是超级疯狂的低 纽马克露易斯打出广告,只要买我们的东西,将得到终生低 价保证
离散的古诺模型
低产 企业1
高产
企业2
低产
高产
4.5,4.5
3.75,5
5,3.75
4,4
连续的古诺模型
有两家厂商,qi为厂商i的产量,Q=q1+q2为市 场总产量 p为市场出清价格且p=8-Q 假设厂商没有固定成本且各厂商的边际成本都 为常数c 假设各厂商同时选择产量 求解该模型的纳什均衡
连续的古诺模型
V
Pg 守卫
1 睡的概略
混合策略纳什均衡
甲有两张牌(红1和黑2),乙有两张牌(红2和黑3) 游戏时两人分别出一张牌,如颜色相同,乙付给甲钱; 如颜色不相同,甲付给乙钱 如果甲出红色,按照两人牌点之差付钱,如果甲出黑 色,按照两人牌点之和付钱
①试列出此游戏的支付矩阵 ②该博弈有纯策略纳什均衡还是有混合策略纳什均衡 ③分别求出甲和乙的策略 ④甲和乙的期望收益是多少 ⑤该游戏是否公平
博弈方1的混合策略
pA 3 pB 1 pA 2 pB 5
博弈方2的混合策略
pC 2 pD 5 pC 3 pD 1
策略
得益
博弈方1 (0.8,0.2) 2.6
博弈方2 (0.8,0.2) 2.6
小偷和守卫的博弈
小偷 偷不偷
守卫 睡 不睡 V,-D -P,0 0,S 0,0
守卫 得益((睡)
静态博弈与纳什均衡
静态博弈的描述 严格下策反复消去法 纳什均衡 反应函数 混合策略纳什均衡 多重纳什均衡的分析
完全信息静态博弈
各博弈方Player有关于得益Payoff的充分信息,各博弈 方同时Order选择策略Strategy
博弈的参与人集合N,i =1,2,…,n 博弈方 i 的策略空间 Si 博弈方 i 的支付函数 ui=ui (s1,s2,…,sn) 博弈可以表示为G={S1,…,Sn ; u1,…,un} 同时?充分信息?
正面
正面 -1,1
反面 1,-1
反面
1,-1
-1,1
最好的策略是不让对方知道自己的策略,而且 策略选择不能有规律性,而应该随机
随机的概率应使对方无机可乘,混合策略,游 戏者以0.5概率正面,0.5概率选择反面
混合策略纳什均衡
求解纳什均衡
博 弈A 方B 1
博弈方2
C
D
2, 3 5, 2
3, 1 1, 5
公共地悲剧
帕累托最优的公共物品供给大于纳什均衡下的 公共物品供给 收入分配差距的扩大可能会缓解公共物品的供 给不足,因为斗鸡博弈变成了智猪博弈
静态博弈与纳什均衡
静态博弈的描述 严格下策反复消去法 纳什均衡 反应函数 混合策略纳什均衡 多重纳什均衡的分析
混合策略纳什均衡
二人零和对策
猜硬币 盖硬币
囚徒困境的内在根源是个体理性和集体理性之间的矛 盾引起的以个体理性和个体选择为基础的分散决策方 式并不一定实现整体利益最优
为什么不合作? 合作的前提和要件是什么? 合作机制的设计?
智猪博弈
在美国大湖地区可以看到许多灯塔,这些灯塔都是大 航运公司花钱建造的,但这并不妨碍小的航运公司使 用。这种行为称为搭便车,可以用智猪博弈来解释
竞争与合作
囚徒困境的支付矩阵
甲招 甲不招
乙招
-8,-8 -10,0
乙不招
0,-10 -1,-1
竞争与合作
田忌 齐威王
上中下
上中下
3
上下中
1
中上下
1
中下上
1
下上中
-1
下中上
1
上下中
1
3
1
1
1
-1
中上下
1
-1
3
1
1
1
中下上
-1
1
1
3
1
1
下上中
1
1
1
-1
3
1
下中上
1
1
-1
1
1
3
对策问题的分类
信息
行动
完全信息
静态
完全信息静态博弈 纳什均衡
Nash(1950、1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
Harsanyi(1967、1968)
动态
完全信息动态博弈 子博弈精炼纳什均衡
Selton(1965)
不完全信息动态博弈 精炼贝叶斯纳什均衡
Selton(1975) Kreps&Wilson(1978)
ui=ui (q1,q2) 古诺模型G={q1,q2 ;u1(q1,q2),u2(q1,q2)}
静态博弈与纳什均衡
静态博弈的描述 严格下策反复消去法 纳什均衡 反应函数 混合策略纳什均衡 多重纳什均衡的分析
占优策略和上策均衡
上策或者占优策略
一般地,每个参与人的最优策略依赖于所有其他人的最优策 略。但是在一些特殊的博弈中,无论其他人选择什么策略, 某个参与人的最优策略是唯一的,这一策略给他带来的收益 始终高于其他策略
上策均衡
上策均衡是各博弈方绝对最优策略的组合
上策均衡
甲招供 甲不招
乙招供
-8,-8 -10,0
乙不招
0,-10 -1,-1
严格下策反复消去
严格下策
与占优策略相反,博弈方的某个策略给他带来的收益始终低 于另一种策略,这一策略称为下策。
严格下策消去
消去博弈方的严格下策不会消去纳什均衡 存在弱下策的情况下,消去下策的顺序对最后的结果有影响
反应函数
q2
(0,6) (0,3)
R1(q2 )
理性局 限和古 诺调整
R2 (q1)
(3,0) (6,0)
q1
古诺模型的反应函数图示
伯特兰德寡头模型
相关主题