当前位置：文档之家› 纳什均衡

纳什均衡

pC+pD=1
策略
得益
博弈方1 （0.8，0.2） 2.6
博弈方2 （0.8，0.2） 2.6
齐威王田忌赛马
Pa 上中下
齐 Pb 上下中威 Pc 中上下王 Pd 中下上
Pe 下上中 Pf 下中上
Pg
上中下
3，-3 1，-1 1，-1 -1，1 1，-1 1，-1
ph
上下中
• 试着用一个得益矩阵来描述大海和丽娟的情侣博弈
情侣博弈的得益矩阵
小丽
足球
芭蕾
足球
1
2
0 0
大海
芭蕾
－1
－1
2 1
靠左走还是靠右走
• 在一个没有交通规范的农村小路骑自行车，你应该走在道路的哪一边？
• 假如别人靠右（左）走，你也靠右（左）走，则不会相撞；反之，假如别人靠右（左）走，而你却反其道而行之，偏要靠左（右）走，则必然相撞。
• 混合策略：在博弈 G {S1, Sn;u1, un} 中，博弈方i 的策略空间为 Si {si1, s，ik }则博弈方i 以概率分布
pi ( pi1, pik ) 随机在其 k个可选策略中选择的“策略”，
称为一个“混合策略”，0其中pij 1 j 1对, , k
都成立，且
pi1 pik 1
• 静态：博弈方是同时决策的，或者虽然各博弈方决策的时间不一定真正一致，但他们在做决策时互相不知道其他博弈方的策略。
• 完全信息静态博弈：各博弈方同时决策，且所有博弈方对各方得益都了解的博弈。
• 如何求这一类博弈的解呢？－－博弈的结果如何？－－博弈各方最终的策略组合？
上策均衡法
• 上策均衡：一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策
经典博弈故事之二－－情侣博弈
•
大海和小丽正在热恋。难得的周末又到了，安排什么节目呢？周末晚上，
中国足球队要在世界杯外围赛中和伊朗队做生死之战。大海是个超级球迷，国
内的甲级联赛都不肯放过，何况是不争气的国家队的生死大战？也正好是这个
周末的晚上，俄罗斯一个著名芭蕾舞团莅临该市演出芭蕾舞剧《胡桃夹子》。
丽娟最崇尚钢琴、芭蕾这样的高雅艺术，对斯拉夫民族的歌唱和芭蕾更是崇拜
100，100 0，0
50，101
R2
50，0 1，1
60，0
R3
0，300 0，0 200，200
纳什均衡：举例
• 广告博弈
战略
企业2
做广告不做广告
企业1
做广告 4，4 15，1 不做广告 1，15 10，10
• 纳什均衡：（做广告，做广告）
上次的作业
• 画出田忌赛马的得益矩阵 • 画出猜硬币博弈的得益矩阵 • 画出石头、剪子、布的得益矩阵 • 能否用我们今天的几种方法得到均衡解
•博弈方i 的得益：ui
•博弈：G {S1, Sn;u1, un}
•纳什均衡：在博弈G {S1, Sn;u1, un} 中，如果由各个博弈
方的各一个策略组成的某个策略组合(si*, sn* ) 中，任一博弈
方i
的策略，都是对其余博弈方策略的组合
( si* ,
s* i 1
,
s* i 1
,...sn*
– 各个博弈方选择的纯策略的概率分布，要求满足使对方或其他博弈方采用不同策略的期望收益相同
一个例子
该博弈无纯策略纳什均衡，可用混合策略纳什均衡分析
博弈方1的混合策略
pA 3 pB 1 pA 2 pB 5
博弈A 方B 1
博弈方2
C
D
2， 3 5， 2
3， 1 1， 5
博弈方2的混合策略
pC 2 pD 5 pC 3 pD 1
• 假设行走顺利，每人获益为1，相撞，则获益为－1， • 画出得益矩阵
交通博弈
乙
靠左行
靠右行
靠左行
甲
靠右行
1，1 -1，-1
-1，-1 1，1
经典博弈故事之三－－智猪博弈
• 笼子里面有两只猪，一只比较大，一只比较小。笼子很长，一头有一个按钮，另一头是饲料的出口和食槽。按一下按钮，将有相当于10个单位的猪食进槽，但是按按钮以后跑到食槽所需要付出“劳动”，加起来要消耗相当于2个单位的猪食。问题是按钮和食槽分置笼子的两端，按按钮的猪付出劳动跑到食槽的时候，坐享其成的另一头猪早已吃了不少。如果大猪先到，大猪呼啦啦吃到9个单位，小猪只能吃到1个单位；如果同时到达，大猪吃到7个单位；小猪吃到3个单位；如果小猪先到，小猪可以吃到4个单位，而大猪吃到6 个单位。
• 假设打到一只鹿，两家平分，每家管10天；打到4只兔子，只能供一家吃4天。
• 画出得益矩阵
猎人博弈得益矩阵
乙
猎鹿
打兔
10
4
甲猎鹿 10
0
0
4
打兔 4
4
博弈论故事之五－－高薪养廉
• “高薪养廉”是公务员制度方面的一种理论，我们分析一下“高薪”为什么能养廉？
• 假设甲乙为一家单位的主任和书记关系密切的国家公务员，7代表现在政府给他们的高薪。如果两人受贿，因为串谋而一时不被人发现，他们可以达到9的位置；而一旦“东窗事发”，他就要被撤职查办，不受贿一方得8
• 只有，两方均被划线的策略组合，才是稳定的策略－－表明给定一方采用该策略组合中的策略，则另一方也愿意采用该策略组合中的策略，该策略组合具有稳定性。
• 但是，许多博弈根本不不存在确定性的结果，划线法失效，比如猜硬币－－没有一个策略组合是双方同时愿意接受的，这样的博弈根本不可能有可以预言的博弈结果
1，-1 3，-3 -1，1 1，-1 1，-1 1，-1
？ • 你觉得它们的最佳应对策略是什么？
严格竞争博弈和混合策略的引进
一、猜硬币博弈
盖正面硬币反面方
猜硬币方
正面
反面
-1， 1
1， -1
1， -1
-1， 1
（1）不存在前面定义的纳什均衡策略组合（2）关键是不能让对方猜到自己策略－－保持随机性
这类博弈很多，引出混合策略纳什均衡概念
混合策略、混合策略博弈和混合策略纳什均衡
• 混合策略扩展博弈：博弈方在混合策略的策略空间（概率
分布空间）的选择看作一个博弈，就是原博弈的“混合策略扩
展博弈）
• 混合策略纳什均衡：包含混合策略的策略组合，构成纳什均衡—任何博弈一方单独改变自己的策略，或者随机选择各个纯策略的概率分布，都不能给自己增加任何利益
求混合策略纳什均衡
• 思路：
囚
徒
-3,-3
0， -6
情侣
困
-6， 0
-1， -1
博
境
弈
猜
-1， 1
硬
币
1， -1
1， -1 -1， 1
2， 1 0， 0
0， 0 1， 3
纳什均衡的定义
•纳什均衡：所有参与人的最优策略的组合－－给定该策略中别人的选择，没有人有积极性改变自己的选择。
•策略空间：S1, Sn
•博弈方i 的第 j个策略：si j Si
– 与划线法一样都是基于策略之间的相对优劣关系进行分析的，所得到的结果也是一致的。
– 如果能，则从所分析的策略组合对应的得益数组引一箭头，到改变策略后策略组合对应的得益数组
– 最后，只有指向，没有离开的策略组合为均衡解－－稳定－－没有人愿意单独改变
箭头法
1， 0 0， 4
1， 3 0， 2
0， 1 2， 0
– 稳定的和自我强制的，所以是真正可预测的 – 反之，不具有一致预测性的博弈结果，则难以避免预测和行为之间的
矛盾，甚至是自我否定的。
•只有纳什均衡才具有一致预测的性质 •一致预测性是纳什均衡的本质属性 •一致预测并不意味着一定能准确预测，因为有多重均衡，预测不一致的可能
寻找纳什均衡
C1
C2
C3
R1
1，0 1，3
下 0，4 0，2 2，0
0，4 0，2
左
中
1，0 1，3
严格下策反复消去法
• 智猪博弈
小猪
按等待
大
按
5，1 4，4
猪
等待 9，－1 0，0
严格下策反复消去法
• 适用面：
– 严格下策反复消去法的适用面比上策均衡要更大些 – 但也有很多博弈问题没有严格下策：田忌赛马、猜硬币、情
侣博弈、交通博弈、石头剪刀布、、、－－此时，该方法失效。 – 最大的用处：简化博弈
• 做法： – 首先找出某博弈人的严格下策，把这个严格下策剔除后，剩下的是一个不包含已剔除劣策略的新的博弈；然后再剔除这个新的博弈中的严格下策；继续这个过程，直到没有劣策略存在。如果剩下的策略组合是唯一的，这个唯一的策略组合就是严格下策反复消去法的均衡
严格下策反复消去法
左中
右
左
中
上 1，0 1，3 0，1
• 画出得益矩阵
博弈论故事之五－－高薪养廉
• 我们把数据改变一下，变成薪水只有2，两个串谋，同时受贿还是得9；一方受贿，一方不受贿，则分别为2，3。
• 得益矩阵？
高薪养廉的得益矩阵
乙
受贿
不受贿
受
9
甲贿 9
8 0
不
0
受
贿8
7
乙
7
受贿
不受贿
受
9
贿9
0
甲
不
0
受贿
3
2
完全信息静态博弈
• 完全信息：各博弈方都完全了解所有博弈方各种情况下得益
囚坦白徒
1 不坦白
囚徒 2
坦白
不坦白
-3， -3

e商务文档

纳什均衡

相关文档推荐：