当前位置:文档之家› 第二章 策略型博弈

第二章 策略型博弈



甲 坦白 不坦白
坦白 -6,-6 -8,-1
不坦白 -1,-8 -2,-2
甲:“不坦白”相对于“坦白”是严格劣策略
乙:“不坦白”相对于“坦白”是严格劣策略
乙 甲
坦白 -6,-6
不坦白 -1,-8
坦白

甲 坦白
坦白 -6,-6
例2.5 利用重复剔除严格劣策略求解
·

乙 左 中 右
上 下
1,0 0,3
乙 甲 石头 剪刀 布
石头 0,0 -1,1 1,-1
剪刀 1,-1 0, 0 -1,1
布 -1,1 1,-1 0,0
利用重复剔除严格劣策略无法求解
例2.6 利用重复剔除严格劣策略无法求解



左 0 ,4
中 4 ,0
右 5 ,3


4 ,0
3 ,5
0 ,4
3 ,5
5 ,3
6 ,6
六、注意
大多数的博弈局势中使用剔除严格劣策略的
2 (q1 , q2 ) q2 [a (q1 q2 ) c]
Cournot 模型求解
max 1 ( q1 , q2 ) q1[ a (q1 q2 ) c]
max 2 ( q1 , q2 ) q2 [a (q1 q2 ) c ]
q2
q1
1 (q1 , q2 ) * * * [a (q1 q2 ) c] q1 (1) a 2q1 q2 c 0 q1
1 ,2
重复剔除严格劣策略均衡是(上,中)
·

乙 中

1 ,2
五、重复剔除严格劣策略有两个缺陷
1、每一步剔除需要局中人间相互了解的更进一步假定,
如果我们把这一过程应用到任意多步,需要假定“局中人
是理性的”是共同知识。 2、这一方法对博弈结果的预测经常是不准确的.
例2.2 石头、剪刀、布的支付矩阵
3、支付函数 (Payoff functions) 表示为: G {S1 ,..., S n ; u1 ,..., un }
三、两种特殊博弈类型 1、有限博弈: (1) 博弈中局中人人数有限;
(2) 每个局中人只有有限个策略。
2、零和博弈:
博弈中局中人所获支付之和为零,即一方
所得为另一方所失。
例2.1 囚徒困境及其策略型表示 (Tucker,1950)
1、局中人:甲,乙 2、策 略:S甲 S乙 {坦白,不坦白}
3、支付函数——支付矩阵(双人有限博弈) 每个位臵上第一个数字表示局中人1在对应的策略组合 中得到的支付,第二个数字表示局中人2的相应所获支付。
囚徒困境的支付矩阵


坦白
si ( s1 ,...si 1 , si 1 ,..., sn ) S i ( S1 ,...Si 1 , Si 1 ,..., S n )
都有 ui ( si, si ) ui ( si, si ) 且其中至少有一个为严格不等式 ,则称 si 是第i个 局中人的一个严格劣策略。
ui ( si , s ) u ( s , s i i i i ), si S i

si arg max ui ( si , s i ), i 1, 2,..., n si S i
( s ,..., s 则称策略组合 1 n )是此博弈G的一个纳什均衡。

设: 两寡头固定成本都为0,边际成本为常数c,
消费者对厂商1和2生产产品的需求量分别为:
q1 ( p1 , p2 ) a p ;1 bp2
四、纳什均衡的求法
1、双人有限博弈:双划线法
首先对局中人 2 的每一个策略,局中人 1 寻找支付最大 的策略,在其对应支付下划线; 然后对局中人1进行相应的步骤; 最后,凡是两个局中人支付下均被划线的结局就是纳 什均衡。
例2.1 囚徒困境的纳什均衡
用双划线法可以求出纳什均衡:
(坦白,坦白),(-6,-6) 意义:揭示个人理性与集体理性之间的矛盾。
三、重复剔除严格劣策略
1 、根据理性的局中人不会选择严格劣策略这一原则,可
以通过重复剔除严格劣策略的方法对博弈进行求解。
2 、其方法是:对每个局中人寻找严格劣策略,由于它不
会被局中人选择实施,所以找到一种后就可以将其从博弈
局势中剔除,从而得到一种新的缩减后的博弈局势,对这 种新局势重复上述过程,直到无法找到新的严格劣策略为 止。
1 ,2 0 ,1
0 ,1 2 ,0
乙:“右”相对于“中”是严格劣策略
·

乙 左 中 右
上 下
1 ,0 0 ,3
1 ,2 0 ,1
0 ,1 2 ,0
甲:“下”相对于“上”是严格劣策略
·

乙 左 中
上 下
1 ,0 0 ,3
1 ,2 0 ,1
乙:“左”相对于“中”是严格劣策略
·

乙 左 中

1 ,0
1 1 (q , q ) (a c), (a c) 3 3
1 2
1 2 (a c) 9
1 2
两寡头产量串谋模型
假设两寡头可以串谋,共同确定产量Q使总利润最大化, 利润函数为:(Q)=Q(a-Q-c)
1 总利润最大的产量为: Qm (a c) 2 1 Q1 Q2 Qm (a c) ——称为契约曲线 2 1 2 总利润为: m (a c) 4 2 Q q q2 ( a c ) 比较及含义: m 1 3 2 m 1 2 (a c) 2 9
女 男 足球 芭蕾
足球 3 ,2 -1,-1
芭蕾 1,1 2,3
女 男 足球 芭蕾
足球 3 ,2 -1,-1
芭蕾 1,1 2,3
例2.8
猜左右手游戏
局中人:甲,乙 策 略:甲:放左手,放右手
乙:猜左手,猜右手
支付矩阵:见下一页 没有纳什均衡
乙 甲 放左手 放右手
猜左手 -1,1 1,-1
猜右手 1,-1 -1,1

甲 坦白 不坦白
坦白 -6,-6 -8,-1
不坦白 -1,-8 -2,-2

甲 坦白 不坦白
坦白 -6,-6 -8,-1
不坦白 -1,-8 -2,-2

甲 坦白 不坦白
坦白 -6,-6 -8,-1
不坦白 -1,-8 -2,-2
例2.7 智猪博弈(boxed pigs) 局中人:大猪,小猪
策 略:大猪:按,等待 小猪:按,等待 支付矩阵:见下一页 纳什均衡:(按,等待)
下中上
1,-1
1,-1
-1,1
1,-1
1,-1
3,-3
例2.4 性别大战(battle of the sexes) 局中人:男,女

略:男:看足球,看芭蕾
女:看足球,看芭蕾
支付矩阵:见下一页
性别大战的支付矩阵
女 男 足球 芭蕾
足球
3,2 -1,-1
芭蕾
1,1 2,3
第二节 重复剔除严格劣策略均衡
三、纳什均衡的定义 1、博弈的纳什均衡是这样一种最优策略组合, 是一种你好、我好大家都好的理性结局,其中每一 个局中人均不能也不想单方面改变自己的策略而增 加收益,每个局中人选择的策略是对其他局中人所 选策略的最佳反应。
三、纳什均衡的定义
2、数学定义: 在策略型博弈 G {S1 ,..., S n ; u1 ,..., un } 中,如果对于每个局中 人i,存在 si Si ,都有
博弈论与信息经济学
Game Theory and Information Economics
第二部分 非合作博弈理论
主要内容
第二章 策略型博弈 第三章 扩展型博弈 第四章 贝叶斯博弈 第五章 动态贝叶斯博弈
第二章 策略型博弈
——同时行动,如何决策
第一节
第二节 第三节
策略型博弈的表示
重复剔除严格劣策略均衡 纳什均衡
四、囚徒困境的解
对局中人甲而言,无论局中人乙采取何种策略,采用 “不坦白”策略得到的支付都小于采用“坦白”策略。 局中人甲的“不坦白”策略严格劣于“坦白”策略. “不坦白”策略都是一种严格劣策略,从而可以剔除。 博弈中局中人各自从自身利益出发的理性选择(博弈均 衡解)就是(坦白,坦白)。
例2.1 囚徒困境的支付矩阵
不坦白
坦白
不坦白
-6,-6
-8,-1
-1,-8
-2,-2
例2.2 石头、剪刀、布的支付矩阵
乙 甲 石头 剪刀
石头 0,0 -1,1
剪刀 1,-1 0,0
布 -1,1 1,-1

1,-1
-1,1
0,1
例2.3 田忌赛马的支付矩阵
田忌 齐王 上中下 上下中 中上下 中下上 下上中 上中下 上下中 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 1,-1 1,-1 3,-3 -1,1 -1,1 1,-1 1,-1 1,-1 3,-3 1,-1 -1,1 1,-1 1,-1 1,-1
第四节
第五节
混合策略纳什均衡
纳什均衡的存在性
博弈有两种表述方法
策略型(标准型)表述
——适合表示静态博弈 扩展型表述
——适合表示动态博弈
第一节
策略型博弈的表示
一、策略型博弈的含义
完全信息静态博弈又称为策略型博弈。完全信息是指
局中人对自己与其他局中人的所有与博弈有关的事前信息
相关主题