当前位置:文档之家› 复旦大学经济博弈论课件--经济博弈论(6)

复旦大学经济博弈论课件--经济博弈论(6)

上策均衡不是普遍存在的
2021/3/11
4
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
严格下策反复消去:
左中

上 1,0 1,3 0,1
下 0,4 0,2 2,0
左 1,0 0,4
中 1,3 0,2
左 1,0
P1*
1 2b1
(a1 b1c1 d1P2* )
2021/3/11
P2*
1 2b2
(a2
b2c2
d 2 P1* )
16
2.3.4 公共资源问题
公共草地养羊问题
Q q1 qn V V (Q)
ui qiV (Q) qic
以三农户为例 n=3,c=4
2021/3/11
17
竞争:个体利益最大化
第二章 完全信息静态博弈
本章介绍完全信息静态博弈。完全信息静 态博弈即各博弈方同时决策,且所有博弈方对 各方得益都了解的博弈。囚徒的困境、齐威王 田忌赛马、猜硬币、石头剪子布、古诺产量决 策都属于这种博弈。完全信息静态博弈属于非 合作博弈最基本的类型。本章介绍完全信息静 态博弈的一般分析方法、纳什均衡概念、各种 经典模型及其应用等。
11 q1 R1(q2 , q3 ) 48 2 q2 2 q3
q2
R2 (q1, q3 )
48
1 2
q1
1 2
q3
q3
R3 (q1, q2 )
48
1 2
q1
1 2
q2
q* 1
q2*
q3*
24
u1* u2* u3* 576
Q* 72
u* 1728
合作:总体利益最大化
u Q(100 Q) 4Q 96 Q

Si {,si1则,博sik弈} 方 以概率分i 布
pi 随 (机pi1在,其pik 个)
可选策略中k 选择的“策略”,称为一个“混合策略”,其中
对 0 p都ij 成 1立,j且 1,, k
pi1 pik 1
混合策略扩展博弈:博弈方在混合策略的策略空间(概率
分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
加重对首位的处罚:短期中的效果是使守卫真正尽职 在长期中并不能使守卫更尽职,但会降低盗窃发生的概略
2021/3/11
26
小偷 偷不偷
守卫 睡 不睡 V,-D -P,0 0,S 0,0
小偷 得益(偷)
0 -P
V
Pg 守卫
1 睡的概略
- P’
加重对小偷的处罚:短期内能抑制盗窃发生率 长期并不能降低盗窃发生率,但会是的守卫更多的偷懒
一、猜硬币博弈
盖 正面 硬 币 反面 方
猜硬币方
正面
反面
-1, 1
1, -1
1, -1
-1, 1
(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略
这类博弈很多,引出混合策略纳什均衡概念
2021/3/11
22
二、混合策略、混合策略博弈 和混合策略纳什均衡
混合策略:在博弈 G {S1,Sn;u中1,,u博n}弈方 的策略i 空间
混合策略纳什均衡:包含混合策略的策略组合,构成纳什 均衡。
2021/3/11
23
三、一个例子
该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析
博弈方1的混合策略
博 弈A 方B 1
博弈方2
C
D
2, 3 5, 2
3, 1 1, 5
pA 3 pB 1 pA 2 pB 5
博弈方2的混合策略
pC 2 pD 5 pC 3 pD 1
2021/3/11
13
两寡头间的囚徒困境博弈
厂 不突破 商 1 突破
厂商2
不突破
突破
4.5,4.5
3.75,5
5,3.75
4,4
2021/3/11
以自身最大利益为目标:各生产 2单位产量,各自得益为4
以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5
14
2.3.2 反应函数
古诺模型的反应函数
都是对其余博弈方策略的组合
(si* , si*1, si*1,...sn* )
的最佳对策,也即ui (si*,si*1, si*, si*1,...sn*) ui (si*,s对i*1,任sij意, si*1,...sn*)
都成立,si j则称Si
为 的一(s个i*, 纳什sn*均) 衡G
2021/3/11
0, 2
3, 3
1, 3
1, 1
2021/3/11
博弈方2采用纯策略L时,博弈方1 采用混合策略(1/2,1/2,0)的得益
u1e
1 2
3
1 2
0
0
1
3 2
博弈方2采用纯策略R时,博弈方1 采用混合策略(1/2,1/2,0)的得益
u1e
1 2
0
1 2
3 01
3 2
31
2.4.4 混合策略反应函数
2021/3/11
29
三、市场机会博弈
厂商2

不进
厂 进 -50,-50 100,0 商 1 不进 0,100 0,0
市场机会
进 不进 得益
厂商1: 2/3 1/3
0
厂商2: 2/3 1/3
0
2021/3/11
30
2.4.3 混合策略和严格下策反复消去法
博U
弈 方
M
1D
博弈方2
L
R
3, 1
0, 2
2021/3/11
Q 48 3 24 72 u 2304 3576 1728
18
2.3.5 反应函数的问题和局限性
在许多博弈中,博弈方的策略是有限且非连 续时,其得益函数不是连续可导函数,无法 求得反应函数,从而不能通过解方程组的方 法求得纳什均衡。
即使得益函数可以求导,也可能各博弈方的 得益函数比较复杂,因此各自的反应函数也 比较复杂,并不总能保证各博弈方的反应函 数有交点,特别不能保证有唯一的交点。
2021/3/11
3
2.1.1 上策均衡
上策:不管其它博弈方选择什么策略,一博弈方 的某个策略给他带来的得益始终高于其它的策 略,至少不低于其他策略的策略
囚徒的困境中的“坦白”;双寡头削价中“低 价”。
上策均衡:一个博弈的某个策略组合中的所有策 略都是各个博弈方各自的上策,必然是该博弈 比较稳定的结果
2021/3/11
8
2.2.1 纳什均衡的定义
策 博略弈空方间i的:S第1,j个S策n 略:si j Si 博弈方 i的得益:u i
博弈:G {S1,Sn;u1,un}
纳什均衡:在博弈G {S1,Sn;u1中,,un}如果由各个博弈方的各i
一个策略组成的某个策略组合 (s中i*,,s任n* ) 一博弈方 的策略,
2021/3/11
19
2.4 混合策略和混合策略纳什均衡
2.4.1 严格竞争博弈和混合策略的引进 2.4.2 多重均衡博弈和混合策略 2.4.3 混合策略和严格下策反复消去法 2.4.4 混合策略反应函数
2021/3/11
20
么么么么方面
Sds绝对是假的
2.4.1 严格竞争博弈和混合策略的引进
9
2.2.2 纳什均衡的一致预测性质
一致预测:如果所有博弈方都预测一个特定博弈 结果会出现,所有博弈方都不会利用该预测或者 这种预测能力选择与预测结果不一致的策略,即 没有哪个博弈方有偏离这个预测结果的愿望,因 此预测结果会成为博弈的最终结果
只有纳什均衡才具有一致预测的性质 一致预测性是纳什均衡的本质属性 一致预测并不意味着一定能准确预测,因为有 多重均衡,预测不一致的可能
2021/3/11
夫妻之争博弈的混合策略纳什均衡
策略
得益
博弈方1 (0.75,0.25) 0.67
博弈方2 (1/3,2/3) 0.75
28
二、制式问题
厂A 商 1B
厂商2
A
B
1, 3 0, 0
0, 0 2, 2
制式问题
制式问题混合策略纳什均衡
A
B
得益
厂商1: 0.4 0.6 0.664
厂商2: 0.67 0.33 1.296
2021/3/11
27
2.4.2 多重均衡博弈和混合策略
一、夫妻之争的混合策略纳什均衡
妻 时装 子
足球
丈夫 时装 足球 2, 1 0, 0
0, 0 1, 3
夫妻之争
妻子的混合策略
pw(C)1 pw(F) 0 pw(C) 0 pw(F)3
丈夫的混合策略
ph (C) 2 ph (F) 0 ph (C) 0 ph (F)1
1, 3 0, 2
0, 1 2, 0
囚 徒
-5, -5
0, -8
夫 妻

-8, 0
-1, -1




-1, 1


1, -1
1, -1 -1, 1
2021/3/11
2, 1 0, 0
0, 0 1, 3
7
2.2 纳什均衡
2.2.1 纳什均衡的定义 2.2.2 纳什均衡的一致预测性质 2.2.3 纳什均衡与严格下策反复消去法
q1 q1(P1, P2 ) a1 b1P1 d1P2 q2 q2 (P1, P2 ) a2 b2P2 d2P1
u1 u1(P1, P2 ) P1q1 c1q1 (P1 c1)q1 (P1 c1)(a1 b1P1 d1P2 )
相关主题