当前位置：文档之家› 复旦大学经济博弈论课件--经济博弈论(6)

复旦大学经济博弈论课件--经济博弈论(6)

上策均衡不是普遍存在的
2021/3/11
4
2.1.2 严格下策反复消去法
严格下策：不管其它博弈方的策略如何变化，给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略
严格下策反复消去：
左中
右
上 1，0 1，3 0，1
下 0，4 0，2 2，0
左 1，0 0，4
中 1，3 0，2
左 1，0
P1*
1 2b1
(a1 b1c1 d1P2* )
2021/3/11
P2*
1 2b2
(a2
b2c2
d 2 P1* )
16
2.3.4 公共资源问题
公共草地养羊问题
Q q1 qn V V (Q)
ui qiV (Q) qic
以三农户为例 n=3，c=4
2021/3/11
17
竞争：个体利益最大化
第二章完全信息静态博弈
本章介绍完全信息静态博弈。完全信息静态博弈即各博弈方同时决策，且所有博弈方对各方得益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。
11 q1 R1(q2 , q3 ) 48 2 q2 2 q3
q2
R2 (q1, q3 )
48
1 2
q1
1 2
q3
q3
R3 (q1, q2 )
48
1 2
q1
1 2
q2
q* 1
q2*
q3*
24
u1* u2* u3* 576
Q* 72
u* 1728
合作：总体利益最大化
u Q(100 Q) 4Q 96 Q
为
Si {，si1则,博sik弈} 方以概率分i 布
pi 随 (机pi1在,其pik 个)
可选策略中k 选择的“策略”，称为一个“混合策略”，其中
对 0 p都ij 成 1立，j且 1,, k
pi1 pik 1
混合策略扩展博弈：博弈方在混合策略的策略空间（概率
分布空间）的选择看作一个博弈，就是原博弈的“混合策略扩展博弈）。
加重对首位的处罚：短期中的效果是使守卫真正尽职在长期中并不能使守卫更尽职，但会降低盗窃发生的概略
2021/3/11
26
小偷偷不偷
守卫睡不睡 V，-D -P，0 0，S 0，0
小偷得益(偷)
0 -P
V
Pg 守卫
1 睡的概略
- P’
加重对小偷的处罚：短期内能抑制盗窃发生率长期并不能降低盗窃发生率，但会是的守卫更多的偷懒
一、猜硬币博弈
盖正面硬币反面方
猜硬币方
正面
反面
-1， 1
1， -1
1， -1
-1， 1
（1）不存在前面定义的纳什均衡策略组合（2）关键是不能让对方猜到自己策略
这类博弈很多，引出混合策略纳什均衡概念
2021/3/11
22
二、混合策略、混合策略博弈和混合策略纳什均衡
混合策略：在博弈 G {S1,Sn;u中1,，u博n}弈方的策略i 空间
混合策略纳什均衡：包含混合策略的策略组合，构成纳什均衡。
2021/3/11
23
三、一个例子
该博弈无纯策略纳什均衡，可用混合策略纳什均衡分析
博弈方1的混合策略
博弈A 方B 1
博弈方2
C
D
2， 3 5， 2
3， 1 1， 5
pA 3 pB 1 pA 2 pB 5
博弈方2的混合策略
pC 2 pD 5 pC 3 pD 1
2021/3/11
13
两寡头间的囚徒困境博弈
厂不突破商 1 突破
厂商2
不突破
突破
4.5，4.5
3.75，5
5，3.75
4，4
2021/3/11
以自身最大利益为目标：各生产 2单位产量，各自得益为4
以两厂商总体利益最大：各生产 1.5单位产量，各自得益为4.5
14
2.3.2 反应函数
古诺模型的反应函数
都是对其余博弈方策略的组合
(si* , si*1, si*1,...sn* )
的最佳对策，也即ui (si*,si*1, si*, si*1,...sn*) ui (si*,s对i*1,任sij意, si*1,...sn*)
都成立，si j则称Si
为的一(s个i*, 纳什sn*均) 衡G
2021/3/11
0， 2
3， 3
1， 3
1， 1
2021/3/11
博弈方2采用纯策略L时，博弈方1 采用混合策略(1/2,1/2,0)的得益
u1e
1 2
3
1 2
0
0
1
3 2
博弈方2采用纯策略R时，博弈方1 采用混合策略(1/2,1/2,0)的得益
u1e
1 2
0
1 2
3 01
3 2
31
2.4.4 混合策略反应函数
2021/3/11
29
三、市场机会博弈
厂商2
进
不进
厂进 -50，-50 100，0 商 1 不进 0，100 0，0
市场机会
进不进得益
厂商1： 2/3 1/3
0
厂商2： 2/3 1/3
0
2021/3/11
30
2.4.3 混合策略和严格下策反复消去法
博U
弈方
M
1D
博弈方2
L
R
3， 1
0， 2
2021/3/11
Q 48 3 24 72 u 2304 3576 1728
18
2.3.5 反应函数的问题和局限性
在许多博弈中，博弈方的策略是有限且非连续时，其得益函数不是连续可导函数，无法求得反应函数，从而不能通过解方程组的方法求得纳什均衡。
即使得益函数可以求导，也可能各博弈方的得益函数比较复杂，因此各自的反应函数也比较复杂，并不总能保证各博弈方的反应函数有交点，特别不能保证有唯一的交点。
2021/3/11
3
2.1.1 上策均衡
上策：不管其它博弈方选择什么策略，一博弈方的某个策略给他带来的得益始终高于其它的策略，至少不低于其他策略的策略
囚徒的困境中的“坦白”；双寡头削价中“低价”。
上策均衡：一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策，必然是该博弈比较稳定的结果
2021/3/11
8
2.2.1 纳什均衡的定义
策博略弈空方间i的：S第1,j个S策n 略：si j Si 博弈方 i的得益：u i
博弈：G {S1,Sn;u1,un}
纳什均衡：在博弈G {S1,Sn;u1中,，un}如果由各个博弈方的各i
一个策略组成的某个策略组合 (s中i*,，s任n* ) 一博弈方的策略，
2021/3/11
19
2.4 混合策略和混合策略纳什均衡
2.4.1 严格竞争博弈和混合策略的引进 2.4.2 多重均衡博弈和混合策略 2.4.3 混合策略和严格下策反复消去法 2.4.4 混合策略反应函数
2021/3/11
20
么么么么方面
Sds绝对是假的
2.4.1 严格竞争博弈和混合策略的引进
9
2.2.2 纳什均衡的一致预测性质
一致预测：如果所有博弈方都预测一个特定博弈结果会出现，所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略，即没有哪个博弈方有偏离这个预测结果的愿望，因此预测结果会成为博弈的最终结果
只有纳什均衡才具有一致预测的性质一致预测性是纳什均衡的本质属性一致预测并不意味着一定能准确预测，因为有多重均衡，预测不一致的可能
2021/3/11
夫妻之争博弈的混合策略纳什均衡
策略
得益
博弈方1 （0.75，0.25） 0.67
博弈方2 （1/3，2/3） 0.75
28
二、制式问题
厂A 商 1B
厂商2
A
B
1， 3 0， 0
0， 0 2， 2
制式问题
制式问题混合策略纳什均衡
A
B
得益
厂商1： 0.4 0.6 0.664
厂商2： 0.67 0.33 1.296
2021/3/11
27
2.4.2 多重均衡博弈和混合策略
一、夫妻之争的混合策略纳什均衡
妻时装子
足球
丈夫时装足球 2， 1 0， 0
0， 0 1， 3
夫妻之争
妻子的混合策略
pw(C)1 pw(F) 0 pw(C) 0 pw(F)3
丈夫的混合策略
ph (C) 2 ph (F) 0 ph (C) 0 ph (F)1
1， 3 0， 2
0， 1 2， 0
囚徒
-5， -5
0， -8
夫妻
困
-8， 0
-1， -1
之
境
争
猜
-1， 1
硬
币
1， -1
1， -1 -1， 1
2021/3/11
2， 1 0， 0
0， 0 1， 3
7
2.2 纳什均衡
2.2.1 纳什均衡的定义 2.2.2 纳什均衡的一致预测性质 2.2.3 纳什均衡与严格下策反复消去法
q1 q1(P1, P2 ) a1 b1P1 d1P2 q2 q2 (P1, P2 ) a2 b2P2 d2P1
u1 u1(P1, P2 ) P1q1 c1q1 (P1 c1)q1 (P1 c1)(a1 b1P1 d1P2 )

e商务文档

复旦大学经济博弈论课件--经济博弈论(6)

相关文档推荐：