当前位置：文档之家› 《博弈论基础》

《博弈论基础》

01-3-2
30
求解的一般过程 ● Maxa2∈A2{U2（a1，a2）}→反应函数 a2=R2（a1） ● Maxa1∈A1{U1（a1，a2（a1））}→反应函数 a*1 ● 得到：SPNE （a1；R2（a1）；）均衡结果（Outcome）（a*1；R2（a*1）：）例：Stackelberg（1934）：Leader-Follower Model
01-3-2
流浪汉游荡
1
0
0
21
●纯战略 NE 不存在 ●求混合战略 NE：设政府的混合战略 σG=（θ，1-θ）设流浪汉的混合战略 σL=（γ，1-γ） =θ[3γ+（-1）（1-γ）]+（1-θ）[-γ+0（1-γ）] =θ（5γ-1）-γ VL（σG，σL）=γVL（θ，1）+（1-γ）VL（θ，0） =γ[2θ+（1-θ）]+（1-γ）[3θ+0（1-θ）]
01-3-2
￥490
13 10 4 10
8 13
●百年夫妻：纯战略 NE 不存在
20
3、NE 战略存在性定理（Nash，1950）：
每个有限博弈至少存在一个 NE（纯战略或混合战略） ●混合战略（Mixed Strategy）：关于纯战略集的概率向量 σk=（σk，1，σk，2，…，σk，nk） ●例：社会福利博弈寻找工作救济政府不救济
01-3-2
17
２、ＮＥ的求解
例 1：囚犯困境 C C 囚犯 A DC
-10 0 -2 -2 -5 -5 0
囚犯 B DC
-10
●验证：{s*1=（C，C） 2=（C，C）}为 NE 战略；s* ●但 Pareto 改进（-2，-2）未能自发达到——外部性 ●个人理性与集体理性产生冲突
01-3-2 18
01-3-2
31
（贝叶斯纳什均衡）BNE
1．引例 t21 2 1 1 U D
01-3-2
t22 R 0 2 3 0 4 0 0 4
32
L
L 0
R 1 2 1
3 1 0
● 参与人 2 有两种类型：t21 与 t22，其战略为类型依存的， S2（t2）：从类型空间到战略空间的映照 ● 参与人 1 对参与人 2 的类型有先验概率 P 2）（1/2，（t ： 1/2） ● 验证： 1*，S2*）为 NE，其中 S1*=U；（S S2*（t2）=L，若 t2=t21；S2*（t2）=R，若 t2=t22 证明：给定 S2*，求参与人 1 的期望效用：若 S1=U，则п 1=1/2×3+1/2×2=5/2 若 S1=D，则п 1=1/2×0+1/2×2=2 所以，给定 S2*，S1*=U 为参与人 1 的最优战略
01-3-2
24
SPNE
1．引例：市场进入博弈 Entrant （E） Out I （Incumbent）（0，2） F （-3，-1）
01-3-2
A （2，1）
25
●2 个纯战略 NE： {Out；Fight If In}；{In；Accommodate If In} ●NE{Out；F If In}在均衡路径上最优；但在非均衡路径上（右枝）非最优：若 E 真的 In，I 的选择将是 A ●{Out；F If In}是不合理的；I 的威胁是不可臵信的（InCredible） ●那么，如何剔除基于不可臵信威胁的不合理的 NE？ ●Selten（1975）引进子博弈精练纳什均衡（SPNE）的概念
四、博弈的表示方式
1．矩阵博弈例：囚犯困境囚犯 B C
囚犯 C A -5 -5 0 -2 0 -2
DC
-10
DC -10
01-3-2
12
例：性别战（Battle of
●新婚夫妇： Opera Opera Sandy Football ●百年夫妻： Opera Opera Sandy Football
01-3-2 23
●另解（支付最大法）：一阶条件（FOC）： dVG/dθ=0；dVL/dγ=0 γ*=0．2；θ*=0．5 ●为什么 VG 对θ求偏导，却得到γ？ ●流浪汉的混合战略如何直观理解？（HarSanyi）— 设有 100 个流浪汉，则大约 20 个在寻找工作；另外的 80 个在游荡
例：囚犯两难（困境）矩阵博弈与博弈树的转换
（-5，-5） C B○ C A○ DC B○ DC （-2，-2） C （-10，0） DC （0，-10）
01-3-2
15
五、均衡（Equilibrium)
静态完全信息不完全信息
NE
动态
SPNE
BNE
PBNE
01-3-2
16
纳什均衡（ＮＥ）
1、定义： ●战略 S*=（s*1，s*2，…，s*n）为 NE 战略等价于对 k=1，2，…，n，有 s*k∈arg〃Max{Uk（s*k，s*-k）} ●也就是说，在均衡战略下，如果他人不改变战略，任意参与人不会单方面改变战略
01-3-2
○1 2○ r a l 0 -1 7 b ○3 r -2 2 28 0 -1 3○ 5 l r 6 3 5 1 4 2 4
① L （-1，5，6） a （5，4，4） L 1○ R
01-3-2
R ② b （0，-1，7）
（-1，5，6）
（5，4，4）
29
● SPNE（s1，s2，s3） 1={R}；s2：a If 1 Plays R；：s s3：=r，If 1 Plays L； =r，If L Plays R and 2 Plays a； =l，If L Plays Ｒａｎｄ2 Plays ｂ ● 均衡结果：（Ｒ；ａ；ｒ）
01-3-2
10
2、博弈规则（续）
●博弈：规定谁在什么时候行动；行动时知道了什么；有什么可供选择；得到多少 ●有限博弈：参与人有限；行动集合有限 ●博弈规则为共同知识的博弈称为完全信息博弈 ●所有参与人在行动时均知道其他参与人之前的行动的博弈称为完美信息博弈 ●完美→完全；不完全→不完美
01-3-2 11
01-3-2 2
应用阶段（续）
（3）市场营销 ●Sales Force Mgt. ● Channel Mgt. ● Pricing Startegy （4）产业组织理论 ● 市场竞争与 R&D 竞争 ● 市场进入与反进入 ● 广告方法选择
01-3-2
● 产业规制
3
二、合作博弈
● Cartel （OPEC） ● RJVs ● 合作讨价还价模型（Nash，1950）： Max{（X1-D1） 2-D2）} （X S．T． X1+X2≤1 其中， 1、 2 分别为 1 与 2 的初始禀赋， D D 成为威胁点（Threat Point），产权配臵改变 D1、D2。当 D1=D2，X1=X2=1/2
外部协调机制
●内部协调不能达到 Pareto 最优（如：Cartel 不能维持） ●由外部协调机制来解决，如黑社会：囚犯 B C C 囚犯 A
01-3-2
DC
-∞ -∞ -∞ -2 -10 -2
-∞ -10
DC
19
例 2：航空价格战中陆￥380 ￥380 8 法航￥490 4 NE：（8，8）例 3：性别战 ●新婚夫妇： 2 个 NE：（Opera，Opera）（Football，Football）；
01-3-2 33
反之，给定 S1*，S（t21）=L；S（t22）=R 分别是 t21 与 t22 类型的参与人 2 的最优战略 2．Static B．G 的定义： {I；{Si}；{ui（· ）}；Θ ；F（· ）} ●Si 为 i 的战略空间，si∈Si 为 i 的战略（类型依存的） ●Θ =Θ 1×Θ 2×…×Θ I，而θ i∈Θ i 为 i 的类型 ●Ui（si；s-I；θ i） ●F（θ ）=F（θ 1，θ 2，…，θ I）为联合分布函数；密度函数 P（θ 1，θ 2，…，θ I）与条件概率 Pi（θ -i/θ i）为共同知识（K．N）
01-3-2
Ｓｅｘｅｓ）
Paul Football
1 0 0 1 0 2
2 0
Paul Football
0 1 0 1 2 0
2 0
13
２、博弈树
例：欧盟航空公司空中争夺战中陆￥380 法航 380 490 380 ￥490 法航 490
（8，8）（13，4）（4，13）（10，10）
01-3-2 14
第六讲博弈论基础
一．博弈论的发展阶段
1．传统阶段： ●Theory of Oligopoly: Cournot(1838) Betrand(1883) ●Theory of Bargaining: Edgeworth(1887) Hicks(1932) 2．现代阶段： ●Von Neumann & Morgenstern (1944)
01-3-2 34
3．BNE： {Si*（· iI=1 满足：对任意的θ i∈Θ i，有：）} Si*（θ i）∈ arg．Maxsi（θ i）{∑ui（si，s-i；θ i）P（θ -i/θ i）} i=1，2，…，I
01-3-2
35
例 1：Duopoly Cournot Ｍｏｄｅｌ反需求函数：Ｐｉ＝ａ－ｑｉ－ｑｊ，ｉ、ｊ＝１，２利润函数：п
01-3-2
则，VG（σG，σL）=θVG（1，γ）+（1-θ）VG（0，γ）
=-γ（2θ-1）+3θ
22
●由 VG（σG，σL）=θ[5γ-1]-γ 得到政府的反应对应： θ=0，当γ＜0．2；θ∈[0，1]，当γ=0．2；θ=1，当 γ＞0．2 ●由 VL（σG，σ L）=-γ[2θ-1]+3θ 得到流浪汉的反应对应：γ=1，当θ＜0．5；γ∈[0，1]，当θ=0．5；γ =0，当θ＞0．5 ● NE：（σ*G，σL*） σ*G=（0．5，0．5） σL*=（0．2，0．8）

e商务文档

《博弈论基础》

相关文档推荐：