《博弈论基础》
01-3-2
30
求解的一般过程 ● Maxa2∈A2{U2(a1,a2)}→反应函数 a2=R2(a1) ● Maxa1∈A1{U1(a1,a2(a1) )}→反应函数 a*1 ● 得到:SPNE (a1;R2(a1); ) 均衡结果(Outcome)(a*1;R2(a*1) : ) 例:Stackelberg(1934) :Leader-Follower Model
01-3-2
流浪汉 游荡
1
0
0
21
●纯战略 NE 不存在 ●求混合战略 NE: 设政府的混合战略 σG=(θ,1-θ) 设流浪汉的混合战略 σL=(γ,1-γ) =θ[3γ+(-1) (1-γ)]+(1-θ)[-γ+0(1-γ)] =θ(5γ-1)-γ VL(σG,σL)=γVL(θ,1)+(1-γ)VL(θ,0) =γ[2θ+(1-θ)]+(1-γ)[3θ+0(1-θ)]
01-3-2
¥490
13 10 4 10
8 13
●百年夫妻:纯战略 NE 不存在
20
3、NE 战略存在性定理(Nash,1950) :
每个有限博弈至少存在一个 NE(纯战略或混合战略) ●混合战略(Mixed Strategy) :关于纯战略集的概率向量 σk=(σk,1,σk,2,…,σk,nk) ●例:社会福利博弈 寻找工作 救济 政府 不救济
01-3-2
17
2、NE的求解
例 1:囚犯困境 C C 囚犯 A DC
-10 0 -2 -2 -5 -5 0
囚犯 B DC
-10
●验证:{s*1=(C,C) 2=(C,C)}为 NE 战略 ;s* ●但 Pareto 改进(-2,-2)未能自发达到——外部性 ●个人理性与集体理性产生冲突
01-3-2 18
01-3-2
31
(贝叶斯纳什均衡)BNE
1.引例 t21 2 1 1 U D
01-3-2
t22 R 0 2 3 0 4 0 0 4
32
L
L 0
R 1 2 1
3 1 0
● 参与人 2 有两种类型:t21 与 t22,其战略为类型依存的, S2(t2) :从类型空间到战略空间的映照 ● 参与人 1 对参与人 2 的类型有先验概率 P 2)(1/2, (t : 1/2) ● 验证: 1*,S2*)为 NE,其中 S1*=U; (S S2*(t2)=L,若 t2=t21;S2*(t2)=R,若 t2=t22 证明:给定 S2*,求参与人 1 的期望效用: 若 S1=U,则п 1=1/2×3+1/2×2=5/2 若 S1=D,则п 1=1/2×0+1/2×2=2 所以,给定 S2*,S1*=U 为参与人 1 的最优战略
01-3-2
24
SPNE
1.引例:市场进入博弈 Entrant (E) Out I (Incumbent) (0,2) F (-3,-1)
01-3-2
A (2,1)
25
●2 个纯战略 NE: {Out;Fight If In};{In;Accommodate If In} ●NE{Out;F If In}在均衡路径上最优;但在非均衡路径上 (右枝)非最优:若 E 真的 In,I 的选择将是 A ●{Out;F If In}是不合理的;I 的威胁是不可臵信的(InCredible) ●那么,如何剔除基于不可臵信威胁的不合理的 NE? ●Selten(1975)引进 子博弈精练纳什均衡(SPNE)的概 念
四、博弈的表示方式
1.矩阵博弈 例:囚犯困境 囚犯 B C
囚 犯 C A -5 -5 0 -2 0 -2
DC
-10
DC -10
01-3-2
12
例:性别战(Battle of
●新婚夫妇: Opera Opera Sandy Football ●百年夫妻: Opera Opera Sandy Football
01-3-2 23
●另解(支付最大法) : 一阶条件(FOC) : dVG/dθ=0;dVL/dγ=0 γ*=0.2;θ*=0.5 ●为什么 VG 对θ求偏导,却得到γ? ●流浪汉的混合战略如何直观理解?(HarSanyi)— 设有 100 个流浪汉,则大约 20 个在寻找工作;另 外的 80 个在游荡
例:囚犯两难(困境)矩阵博弈与博弈树的转换
(-5,-5) C B○ C A○ DC B○ DC (-2,-2) C (-10,0) DC (0,-10)
01-3-2
15
五、均衡(Equilibrium)
静态 完全信息 不完全信息
NE
动态
SPNE
BNE
PBNE
01-3-2
16
纳什均衡(NE)
1、定义: ●战略 S*=(s*1,s*2,…,s*n)为 NE 战略等价 于 对 k=1,2,…,n,有 s*k∈arg〃Max{Uk(s*k,s*-k)} ●也就是说, 在均衡战略下, 如果他人不改变战略, 任意参与人不会单方面改变战略
01-3-2
○1 2○ r a l 0 -1 7 b ○3 r -2 2 28 0 -1 3○ 5 l r 6 3 5 1 4 2 4
① L (-1,5,6) a (5,4,4) L 1○ R
01-3-2
R ② b (0,-1,7)
(-1,5,6)
(5,4,4)
29
● SPNE(s1,s2,s3) 1={R};s2:a If 1 Plays R; :s s3:=r,If 1 Plays L; =r,If L Plays R and 2 Plays a; =l,If L Plays R and2 Plays b ● 均衡结果: (R;a;r)
01-3-2
10
2、博弈规则(续)
●博弈:规定谁在什么时候行动;行动时知道了什么; 有什么可供选择;得到多少 ●有限博弈:参与人有限;行动集合有限 ●博弈规则为共同知识的博弈称为完全信息博弈 ●所有参与人在行动时均知道其他参与人之前的行动 的博弈称为完美信息博弈 ●完美→完全;不完全→不完美
01-3-2 11
01-3-2 2
应用阶段(续)
(3)市场营销 ●Sales Force Mgt. ● Channel Mgt. ● Pricing Startegy (4)产业组织理论 ● 市场竞争与 R&D 竞争 ● 市场进入与反进入 ● 广告方法选择
01-3-2
● 产业规制
3
二、合作博弈
● Cartel (OPEC) ● RJVs ● 合作讨价还价模型(Nash,1950) : Max{(X1-D1) 2-D2)} (X S.T. X1+X2≤1 其中, 1、 2 分别为 1 与 2 的初始禀赋, D D 成为威胁点 (Threat Point) ,产权配臵改变 D1、D2。 当 D1=D2,X1=X2=1/2
外部协调机制
●内部协调不能达到 Pareto 最优(如:Cartel 不能维 持) ●由外部协调机制来解决,如黑社会: 囚犯 B C C 囚犯 A
01-3-2
DC
-∞ -∞ -∞ -2 -10 -2
-∞ -10
DC
19
例 2:航空价格战 中 陆 ¥380 ¥380 8 法航 ¥490 4 NE: (8,8) 例 3:性别战 ●新婚夫妇: 2 个 NE: (Opera,Opera)(Football,Football) ;
01-3-2 33
反之,给定 S1*,S(t21)=L;S(t22)=R 分别是 t21 与 t22 类 型的参与人 2 的最优战略 2.Static B.G 的定义: {I;{Si};{ui(· )};Θ ;F(· )} ●Si 为 i 的战略空间,si∈Si 为 i 的战略(类型依存的) ●Θ =Θ 1×Θ 2×…×Θ I,而θ i∈Θ i 为 i 的类型 ●Ui(si;s-I;θ i) ●F(θ )=F(θ 1,θ 2,…,θ I)为联合分布函数;密度 函数 P(θ 1,θ 2,…,θ I)与条件概率 Pi(θ -i/θ i)为 共同知识(K.N)
01-3-2
Sexes)
Paul Football
1 0 0 1 0 2
2 0
Paul Football
0 1 0 1 2 0
2 0
13
2、博弈树
例:欧盟航空公司空中争夺战 中陆 ¥380 法航 380 490 380 ¥490 法航 490
(8,8) (13,4) (4,13) (10,10)
01-3-2 14
第六讲 博弈论基础
一.博弈论的发展阶段
1.传统阶段: ●Theory of Oligopoly: Cournot(1838) Betrand(1883) ●Theory of Bargaining: Edgeworth(1887) Hicks(1932) 2.现代阶段: ●Von Neumann & Morgenstern (1944)
01-3-2 34
3.BNE: {Si*(· iI=1 满足:对任意的θ i∈Θ i,有: )} Si*(θ i)∈ arg.Maxsi(θ i){∑ui(si,s-i;θ i)P(θ -i/θ i)} i=1,2,…,I
01-3-2
35
例 1:Duopoly Cournot Model 反需求函数:Pi=a-qi-qj,i、j=1,2 利润函数:п
01-3-2
则,VG(σG,σL)=θVG(1,γ)+(1-θ)VG(0,γ)
=-γ(2θ-1)+3θ
22
●由 VG(σG,σL)=θ[5γ-1]-γ 得到政府的反应对应: θ=0,当γ<0.2;θ∈[0,1],当γ=0.2;θ=1,当 γ>0.2 ●由 VL(σG,σ L)=-γ[2θ-1]+3θ 得到流浪汉的反应 对应:γ=1,当θ<0.5;γ∈[0,1],当θ=0.5;γ =0,当θ>0.5 ● NE: (σ*G,σL*) σ*G=(0.5,0.5) σL*=(0.2,0.8)