当前位置:文档之家› 第五章博弈论初步

第五章博弈论初步


Stackelberg寡头竞争模型
• 逆向归纳法求解
– 然后倒推到企业1,企业1是理性的,预测到企业2 将根据一阶条件选择产量,则企业1面临的问题为
max 1 ( q1 , s2 ( q1 )) q1 ( a q1 s( q1 ) c )
q1 0
由一阶条件可得
q1* 1 (a c) 2
Stackelberg寡头竞争模型
• 分析(逆向归纳法求解)
价格函数:P(Q ) a q1 q2 其中,q1 [0, ),为企业 的产量, 1 q2 [0, ),为企业2的产量
支付(利润)函数为
i qi ( P(Q) c), i 1,2
Stackelberg寡头竞争模型
5.1博弈论概述——博弈论例子
• 囚徒困境
囚徒乙
坦白 抵赖 0,-10 -1,-1
囚徒甲
坦白 -8,-8 抵赖 -10,0
囚徒困境反应了一个很深刻的问题,那就是个人理性 集体理性的矛盾,它在经济学上有广泛的应用
5.1博弈论概述——博弈论例子
• 性别战
丈夫 芭蕾 妻子 芭蕾 2,1 足球 0,0 足球 0,0 1,2
• 先动优势
1 * 纳什均衡q1* q2 ( a c ); 纳什均衡利润 3 1 * * 1 ( q1* , q2 ) 2 ( q1* , q2 ) ( a c ) 2 9
5.5不完全信息静态博弈
• 表达式: G={ A1,A2,…, An ; T1,T2,…, Tn ; P1, P2,…, Pn ; U1(· U2(· …, Un(· } ), ), ), • 贝叶斯纳什均衡定义:
• 3.对k=1
L (2,0)
R (1,1)
• 参与者1,选L • 由此得出精炼的NE为((L,L’’),L’)
子博弈精炼纳什均衡例题
A 不仿 仿
(0,10) 打
(-2,5)
B
不打 A 不仿 打 仿 B 不打 (10,4)
(5,5)
(2,2)
子博弈精炼纳什均衡例题
A 不仿 仿 子博弈精炼纳什均衡解为: ((不仿,仿),(打,不打)) 不打 A 不仿 打 仿 B 不打 (10,4)
• 博弈的分类
行为顺序 信息 完全信息 不完全信息 静态 完全信息静态博弈 纳什均衡 不完全信息静态博弈 贝叶斯纳什均衡 动态 完全信息动态博弈 子博弈精炼纳什均衡 不完全信息动态博弈 精炼贝叶斯纳什均衡
5.2完全信息静态博弈
• 纳什均衡的定义:
在一个n个参与者标准博弈G={ S1,S2,…, Sn ; U1(· U2(· …, Un(· }中,如果战 ), ), ), 略组合(S1*,S2*,…, Sn* )满足: 对每个参与者i, Si*是它针对其他参与者 所选的战略S-i*的最优反应战略。 即Ui(si * ,s-i * )≥ Ui(si ,s-i * )
社会福利博弈

政府
救济 w
流浪汉
找工作 r 游荡 1-r
3,2 不救济1-w -1,1
-1,3 0,0
政府以w的概率选择救济,以1-w的概率选择不救济; 流浪汉以r的概率选择找工作,以1-r的概率选择游荡。
政府的期望收益为:[3r+(-1)(1-r)w+0(1-r)](1-w) 政府的最优战略为: 1 r>0.2 w= 0 r<0.2 0到1上的任何值 r=0.2 流浪汉的期望收益:[2w+(1-w)]r+[3w+0(1-w)](1-r) 流浪汉的最优战略为: 1 w<0.5 r= 0 w>0.5 0到1上的任何值 w=0.5
π2 (q1 * ,q2 * ) ≥ π2 (q1 * ,q2 )
q2 =(a-c)/3
5.3混合策略
• 混合策略的定义:在n个人参与的博弈G={ S1, S2,…, Sn ; U1(· U2(· …, Un(· }中,博弈 ), ), ), 方i的纯策略空间记为Si={si1,si2 , …, sin },则博弈 方i的纯策略概率分布Pi ={pi1,pi2 , …, pin },称为 一个混合策略。 • 混合策略组合及其期望支付: 用( p1,p2 , …, pn )表示混合策略组合; 用σi ( p1,p2 , …, pn )表示参与者I的期望支付 值; σi ( p1,p2 , …, pn ) = p(s)ui (s)
• 逆向归纳法求解
– 从企业2开始分析,假定企业1已经选择了 产量q1,则企业2选择时要以最大化自己的 例如为目标,即,面临如下问题:
max 2 ( q1 , q2 ) q2 ( a q1 q2 c )
q2 0
由一阶条件可得
s2 ( q1 ) 1 ( a q1 c ) 2
5.2完全信息静态博弈——古诺模型
古诺寡头竞争模型是纳什均衡最早 的版本,它是法国经济学家古诺1838年 提出的。这一模型的基本结构是各企业 生产同一产品,并都以产量为决策变量。 假定所有厂商都是同时行动的,即他在 选择自己的产量时并不知道其他厂商的 选择。市场需求为P=a-Q
古诺模型
• 参与者:{企业1,企业2} • 策略集:A1:{q1|q1≥0} A2:{q2|q2≥0} • 支付函数:利润 π1 (q1 ,q2)= q1 [a-( q1 +q2 )]-c q1 π2 (q1 ,q2)= q2 [a-( q1 +q2 )]-c q2 • 求解: 满足如下一阶条件 π1 (q1 * ,q2 * ) ≥ π1 (q1 ,q2 * ) q1 =(a-c)/3
5.4完全信息动态博弈
• 定义:参与人行动有先后顺序,且后行方在自 己行动之前能观察到先行方的行动。 • 博弈的扩展式 1.参与者集合 2.参与者行动的顺序 3.参与者行动集 4.参与者的信息集 5.参与者的支付函数
5.4完全信息动态博弈
• 博弈树
节点 行动枝
信息集
(,)
(,) (,)
(,)
子博弈、子博弈精炼的纳什均 衡
2 R’ 1 L’’ (3,0) R’’ (0,2)
(1,1)
反向递推算法的应用实例
• 解:用反向递推法 • 1.对k=3
L’’ (3,0) R’’ (0,2)
• 参与者1,选L’’
反向递推算法的应用实例
• 2.对k=2
L’ (1,1)
R’ (3,0)
• 参与者2,选L’
反向递推算法的应用实例
Stackelberg寡头竞争模型
• 描述的问题
– 垄断企业产量选择 – 参与人:企业1和企业2 – 行动顺序:企业1先行动,称为领头企业;企业2观 测到企业1的选择,然后选择自己的产量,称为尾 随企业 – 企业2的产量是企业1产量的函数 – 价格是总产量的函数 – 两个企业有相同的不变单位成本c
a i Ai , t i Ti
5.5不完全信息静态博弈——市场 进入实例
一个行业有两个相关企业,一个是垄断者(局中人1),一 个是潜在进入者,两者的决策局面如下:
局中 人1
进入 0,-1
不进入 2,0
3,0
局中 人2
决策论与对策论的联系与区别
• 单人与多人,多人中无相互影响的不是 对策 • 集中与分散的决策模式,如计划经济就 是集中的决策模式
博弈的构成要素:
1、参与人:做决策的个体 2、行动:所能做的某一选择,是参与人的决策 变量 3、信息:参与人的特征,特别是有关其他参与 人的特征和行动的知识 4、策略:参与人选择行动的规则 5、支付:参与人从博弈中获得的效用水平,是 行动的函数 6、结果:博弈分析者感兴趣的要素的集合 7、均衡:所有参与人的最优战略或行动的组合
5.3混合策略——求解方法
• 最优反应函数法
• 等支付方法
5.3混合策略——应用实例
• 求解参与者甲与乙的混合策略纳什均衡 解
乙 C 甲 A B 2,3 3,1 D 5,2 1,5
5.3混合策略——应用实例
• 参与者甲的混合策略记为(a,1-a) • 参与者乙的混合策略记为(b,1-b) • 对甲来说,取纯策略A的期望支付为:2b+5(1-b);取纯策 略B的期望支付为:3b+(1-b) 等支付原则表示为:2b+5(1-b)=3b+(1-b) 可以解得:b=0.8 • 对乙来说,取纯策略C的期望支付为:3a+(1-a);取纯策 略D的期望支付为:2a+5(1-a) 等支付原则表示为:3a+(1-a)=2a+5(1-a) 可以解得:a=0.8 因此,这个博弈的混合策略纳什均衡是:甲的混合策略 为(0.8,0.2),乙的混合策略为(0.8,0.2)
• 纳什均衡解意义:
它是博弈结果的一致预测,这种结果具有内 在的稳定性和可自动实施性。
求解纳什均衡——划线法
• 例:两人有限策略的博弈 参与人:{甲,乙} 参与人的策略集:S甲={U,N,D} S乙={L,C,R}
乙 L U 甲 L M C R0,44ຫໍສະໝຸດ 05,34,0 3,5
0,4 3,5
5,3 6,6 *
在静态贝叶斯博弈G={ A1,A2,…, An ; T1, T2,…, Tn ; P1,P2,…, Pn ; U1(· U2(· …, ), ), Un(· }中,战略组合(S1*,S2*,…, Sn* )是一 ), 个纯战略贝叶斯纳什均衡解,如果对每一个参与者i及 i的类型集Ti中的每一个类型tt,它满足:| ti ) MAX Ui (ai , a -i ( i -i )) P( t -i
• 子博弈定义: 一个扩展式博弈的子博弈G是由一个决策结 (X)和所有的该决策结的后续决策结(T (X))组成,它满足如下条件: 1. x是单结的信息集。 2. 后续结点的所有信息集上的结点都属于后续 结集合。 • 子博弈精炼的纳什均衡的求法:反向递推算法
相关主题