当前位置：文档之家› 第4章不完全信息动态博弈

第4章不完全信息动态博弈

精炼贝叶斯均衡
运用子博弈精炼均衡概念的逻辑，将从每一个信息集开始的博弈的剩余部分称为一个“后续博弈”(不同于子博弈，因为子博弈必须开始于单结信息集，并且不能切割信息集)，一个“合理”的均衡要求，给定每一个参与人有关其他参与人类型的后验信念，参与人的战略组合在每一个后续博弈上构成贝叶斯均衡。假定参与人(在所有可能的情况下)根据贝叶斯法则修正先验信念，并且，每个参与人都假定其他参与人选择的是均衡战略。
战略空间与支付函数
如果在位者是高成本，两个企业的成本函数相同，对称库诺特均衡产量下的价格为p=5，每个企业的利润是3，扣除进入成本2，进入者的净利润是1；如果在位者是低成本，两个企业的成本函数不同，非对称库诺特均衡产量下的价格是p=4，在位者的利润是5，进入者的利润是1，扣除进入成本2，进入者的净利润是-1。
精炼贝叶斯均衡
精炼贝叶斯均衡是均衡战略和均衡信念的结合，给定信念 p = ( p1 ， … ， pn ) ，战略组合
s*=(s*1, …, s*n)是最优的；给定战略s*=(s*1, …, ) s*=(s* s*n)，信念p=(p1，…，pn)是使用贝叶斯法则从均衡战略和所观测到的行动得到的பைடு நூலகம் 在精炼贝叶斯均衡中，后验概率依赖于均衡战略，均衡战略依赖于后验概率，如果我们不知道先行动者如何选择，我们就不可能知道后行动者应该如何选择，必须使用前向法进行贝叶斯修正。
不完全信息动态博弈 -市场进入阻挠
一个单阶段非最优价格会减少现期利润，但如果它能阻止进入者进入，从而使在位者在第2 阶段得到垄断利润，而不是库诺特均衡利润，如果垄断利润与库诺特均衡利润之间的差距足够大，如果在位者有足够的耐心，选择一个单阶段非最优价格可能是最优的。在均衡情况下，在位者的价格选择不仅与其成本函数有关，而且与进入者的后验概率有关；不论先验概率µ为多少，单阶段最优垄断价格不构成一个均衡。
精炼贝叶斯均衡
pi(θ-i|ah-i)是在观测到ah-i的情况下参与人i 认为其他n-1个参与人属于类型θ-i的后验概率，pi 是所有后验概率的集合(即pi 包括了参与人i在每一个信息集h上的后验概率)； ui(si, s-i, θi)是i的效用函数。那么，精炼贝叶斯均衡可以定义如下:
精炼贝叶斯均衡
贝叶斯法则
我们用Prob(θk|ah)代表这个后验概率，即给定 ah的情况下，i属于类型θk的概率。根据条件概率或乘积概率公式， Prob(θk,ah)≡ p(ah|θk)p(θk) ≡ Prob(θk|ah)Prob(ah) 也就是说，i属于θk并选择ah的联合概率，等于 i属于θk的先验概率乘以θk类型的参与人选择ah 的概率，或等于i选择ah的总概率乘以给定ah情况下i属于θk的后验概率。
精炼贝叶斯纳什均衡
先行动者预测到自己的行动将被后行动者所利用，就会设法选择传递对自己最有利的信息，避免传递对自己不利的信息。因此，博弈过程不仅是参与人选择行动的过程，而且是参与人不断修正信念的过程。精炼贝叶斯均衡要求，给定有关其他参与人类型的信念，参与人的战略在每一个信息集开始的“后续博弈”上构成贝叶斯均衡；并且，在所有可能的情况下，参与人使用贝叶斯法则修正有关其他参与人类型的信念。
不完全信息动态博弈
在完全信息动态博弈情况下，如果在位者是高成本，进入者在第2阶段选择进入，如果在位者是低成本，进入者选择不进入；在位者第1 阶段选择单阶段最优垄断价格。在不完全信息动态博弈情况下，在博弈进入第在不完全信息动态博弈情况下 2阶段后，企业的行动选择是一个简单的静态博弈问题，进入者在第2阶段是否进入依赖于它对在位者成本函数的判断，当且仅当进入者认为在位者是高成本的概率大于1/2时，进入者才会选择进入。
贝叶斯法则
假定i属于类型θk 的先验概率是p(θk)≥0，并且 ΣKp(θk)=1；给定i属于θk，i选择ah的条件概率为p(ah|θ k)，并且Σ Hp(ah|θ k)=1。那么，i选择 ah的边缘概率(全概率)是 Prob(ah)= ΣKp(ah|θk)p(θk) 即参与人i选择行动ah的总概率是每一种类型的 i选择ah的条件概率p(ah|θk)的加权平均，权数是他属于每种类型的先验概率p(θk)。现在的问题是：假如我们观测到i选择了ah，i 属于类型θk的后验概率是多少？
精炼贝叶斯均衡是一个战略组合， s*( θ )= (s*1(θ 1 )，…，s*n(θ n))和一个后验概率组合 p=(p1，…，pn)，满足: (P) 对于所有的参与人i,在每一个信息集h， s*i(θi)∈ argmax Σ pi(θ-i|ah-i)ui(si, s*-i, θi) θ-i si (B) pi(θ -i|ah-i )是使用贝叶斯法则从先验概率 pi(θ-i|θi)、观测到的ah-i和最优战略s*-i(·)得到的 (在可能的情况下)。
战略空间与支付函数
假定进入者只有一个类型：进入成本为2，如果进入的话，生产成本函数与高成本的在位者的成本函数相同。在t=1，在进入者决定是否进入之前，在位者要决定该时期的价格(或生产量)，假定只有三种可能的价格选择p=4,p=5或p=6。如果在位者是高成本，对应三种价格选择的利润分别是：2,6或7；如果在位者是低成本，对应的利润分别是：6,9或8。
t=1 (2,0) t=2 (3,1)
(2,0) (6,0) (7,0) (3,1)
(6,0) (7,0) (7,0) (6,0) (6,0) (9,0) (9,0) (8,0) (8,0) (7,0) (3,1) (7,0) (5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
不完全信息动态博弈 -市场进入阻挠
预测到选择p=6会招致进入者进入，即使高成本的在位者也可能不会选择p=6，尽管p=6是单阶段的最优垄断价格。问题的核心是，在位者必须考虑价格选择的信息效应，不同的价格影响进入者的后验概率，从而影响进入者的进入决策。在静态贝叶斯均衡中，参与人的信念是事前给定的，贝叶斯均衡概念没有规定参与人如何修正自己的信念，不能用来分析不完全信息动态博弈的均衡及结果。
精炼贝叶斯均衡
(B)对应的是贝叶斯法则的运用。如果参与人是多次行动的，修正概率涉及贝叶斯法则的重复运用。因为战略是一个行动规则，它本身是不可观测的，参与人i只能根据观测到的行动组合a-i修正概率，但他假定所观测到的行动是最优战略s*-i规定的行动。限制条件“在可能的情况下”来自这样的事实，如果a-i 不是均衡战略下的行动，观测到的a-i 是一个零概率事件，此时，贝叶斯法则对后验概率没有定义，任何的后验概率 pi( θ -i|ai )∈[0,1]都是允许的，只要它与均衡战略相容。
战略空间与支付函数
高成本在位者的单阶段最优垄断价格是P=6，低成本时的单阶段最优垄断价格是P=5(最优垄断价格总是边际成本的增函数)。在t=2时期，如果进入者不进入，在位者仍然是一个垄断者，不同价格选择下的利润水平与第一阶段相同。在t=2，如果进入者已经进入，在位者的成本函数变成共同知识；
市场进入阻挠动态博弈
假定有两个时期，t = 1，2。在t=1时期，市场上有一个垄断企业(在位者)，一个潜在的进入者考虑是否进入；如果进入者进入，在t=2时期，两个企业进行库诺特搏弈，否则，在位者仍然是一个垄断者。假定在位者有两个可能的类型，高成本或低成本，进入者在博弈开始时只知道在位者是高成本的概率是µ，低成本的概率是l-µ，这个概率分布称为进入者的先验信念。
贝叶斯法则
因此，Prob(θk|ah)≡ p(ah|θk)p(θk)/Prob(ah) ≡ p(ah|θk)p(θk)/ ΣKp(ah|θk)p(θk) 这就是贝叶斯法则贝叶斯法则。精炼贝叶斯均衡假定参与人是根贝叶斯法则据贝叶斯法则修正先验概率的。贝叶斯法则要求Prob(ah)>0即参与人i必须以正的概率选择ah，否则，后验概率没有定义。如果Prob(ah)=0，我们允许Prob(θk|ah)在[0,1]区间取任何值，只要所取的值与均衡战略相容，即均衡仍然成立。在动态博弈中，Prob(ah)=0对应的是非均衡路径上的信息集。
4.14.1-2 贝叶斯法则
在日常生话中，在任何一个时点上，我们对某种不确定性事件发生的可能性有一个判断。然后，我们会根据新的信息来修正这个判断。统计学上，修正之前的判断称为“先验概率” ，修正之后的判断称为“后验概率"。贝叶斯法则正是人们根据新的信息从先验概率得到后验概率的唯一合理方法。在不完全信息博弈中，我们假定参与人的类型是独立分布的，参与人i有K个可能的类型，有 H个可能的行动。用θk和ah分别表示一个参与人的一种特定的类型和一个特定的行动。
精炼贝叶斯均衡
精炼贝叶斯均衡是贝叶斯均衡、子博弈精炼均衡和贝叶斯推断的结合。它要求: (1)在每一个信息集上，决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念)； (2)给定该信息集上的概率分布和其他参与人的后续战略，参与人的行动必须是最优的； (3)每一个参与人根据贝叶斯法则和均衡战略修正先验概率。
博弈论
第4章不完全信息动态博弈精炼贝叶斯均衡
内容提要
精炼贝叶斯纳什均衡精炼贝叶斯均衡的再精炼序贯均衡与颤抖手均衡适度均衡与稳定均衡不完全信息重复博弈与声誉模型
4.1 精炼贝叶斯纳什均衡
不完全信息动态博弈
在不完全信息动态博弈中，“自然”首先选择参与人的类型，参与人自已知道，其他参与人不知道；在自然选择之后，参与人开始行动，在自然选择之后，参与人开始行动，参与人的行动有先有后，后行动者能观测到先行动者的行动有先有后，行动，但不能观测到先行动者的类型；行动，但不能观测到先行动者的类型；但是，因为参与人的行动是类型依存类型依存的，每个类型依存参与人的行动都传递着有关自己类型的某种信息，后行动者可以通过观察先行动者所选择的行动来推断其类型或修正对其类型的先验信念概率分布，然后选择自己的最优行动。

e商务文档

第4章不完全信息动态博弈

相关文档推荐：

e商务文档

第4章 不完全信息动态博弈

相关文档推荐：

第4章不完全信息动态博弈