当前位置:文档之家› 第4章 不完全信息动态博弈

第4章 不完全信息动态博弈


精炼贝叶斯均衡
运用子博弈精炼均衡概念的逻辑,将从每一个 信息集开始的博弈的剩余部分称为一个“后续 博弈”(不同于子博弈,因为子博弈必须开始 于单结信息集,并且不能切割信息集), 一个“合理”的均衡要求,给定每一个参与人 有关其他参与人类型的后验信念,参与人的战 略组合在每一个后续博弈上构成贝叶斯均衡。 假定参与人(在所有可能的情况下)根据贝叶斯 法则修正先验信念,并且,每个参与人都假定 其他参与人选择的是均衡战略。
战略空间与支付函数
如果在位者是高成本,两个企业的成本函数相 同,对称库诺特均衡产量下的价格为p=5,每 个企业的利润是3,扣除进入成本2,进入者的 净利润是1; 如果在位者是低成本,两个企业的成本函数不 同,非对称库诺特均衡产量下的价格是p=4, 在位者的利润是5,进入者的利润是1,扣除进 入成本2,进入者的净利润是-1。
精炼贝叶斯均衡
精炼贝叶斯均衡是均衡战略和均衡信念的结 合 , 给 定 信 念 p = ( p1 , … , pn ) , 战 略 组 合
s*=(s*1, …, s*n)是最优的;给定战略s*=(s*1, …, ) s*=(s* s*n),信念p=(p1,…,pn)是使用贝叶斯法则从 均衡战略和所观测到的行动得到的பைடு நூலகம் 在精炼贝叶斯均衡中,后验概率依赖于均衡战 略,均衡战略依赖于后验概率,如果我们不知 道先行动者如何选择,我们就不可能知道后行 动者应该如何选择,必须使用前向法进行贝叶 斯修正。
不完全信息动态博弈 -市场进入阻挠
一个单阶段非最优价格会减少现期利润,但如 果它能阻止进入者进入,从而使在位者在第2 阶段得到垄断利润,而不是库诺特均衡利润, 如果垄断利润与库诺特均衡利润之间的差距足 够大,如果在位者有足够的耐心,选择一个单 阶段非最优价格可能是最优的。 在均衡情况下,在位者的价格选择不仅与其成 本函数有关,而且与进入者的后验概率有关; 不论先验概率µ为多少,单阶段最优垄断价格 不构成一个均衡。
精炼贝叶斯均衡
pi(θ-i|ah-i)是在观测到ah-i的情况下参与人i 认为其他n-1个参与人属于类型θ-i的后验 概率,pi 是所有后验概率的集合(即pi 包 括了参与人i在每一个信息集h上的后验概 率); ui(si, s-i, θi)是i的效用函数。 那么,精炼贝叶斯均衡可以定义如下:
精炼贝叶斯均衡
贝叶斯法则
我们用Prob(θk|ah)代表这个后验概率,即给定 ah的情况下,i属于类型θk的概率。根据条件概 率或乘积概率公式, Prob(θk,ah)≡ p(ah|θk)p(θk) ≡ Prob(θk|ah)Prob(ah) 也就是说,i属于θk并选择ah的联合概率,等于 i属于θk的先验概率乘以θk类型的参与人选择ah 的概率,或等于i选择ah的总概率乘以给定ah情 况下i属于θk的后验概率。
精炼贝叶斯纳什均衡
先行动者预测到自己的行动将被后行动者所利 用,就会设法选择传递对自己最有利的信息, 避免传递对自己不利的信息。因此,博弈过程 不仅是参与人选择行动的过程,而且是参与人 不断修正信念的过程。 精炼贝叶斯均衡要求,给定有关其他参与人类 型的信念,参与人的战略在每一个信息集开始 的“后续博弈”上构成贝叶斯均衡;并且,在 所有可能的情况下,参与人使用贝叶斯法则修 正有关其他参与人类型的信念。
不完全信息动态博弈
在完全信息动态博弈情况下,如果在位者是高 成本,进入者在第2阶段选择进入,如果在位 者是低成本,进入者选择不进入;在位者第1 阶段选择单阶段最优垄断价格。 在不完全信息动态博弈情况下,在博弈进入第 在不完全信息动态博弈情况下 2阶段后,企业的行动选择是一个简单的静态 博弈问题,进入者在第2阶段是否进入依赖于 它对在位者成本函数的判断,当且仅当进入者 认为在位者是高成本的概率大于1/2时,进入 者才会选择进入。
贝叶斯法则
假定i属于类型θk 的先验概率是p(θk)≥0,并且 ΣKp(θk)=1;给定i属于θk,i选择ah的条件概率 为p(ah|θ k),并且Σ Hp(ah|θ k)=1。那么,i选择 ah的边缘概率(全概率)是 Prob(ah)= ΣKp(ah|θk)p(θk) 即参与人i选择行动ah的总概率是每一种类型的 i选择ah的条件概率p(ah|θk)的加权平均,权数 是他属于每种类型的先验概率p(θk)。 现在的问题是:假如我们观测到i选择了ah,i 属于类型θk的后验概率是多少?
精 炼 贝 叶 斯 均 衡 是 一 个 战 略 组 合 , s*( θ )= (s*1(θ 1 ),…,s*n(θ n))和一个后验概率组合 p=(p1,…,pn),满足: (P) 对于所有的参与人i,在每一个信息集h, s*i(θi)∈ argmax Σ pi(θ-i|ah-i)ui(si, s*-i, θi) θ-i si (B) pi(θ -i|ah-i )是使用贝叶斯法则从先验概率 pi(θ-i|θi)、观测到的ah-i和最优战略s*-i(·)得到的 (在可能的情况下)。
战略空间与支付函数
假定进入者只有一个类型:进入成本为2,如 果进入的话,生产成本函数与高成本的在位者 的成本函数相同。 在t=1,在进入者决定是否进入之前,在位者 要决定该时期的价格(或生产量),假定只有三 种可能的价格选择p=4,p=5或p=6。 如果在位者是高成本,对应三种价格选择的利 润分别是:2,6或7;如果在位者是低成本,对 应的利润分别是:6,9或8。
t=1 (2,0) t=2 (3,1)
(2,0) (6,0) (7,0) (3,1)
(6,0) (7,0) (7,0) (6,0) (6,0) (9,0) (9,0) (8,0) (8,0) (7,0) (3,1) (7,0) (5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
不完全信息动态博弈 -市场进入阻挠
预测到选择p=6会招致进入者进入,即使高成 本的在位者也可能不会选择p=6,尽管p=6是单 阶段的最优垄断价格。 问题的核心是,在位者必须考虑价格选择的信 息效应,不同的价格影响进入者的后验概率, 从而影响进入者的进入决策。 在静态贝叶斯均衡中,参与人的信念是事前给 定的,贝叶斯均衡概念没有规定参与人如何修 正自己的信念,不能用来分析不完全信息动态 博弈的均衡及结果。
精炼贝叶斯均衡
(B)对应的是贝叶斯法则的运用。如果参与人 是多次行动的,修正概率涉及贝叶斯法则的重 复运用。因为战略是一个行动规则,它本身是 不可观测的,参与人i只能根据观测到的行动 组合a-i修正概率,但他假定所观测到的行动是 最优战略s*-i规定的行动。 限制条件“在可能的情况下”来自这样的事实 ,如果a-i 不是均衡战略下的行动,观测到的a-i 是一个零概率事件,此时,贝叶斯法则对后验 概 率 没 有 定 义 , 任 何 的 后 验 概 率 pi( θ -i|ai )∈[0,1]都是允许的,只要它与均衡战略相容 。
战略空间与支付函数
高成本在位者的单阶段最优垄断价格是P=6, 低成本时的单阶段最优垄断价格是P=5(最优垄 断价格总是边际成本的增函数)。 在t=2时期,如果进入者不进入,在位者仍然 是一个垄断者,不同价格选择下的利润水平与 第一阶段相同。 在t=2,如果进入者已经进入,在位者的成本 函数变成共同知识;
市场进入阻挠动态博弈
假定有两个时期,t = 1,2。在t=1时期,市场 上有一个垄断企业(在位者),一个潜在的进入 者考虑是否进入; 如果进入者进入,在t=2时期,两个企业进行库 诺特搏弈,否则,在位者仍然是一个垄断者。 假定在位者有两个可能的类型,高成本或低成 本,进入者在博弈开始时只知道在位者是高成 本的概率是µ,低成本的概率是l-µ,这个概率 分布称为进入者的先验信念。
贝叶斯法则
因此,Prob(θk|ah)≡ p(ah|θk)p(θk)/Prob(ah) ≡ p(ah|θk)p(θk)/ ΣKp(ah|θk)p(θk) 这就是贝叶斯法则 贝叶斯法则。精炼贝叶斯均衡假定参与人是根 贝叶斯法则 据贝叶斯法则修正先验概率的。 贝叶斯法则要求Prob(ah)>0即参与人i必须以正的概率 选择ah,否则,后验概率没有定义。 如果Prob(ah)=0,我们允许Prob(θk|ah)在[0,1]区间取 任何值,只要所取的值与均衡战略相容,即均衡仍然 成立。 在动态博弈中,Prob(ah)=0对应的是非均衡路径上的 信息集。
4.14.1-2 贝叶斯法则
在日常生话中,在任何一个时点上,我们对某 种不确定性事件发生的可能性有一个判断。然 后,我们会根据新的信息来修正这个判断。 统计学上,修正之前的判断称为“先验概率” ,修正之后的判断称为“后验概率"。 贝叶斯法则正是人们根据新的信息从先验概率 得到后验概率的唯一合理方法。 在不完全信息博弈中,我们假定参与人的类型 是独立分布的,参与人i有K个可能的类型,有 H个可能的行动。用θk和ah分别表示一个参与人 的一种特定的类型和一个特定的行动。
精炼贝叶斯均衡
精炼贝叶斯均衡是贝叶斯均衡、子博弈精炼均 衡和贝叶斯推断的结合。它要求: (1)在每一个信息集上,决策者必须有一个定 义在属于该信息集的所有决策结上的一个概率 分布(信念); (2)给定该信息集上的概率分布和其他参与人 的后续战略,参与人的行动必须是最优的; (3)每一个参与人根据贝叶斯法则和均衡战略 修正先验概率。
博弈论
第4章 不完全信息动态博弈 精炼贝叶斯均衡
内容提要
精炼贝叶斯纳什均衡 精炼贝叶斯均衡的再精炼 序贯均衡与颤抖手均衡 适度均衡与稳定均衡 不完全信息重复博弈与声誉模型
4.1 精炼贝叶斯纳什均衡
不完全信息动态博弈
在不完全信息动态博弈中,“自然”首先选择 参与人的类型,参与人自已知道,其他参与人 不知道; 在自然选择之后,参与人开始行动, 在自然选择之后 , 参与人开始行动 , 参与人的 行动有先有后,后行动者能观测到先行动者的 行动有先有后, 行动,但不能观测到先行动者的类型; 行动,但不能观测到先行动者的类型; 但是,因为参与人的行动是类型依存 类型依存的,每个 类型依存 参与人的行动都传递着有关自己类型的某种信 息,后行动者可以通过观察先行动者所选择的 行动来推断其类型或修正对其类型的先验信念概率分布,然后选择自己的最优行动。
相关主题