一、支付矩阵1、试给出下述战略式表述博弈的纳什均衡BAU D解:由划线解得知有一个纯战略均衡(R D ,)再看看它是否有混合战略均衡 设B 以)1,(γγ-玩混合战略,则有 均衡条件:γγγ-=-+⋅=2)1(21)(U V A γγγ26)1(64)(-=-+⋅=D V A γγ262-=-得14>=γ,这是不可能的,故无混合战略均衡,只有这一个纯战略均衡。
2、试将题一中的支付作一修改使其有混合战略均衡解:由奇数定理,若使它先有两个纯战略均衡,则很可能就有另一个混合战略均衡。
BAU D将博弈改成上述模型,则)1(64)1(25γγγγ-+=-+ γγ2632-=+ 得 54=γ 同样,设A 的混合战略为)1,(θθ-,则)1(25)1(16θθθθ-+=-⋅+θθ3251+=+ 21=θ 于是混合战略均衡为⎭⎬⎫⎩⎨⎧⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛51,54,21,21。
二、逆向归纳法1、用逆向归纳法的思路求解下述不完美信息博弈的子博弈精炼均衡1(5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 解 1(5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 设在1的第二个信息集上,1认为2选a 的概率为P ,则1选L '的支付P P P 32)1(25+=-+=1选R '的支付P P P P 3233)1(36+>+=-+=故1必选R '。
⇒ 给定1在第二个决策结上选R ',2在左边决策结上会选a ,故子博弈精炼均衡为{}),(,,d a R L '四、两个厂商生产相同产品在市场上进行竞争性销售。
第1个厂商的成本函数为11q c =,其中1q 为厂商1的产量。
第2个厂商的成本函数为22cq c =,其中2q 为厂商2的产量,c 为其常数边际成本。
两个厂商的固定成本都为零。
厂商2的边际成本c 是厂商2的“私人信息”,厂商1认为c 在⎥⎦⎤⎢⎣⎡23,21上呈均匀分布。
设市场需求函数为214q q P --=,其中P 为价格,两个厂商都以其产量为纯战略,问纯战略贝叶斯均衡为何?解:给定2q ,厂商1的问题是12111)14( )1(max 1q q q q P q ---=-=π因)(22c q q =。
厂商1不知道c ,故目标函数为⎥⎦⎤⎢⎣⎡--=---⎰⎰2/3212112/3121211211)(3max )1)(4(max dc c q q q q dcq c q q q q一阶条件: 0)(232/32121=--⎰dc c q q得 ⎰-=2/32121)(2123dc c q q (1)厂商2的问题是:2221222122)4( )4( )(max 2q q q q c q c q q q c P q ---=---=-=π一阶条件:02)4(21=---q q c得 24)(12q c c q --=(2) 代入式(1):43 2123814423 41242123 24212312212/32/312/311212121q q cdcq dc q c q +=⎥⎥⎦⎤⎢⎢⎣⎡⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛+--=+--=---=⎰⎰⎰得11=q 代入式(2): 23)(2cc q -=若1=c ,则121==q q121==ππ若信息是完全的且1=c ,则古诺博弈均衡为15321<==q q ,1252721>==ππ。
这说明信息不完全带来的高效率。
2、完美信息动态博弈。
会用策略式表达、扩展式表达。
用方框找纳什均衡,用树找子博弈精炼均衡。
讲理由,看例题。
该博弈中有三个纳什均衡: 不进入,(进入,进入) 进入,(不进入,进入)进入,(不进入,不进入)前两个均衡的结果(进入,不进入),即A进入,B不进入;第二个均衡结果是(不进入,进入),即A不进入,B进入如果理论得到这样的结果,无助于预测博弈参与人的行为。
此外,纳什均衡假定,每一个参与人选择的最优战略是在所有其他参与人的战略选择给定时的最优反应,即参与人并不考虑自己的选择对其他人选择的影响,因而纳什均衡很难说是动态博弈的合理解。
必须在多个纳什均衡中剔除不合理的均衡解,即所谓“不可置信威胁”。
子博弈精炼纳什均衡是对纳什均衡概念的最重要的改进。
它的目的是把动态博弈中的“合理纳什均衡”与“不合理纳什均衡”分开。
正如纳什均衡是完全信息静态博弈解的基本慨念一样,子博弈精炼纳什均衡是完全信息动态博弈解的基本概念。
①{不进入,(进入,进入)}②{进入,(不进入,进入)}③{进入,(不进入,不进入)}前边得到的三个纳什均衡中,均衡①意味着当A不进入时,B选择进入;而当A选择进入时,B仍选择进入(B威胁无论如何都要进入市场)。
显然,当A选择进入时,B仍选择进入是不合理的,如果A进入市场,B选择“不进入”比选择“进入”收益要更大,理性的B不会选择进入,而A知道B是理性的,因此也不会把该战略视为B会选择的战略。
因此,B的战略(进入,进入)是不可置信威胁。
①{不进入,(进入,进入)}②{进入,(不进入,进入)}③{进入,(不进入,不进入)}均衡③意味着当A进入时,B选择不进入;而当A 选择不进入时,B 仍选择进入(B 威胁无论如何都不进入市场)。
显然,当A 选择不进入时,B 仍选择不进入是不合理的,B 的战略是不可置信的。
只有均衡②是合理的:如果A 进入,B 不进入;如果A 不进入,B 进入。
因为A 是先行动者,理性的A 会选择“进入”(他知道B 是理性的,B 不会选择“进入”),而理性的B 选择“不进入”。
观察博弈树上的三个均衡中,B 的不可置信战略中的反应,在第二阶段B 开始行动的两个子博弈中不是最优;而合理的纳什均衡中,B 的战略在所有子博弈中都是最优的,与A 的第一阶段可能选择的行动构成该子博弈的纳什均衡。
五、试给出下述信号博弈的纯战略均衡中的混同均衡和分离均衡(8,1) (1,2)4,1)(7,3) (3,7)解:有四种可能:混同均衡 11m t →,12m t → 21m t →,22m t → 分离均衡 11m t →,22m t → 21m t →,12m t → 设)(i m u 为接收者看见i m 时 认为发送者是1t 的后验概率。
看11m t →,12m t →则5.0)(1=m u ,非均衡路径上]1,0[)(2=m u当接收者看见1m ,选1a 的支付为 5.115.025.0=⨯+⨯选2a 的支付为5.15.775.085.0>=⨯+⨯ 故选2a 。
当接收者看见2m ,选1a 的支付为)(455))(1(1)(222m u m u m u -=⨯-+⨯ 选2a 的支付为)(433))(1(7)(222m u m u m u +=⨯-+⨯当1t 选1m ,接收者会选2a ,1t 得支付10,要求1t 不选2m ,对)(2m u 无要求,因1t 总会选1m 。
当2t 选1m ,接收者会选2a ,2t 得支付3,要求2t 不选2m 是不可能的,因2t 选2m 是占优于选1m 的,故此混同均衡11m t →,12m t →不存在。
再看混同均衡 21m t →,22m t →此时]1,0[)(1=m u 为非均衡路径上的后验概率,5.0)(2=m u当接收者看见2m ,选1a 的支付为355.015.0=⨯+⨯ 选2a 的支付为3535.075.0>=⨯+⨯ 故接收者必选2a 。
当接收者看见1m 时,选1a 的支付为 )(11)(1(2)(111m u m u m u +=⋅-+⋅选2a 的支付为)(1)(77)(1(8)(1111m u m u m u m u +>+=⋅-+⋅ 故必选2a 。
这样,无论发送者发出1m 或2m 信号,接收者总选2a ,⇒给定接收者总是选2a 。
1t 会选1m ,2t 会选2m 。
⇒故21m t →,22m t →不是混同均衡。
看分离均衡11m t →,22m t → 1)(1=m u ,0)(2=m u 接收者看见1m 时,必选2a 接收者看见2m 时,必选1a 此时,1t 选1m ,2t 选2m⇒故11m t →,22m t →是一个分离均衡。
最后看分离均衡21m t →,12m t → 0)(1=m u ,1)(2=m u 接收者看见1m 时,必选2a 接收者看见2m 时,必选2a⇒给定接收者总选2a11m t →,22m t →⇒故21m t →,12m t →不是分离均衡。
故只有一个纯战略子博弈精炼分离均衡 11m t → 22m t → 鹰-鸽(Hawk-Dove)博弈(1) 参与人:争食的两只动物-动物1和动物2。
动物1和动物2的行动空间都是一样的,即:Ai={鹰,鸽} i=1,2 支付矩阵如下:(2) 此博弈属于完全信息静态博弈,根据奇数定理知道共有三个纳什均衡,两个纯策略纳什均衡和一个混合策略纳什均衡。
两个纯策略纳什均衡是:(鹰,鸽)和(鸽,鹰)。
混合策略纳什均衡是:动物1和动物2分别以50%的概率随机地选择鹰(象鹰一样行动)或者鸽(象鸽一样行动)。
纯策略纳什均衡可以用划线法或箭头法求解。
混合策略纳什均衡则可根据无差异原则求解概率分布,即:首先,动物1应该以q的概率选择鹰,以1-q的概率选择鸽,使得动物2在鹰或者鸽之间无差异,那么可得q*:由4(1-q) = q+3(1-q) 得q*=50%;其次,动物2应该以a的概率选择鹰,以1-a的概率选择鸽,使得动物1在鹰或者鸽之间无差异,那么可得a*:由4(1-a) = a+3(1-a) 得a*=50%。
(3) 此博弈实际就是一个斗鸡博弈,在现实生活许多现象都与此类似,如市场进入、前苏联与美国在世界各地争抢地盘等。
七、狩猎博弈此博弈同样是一个完全信息静态博弈,参与人是两个猎人,他们的行动是选择猎鹿或者猎兔。
支付矩阵如下:根据划线或箭头法我们可以很容易地知道此博弈有两个纯策略纳什均衡,即:(鹿,鹿)和(兔,兔),也就是两个猎人同时猎鹿或同时猎兔都是纯策略纳什均衡。
由于存在两个纯策略纳什均衡,现实中究竟哪个均衡会出现就是一个问题,这是多重纳什均衡下的困境。
但是,比较两个纳什均衡,很容易发现两人都猎鹿帕累托优于两人都猎兔,所以,对两个猎人而言,都猎鹿是一个“更好”的纳什均衡,因此,在现实中两个人都决定猎鹿的可能性要更大一些。
然而,正如卢梭所言,如果一只野兔碰巧经过他们中的一个人附近,那么也许这个人会去猎兔而使猎鹿失败,因为两个人都猎兔也是一个纳什均衡,这就是人的自私性。
此外,在多个纳什均衡下,博弈之外的其他因素有助于我们判断哪个均衡会出现。
比如,两个猎人是好朋友,经常合作,那么我们几乎可以100%的肯定他们都会同时选择猎鹿。