第十章 博弈论初步第一部分 教材配套习题本习题详解一、简答题1.什么是纳什均衡?纳什均衡一定是最优的吗?解答:(1)所谓纳什均衡,是参与人的一种策略组合,在该策略组合上, 任何参与人单独改变策略都不会得到好处。
(2)不一定。
如果纳什均衡存在,纳什均衡可能是最优的,也可能不是最优的。
例如,在存在多个纳什均衡的情况下,其中有一些纳什均衡就不是 最优的;即使在纳什均衡是唯一时,它也可能不是最优的,因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。
如:囚徒 困境。
2.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下, 纯策略的纳什均衡最多可有几个?为什么?解答:在只有两个参与人 (如 A和 B)且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有四个。
例如,当A与B的支付矩阵可分别表示如下时,总的支付矩阵中所有四个单元格的两个数字均有下划线,从而,总共有四个纳什均衡。
A 的支付矩阵=⎥⎦⎤⎢⎣⎡22211211a a a aB 的支付矩阵=⎥⎦⎤⎢⎣⎡22211211b b b b例如:a 11=a 12=a 21=a 22,b 11=b 12=b 21=b 22就会得到以上四个纳什均衡。
具体事例为: 73737373⎡⎤⎢⎥⎣⎦3.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有三个。
试举一例说明。
解答:在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的 纳什均衡可能有4个、3个、2个、1个和0个五种情况,所以可能有3个。
例如,当参与 人A与B的支付矩阵可分别表示如下时,总的支付矩阵中恰好有三个单元格的两个数字均有下划线,从而,总共有三个纳什均衡。
A 的支付矩阵= ⎥⎦⎤⎢⎣⎡22211211a a a a B 的支付矩阵=11122122b b b b ⎡⎤⎢⎥⎢⎥⎣⎦ A 、B 共同的支付矩阵=1111121222222121a b a b a b a b ⎡⎤⎢⎥⎢⎥⎣⎦具体事例为: 76157323⎡⎤⎢⎥⎣⎦4.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,如何找到所 有的纯策略纳什均衡?解答:可使用条件策略下划线法。
具体步骤如下:首先,把整个博弈的支付矩阵分解 为两个参与人的支付矩阵;其次,在第一个 (即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大者,并在其下画线;再次,在第二个 (在位于整个博弈矩阵上 方的)参与人的支付矩阵中,找出每一行的最大者,并在其下画线;然后,将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵;最后,在带有下划线的整个的支付矩阵中,找到两个数字之下均画有线的支付组合。
由该支付组合 代表的策略组合就是博弈的纳什均衡。
5.设有A、B两个参与人。
对于参与人A的每一个策略,参与人B的条件策略有无 可能不止一个?试举一例说明。
解答:例如,在如表10—1的二人同时博弈中,当参与人 A选择上策略时,参与人 B 既可以选择左策略,也可以选择右策略,因为他此时选择这两个策略的支付是完全一样 的。
因此,对于参与人A的上策略,参与人B的条件策略有两个,即左策略和右策略。
表10—16.如果无论其他人选择什么策略,某个参与人都只选择某个策略,则该策略就是该参与人的绝对优势策略(简称优势策略)。
试举一例说明某个参与人具有某个优势策略的情况。
解答:例如,在如表10—2的二人同时博弈中,无论参与人A是选择上策略还是选择下策略,参与人B总是选择左策略,因为他此时选择左策略的支付总是大于选择右策略。
因此,在这一博弈中,左策略就是参与人B的绝对优势策略。
同时下策略是A的绝对优势策略。
表10—27.混合策略博弈与纯策略博弈有什么不同?解答:在纯策略博弈中,所有参与人对策略的选择都是“确定”的,即总是以100%的可能性来选择某个策略,而在混合策略博弈中,参与人则是以一定的可能性来选择某个策略,又以另外的可能性选择另外一些策略。
在这种情况下,参与人选择的就不再是原来的100%的确定策略(如上策略或下策略),而是一个概率向量(如以某个概率选择上策略,以另外一个概率选择下策略)。
纯策略博弈可以看成是混合策略博弈的一种特例。
8.条件混合策略与条件策略有什么不同?解答:例如,在一个只包括参与人A与参与人B的二人同时博弈中,参与人A的条件策略是A在B选择某个既定策略时所选择的可以使其支付达到最大的策略。
相应地,参与人A的条件混合策略是A在B选择某个既定的混合策略时所选择的可以使其期望支付达到最大的混合策略。
9.混合策略纳什均衡与纯策略纳什均衡有什么不同?解答:在纯策略博弈中,纳什均衡是参与人的一种策略组合,在该策略组合上,任何参与人单独改变其策略都不会得到好处。
在混合策略博弈中,纳什均衡是参与人的一种概率向量组合,在该概率向量组合上,任何参与人单独改变其概率向量都不会得到好处。
10.设某个纯策略博弈的纳什均衡是有限的。
试问:相应的混合策略博弈的纳什均衡会是无限的吗?试举一例说明。
解答:当纯策略博弈的纳什均衡为有限时,相应的混合策略博弈的纳什均衡既可能是有限的,也可能是无限的。
例如,在只包括A与B的二人同时博弈中,混合策略纳什均衡的“集合”可以是单位平面、三条线段、两条线段、一条线段、三个点、两个点和一个点,其中,前四种情况就意味着存在无限多个纳什均衡。
11.在完全信息动态博弈中,纳什均衡与逆向归纳策略有什么不同?解答:与同时博弈一样,在序贯博弈中,纳什均衡也是指这样一些策略组合,在这些策略组合中,没有哪一个参与人会单独改变自己的策略。
同样,在序贯博弈中,纳什均衡也可能不止一个。
在这种情况下,可以通过逆向归纳法对纳什均衡进行“精炼”,即从多个纳什均衡中,排除掉那些不合理的纳什均衡,或者,从众多的纳什均衡中进一步确定“更好”的纳什均衡。
经由逆向归纳法的精炼而得到的纳什均衡就是所谓的逆向归纳策略。
二、论述题1.设某个纯策略博弈的纳什均衡不存在。
试问:相应的混合策略博弈的纳什均衡会存在吗?试举一例说明。
解答:在同时博弈中,纯策略的纳什均衡可能存在,也可能不存在,但相应的混合策略纳什均衡总是存在的。
例如,在表10—3的二人同时博弈中,根据条件策略下划线法可知,由于没有一个单元格中两个数字之下均有下划线,故纯策略的纳什均衡不存在,但是,相应的混合策略纳什均衡却是存在的。
表10—3首先,分别计算A与B的条件混合策略。
E A =3p 1q 1+9p 1(1-q 1)+7(1-p 1)q 1+2(1-p 1)(1-q 1) =3p 1q 1+9p 1-9p 1q 1+7q 1-7p 1q 1+2-2q 1-2p 1+2p 1q 1 =7p 1-11p 1q 1+5q 1+2 =p 1(7-11q 1)+5q 1+2E B =6p 1q 1+2p 1(1-q 1)+3(1-p 1)q 1+8(1-p 1)(1-q 1) =6p 1q 1+2p 1-2p 1q 1+3q 1-3p 1q 1+8-8q 1-8p 1+8p 1q 1 =9p 1q 1+8-5q 1-6p 1 =q 1(9p 1-5)-6p 1+8其次,分别计算A 和B 的条件混合策略。
p 1= []⎪⎪⎩⎪⎪⎨⎧>=<11/7011/71,011/71111q q qq 1= []⎪⎪⎩⎪⎪⎨⎧>=<9/519/51,09/50111p p p最后,混合策略纳什均衡参见图10—1中的e点。
图10—12.在下面的博弈树中(见图10—2),确定纳什均衡和逆向归纳策略。
解答:纳什均衡和逆向归纳策略都是同一个,即与支付向量(1,3)相应的策略组合(决策1,决策3)。
图10—23.用逆向归纳法确定下面的“蜈蚣博弈”的结果(见图10—3)。
在该博弈中,第1步是A决策:如果A决定结束博弈,则A得到支付1,B得到支付0,如果A决定继续博弈,则博弈进入到第2步,由B做决策。
此时,如果B决定结束博弈,则A得到支付0,B得到支付2,如果B决定继续博弈,则博弈进入到第3步,又由A做决策,如此等等,直到最后,博弈进入到第9999步,由A做决策。
此时,如果A决定结束博弈,则A得到支付9999,B得到支付0;如果A决定继续博弈,则A得到支付0,B得到支付10000。
图10—3解答:首先考虑第9999步A的决策。
此时,A肯定会结束博弈———结束博弈A可以得到支付9999,否则只能得到0。
于是,我们可以把该博弈中最后一条水平线段删除;其次考虑第9998步B的决策。
此时,B也肯定会结束博弈,结束博弈B可以得到,9998,否则只能得到0。
于是,我们可以把该博弈中倒数第二条水平线段(以及它后面的最后一条垂直线段)也删除。
这样倒推下来的结果是,任何一个人在轮到自己决策时都会决定结束博弈。
因此,整个博弈的结果是:在第1步,A就决定结束博弈,于是,A得到1,B得到0。
4.在图10—3所示的情侣博弈中,如果将第二个支付向量(0,0)改为(0,1.5),纳什均衡和逆向归纳法策略会有什么变化?改为(0,1)呢?解答:(1)当第二个支付向量不变,仍然为(0,0)时,有两个纳什均衡,即(足球,足球)和(芭蕾,芭蕾),逆向归纳策略为(足球,足球)。
(2)将第二个支付向量由(0,0)改为(0,1.5)后,纳什均衡和逆向归纳法策略都是(芭蕾,芭蕾)。
(3)如果将第二个支付向量改为(0,1),则纳什均衡仍然为(足球,足球)和(芭蕾,芭蕾),但逆向归纳法失效:当男方选择芭蕾时,女方也选择芭蕾,从而,男方可得到支付1,但是,当男方选择足球时,女方既可以选择足球,也可以选择芭蕾,如果女方选择足球,则男方可以得到更大的2,如果女方选择芭蕾,则男方只能得到更小的0。
图10—45.在只有两个参与人且每个参与人都有三个策略可供选择的情况下,纯策略的纳什均衡最多可有几个?解答:在只有两个参与人且每个参与人都只有三个策略可供选择的情况下,纯策略的纳什均衡最多可有九个。
例如,当参与人A与B的策略不同,但各自的支付相同,则有九个支付相同的纳什均衡。
6.设有两个参与人x 和y 。
x 有两个纯策略x 1 和x 2,y 有两个纯策略y 1 和y 2。
当y 选择y 1 和y 2 时,x 选择x 1 得到的支付分别为x 11 和x 12,选择x 2 得到的支付分别为x 21 和x 22;当x 选择x 1 和x 2 时,y 选择y 1 得到的支付分别为y 11 和y 21,选择y 2 得到的支付分别为y 12和y 22。
(1)试给出相应的博弈矩阵。
(2)这种博弈矩阵的表示是唯一的吗? 为什么?解答:(1)x 的支付矩阵= 11122122x x x x ⎡⎤⎢⎥⎣⎦ B 的支付矩阵=11122122y y y y ⎡⎤⎢⎥⎣⎦A 、B 共同的支付矩阵= 1111121221212222x y x y x y x y ⎡⎤⎢⎥⎣⎦(2) 这种博弈矩阵的表示不是唯一的。