当前位置：文档之家› 经济博弈论重复博弈

经济博弈论重复博弈

因为后续两阶段的结局（A,B）和（B,A）为纳什均衡，而第一阶段的合作结局（A,A)是由于触发策略针对对方偏离合作的行为设计了后续两阶段都不合作的惩罚措施，其单方面偏离的路径（B,A）（B,B）（B,B）收益并不增加，因此不存在偏离的动机。
18
17.06.2020
4.2.4 民间定理
问题的提出：由于具有多个纳什均衡的重复博弈可以设计多种策略，在双方缺乏沟通的情况下，结局具有不确定性。因此，这里讨论具有多个纳什均衡的重复博弈可以实现的收益范围。
12
17.06.2020
4.2.2 有限次重复的囚徒困境博弈
定理设原博弈G有唯一的纯策略纳什均衡，则对任意正整数T，重复博弈G（T）有唯一的子博弈完美的解，即各博弈方每个阶段都采用G 的纳什均衡策略。各博弈方在G（T）中的总得益为在G中得益的T倍，平均每阶段得益等于原博弈G中的得益。
13
（2）如果对方在第一阶段中采取了合作行为，在后续阶段的策略设计中要保证博弈结局具有稳健性。因此，针对第一阶段的合作行为，后续阶段的策略设计是为了实现双方的行动协调，以保证实现纳什均衡（B,A）或（A,B）。
17
17.06.2020
4.2.3 有两个纳什均衡的重复博弈
结果分析：
子博弈路径（A,A)，（A,B），（B,A）为子博弈纳什均衡。
实际上，所有以零和博弈为原博弈所构成的重复博弈与猜硬币博弈构成的重复博弈一样，各博弈方的正确策略就是在每次重复中都采用一次性博弈中的纳什均衡策略。
8
17.06.2020
4.2.2 有限次重复的囚徒困境博弈
坦白不坦白
坦白
不坦白
－5，－5
0，－8
－8， 0 －1，－1
图4－1 囚徒困境
求解思路：对于有限次重复囚徒困境博弈，根据动态博弈的逆推归纳法可以求解。
最大化”导致的囚徒困境，实现长期合作的结局。
1
17.06.2020
第一节几个概念
重复博弈的概念有限次重复博弈的概念
2
17.06.2020
4.1.1 重复博弈的概念
1 由简单的静态博弈（或动态博弈）的有限次（或无限次）重复进行构成的。 2 每一阶段博弈方、策略集合、规则和得益都相同。 3 包括：有限次重复博弈和无限次重复博弈 4 例子：多场决胜负的体育比赛（有限次）两寡头市场上两个厂商之间的竞争（无限次）商场与顾客交易
策略有多个纳什均衡重复博弈的得益范围——民间定
理
7
17.06.2020
4.2.1 有限次重复的猜硬币博弈
在零和博弈中，双方不存在合作的可能性，因此在长期进行的重复博弈中，子博弈完美纳什均衡由各个阶段原博弈的纳什均衡构成（例，在猜硬币博弈中以0.5的概率选择正面或者反面，即采取混合策略）。
一个触发策略来实现这个得益。
24
17.06.2020
4.2.4 民间定理
触发策略：博弈方1在第一阶段采取M策略，如果对方合作，则第二阶段采取R策略作为奖励；否则第二阶段采取L策略进行惩罚（注意 (L,L)也是纳什均衡，因此具有稳定性）。博弈方2也采取同样策略。
策略分析：如果任何一方在第一阶段偏离，仅仅多获得5－4＝1单位得益，而在第二阶段的得益（L,L）仅仅为1；如果在第一阶段合作，第二阶段的得益为3。因此双方不存在偏离该策略的动机。
此时，博弈的纳什均衡仍是（坦白，坦白）。
10
17.06.2020
4.2.2 有限次重复的囚徒困境博弈
结论：在有限次重复博弈G(T)中，如果原博弈G存在唯一的纯策略纳什均衡组合，则重复博弈的唯一的子博弈完美纳什均衡解为各博弈方在每阶段都采取的原博弈纳什均衡策略。
含义：在原博弈具有唯一均衡的有限次重复博弈中，由于完全理性的博弈方具有“共同知识” 的分析推理能力，因此在从最后阶段开始的逆推过程中，仍然无法摆脱囚徒困境。
29
17.06.2020
第三节无限次重复博弈
图4－5双方各五种可选策略重复博弈
26
17.06.2020
4.2.4 民间定理
该博弈具有4个纯策略纳什均衡，在二次重复博弈中，触发策略设计：第一阶段双方采取 (M,M)策略，如果博弈方1偏离此策略，那么第二阶段采取(Q,Q)策略对博弈方1进行惩罚，对博弈方2进行奖励；同理，如果博弈方2偏离了此策略，那么采取(P,P)策略对博弈方2进行惩罚，对博弈方1进行奖励。如果双方都没有偏离，那么第二阶段采取具有较高收益的纳什均衡(R,R)策略。如果双方都偏离了此策略，第二阶段同样采取纳什均衡的(R,R)策略。
11
17.06.2020
4.2.2 有限次重复的囚徒困境博弈
如果原博弈存在唯一的纯策略纳什均衡组合，则有限次重复博弈的唯一的均衡解即各博弈方在每阶段（即每次重复）中都采用原博弈的纳什均衡策略。由于在这样的双方策略下，均衡路径中的每个阶段都不存在不可信的威胁或许诺，因此这种均衡是子博弈完美纳什均衡。
25
17.06.2020
4.2.4 民间定理
例（双方各五种可选策略重复博弈）：
L
MRP
Q
L 1,1 5,0 0,0 0,0 0,0
M 0,5 4,4 0,0 0,0 0,0
R 0,0 0,0 3,3 0,0 0,0
P 0,0 0,0 0,0 4,1/2 0,0
Q 0,0 0,0 0,0 0,0 1/2,4
定理：将一次性博弈中最差的均衡得益数组记为w,如果原博弈G的一次性博弈有均衡得益数组优于w，那么在有限次重复博弈G(T)中，所有个体理性得益和可实现得益都至少有一个子博弈完美纳什均衡来实现。
20
17.06.2020
4.2.4 民间定理
在图4-2一次性博弈中，博弈方均衡得益分别为纯策略的得益（1，4），（4，1）和混合策略的得益（2，2）,最差的均衡得益数组为w=(1,1)。
（2）博弈方2的策略是第一阶段合作A，如果发现对方采取B不合作，则后续两个阶段一直采取不合作的 B策略；如果发现对方采取合作A，则第二阶段采取不合作B，第三阶段采取合作A。
16
17.06.2020
4.2.3 有两个纳什均衡的重复博弈
策略设计分析：
（1）在博弈方1和2中，在第一阶段都采取了合作行为A，并针对对方的不合作行为B，都设计了在后续2个阶段采取不合作B的相应惩罚措施；
9
17.06.2020
4.2.2 有限次重复的囚徒困境博弈
以两阶段（以该博弈作为原博弈G重复两次）为
例：分析最后一阶段，子博弈即为原博弈，唯一的
均衡为（－5，－5）；分析第一阶段，将最后阶段
的收益（－5）添加到第一阶段的矩阵中，即：
坦白不坦白
坦白
－10，－10 －13，－5
不坦白
－5，－13 －6，－6
4 得益：不同于一般的动态博弈，重复博弈的得益为各个阶段得益的加总。考虑到时间的价值，需要引进“贴现系数”将未来的得益折算成当期得益的价值。
6
17.06.2020
第二节有限次重复博弈
有限次重复的猜硬币博弈——原博弈为零和博弈有限次重复的囚徒困境博弈——原博弈有唯一的
纯策略纳什均衡有多个纳什均衡
4.2.4 民间定理
策略分析：与图4－4例子相比较，由于博弈的特殊结构，这个触发策略的设计对偏离行为和合作行为分别进行惩罚和奖励，因此策略具有很强的可信性。而在图4-4例子中，针对对方的偏离行为采取了（L,L）策略进行惩罚，但是惩罚对方的同时，自身的利益也受到了损害，因此可信性不强。
第四章重复博弈
本章主要内容：
1 重复博弈的概念；
2 作为一种特殊的动态博弈，有限次和无限次重复
博弈的子博弈完美纳什均衡的求解方法；
3 无限次重复博弈古诺模型和效率工资模型。
本章主要结论（民间定理）：
由于参与者在重复博弈中具有了长期利益，
可以通过在后面阶段中采取的报复策略使得威胁
变得可信，从而摆脱静态博弈中“追求自身利益
23
17.06.2020
4.2.4 民间定理
例（两人各三种可选策略）：
L
M
R
L 1，1
M 0，5 R 0，0
5，0 4，4 0，0
0，0 0，0 3，3
图4－4多种策略博弈的重复博弈
该博弈具有两个纯策略纳什均衡和一个混合
策略纳什均衡，但是双方存在一个更好的得益（4，
4）。对于二次重复博弈，根据民间定理可以设计
17.06.2020
4.2.3 有两个纳什均衡的重复博弈
例两个厂商1和2，同时
A
B
面临两个市场机会A和B。假 A 3，3 1， 4
设每个厂商都只有能力选择 B 4，1 0，0
一市场发展，即他们的可选图4－2 两厂商差别市场博弈
择策略都是A或B，其得益矩
阵如图所示。
此博弈具有2个纯策略纳什均衡（1，4）、
个体理性得益：不管对方采取何种行动，只要自己的行为合理就可以保证实现的收益。
可实现得益：各纯策略组合得益的加权平均数组。注意：并非一定是均衡策略的组合得益，因此在图4－2中，（3，3）也是可实现得益。
19
17.06.2020
4.2.4 民间定理
用wi记博弈方i在一次性博弈中最差的均衡得益，用w记各博弈方的wi构成的得益数组。结合 “个体理性得益”和“可实现得益”，则有限但次数很多的重复博弈有如下民间定理：
（4，1）和混合策略纳什均衡概率（0.5，0.5）。
14
17.06.2020
4.2.3 有两个纳什均衡的重复博弈
考虑三次重复博弈各策略组合子博弈纳什均衡路径：
1.由原博弈的纳什均衡组合而成的路径，如采取轮换策略（在上述的协调博弈中，双方轮换采取纯纳什均衡策略，路径为(A,B)，(B,A)，(A,B)….. 不考虑时间的价值（贴现系数），每阶段的平均得益为（4＋1）/2 ＝2.5，高于混合策略的得益2。

e商务文档

经济博弈论重复博弈

相关文档推荐：