当前位置:
文档之家› 第四章 重复博弈【博弈论经典】
第四章 重复博弈【博弈论经典】
4.2.2 有限次重复的囚徒困境博弈
如果原博弈存在唯一的纯策略纳什均衡组合,则有限次重复博弈的唯一的均衡 解即各博弈方在每阶段(即每次重复)中都采用原博弈的纳什均衡策略。由于 在这样的双方策略下,均衡路径中的每个阶段都不存在不可信的威胁或许诺, 因此这种均衡是子博弈完美纳什均衡。
4.2.2 有限次重复的囚徒困境博弈
坦白 此时,博弈的纳什均衡仍是(坦白,坦白)。
不坦白
坦白
不坦白
-10,-10
- 5,
-13
-13, -5
-6,-6
4.2.2 有限次重复的囚徒困境博弈
结论: 在有限次重复博弈G(T)中,如果原博弈G存在唯一的纯策略纳什均衡 组合,则重复博弈的唯一的子博弈完美纳什均衡解为各博弈方在每阶段都采 取的原博弈纳什均衡策略。 含义:在原博弈具有唯一均衡的有限次重复博弈中,由于完全理性的博弈方 具有“共同知识”的分析推理能力,因此在从最后阶段开始的逆推过程中, 仍然无法摆脱囚徒困境。
4.2.3 有两个纳什均衡的重复博弈 考虑三次重复博弈各策略组合子博弈纳什均衡路径: 1.由原博弈的纳什均衡组合而成的路径,如采取轮换策略(在上述的协调博弈中, 双方轮换采取纯纳什均衡策略,路径为(A,B),(B,A),(A,B)…..不考虑时间的价值 (贴现系数),每阶段的平均得益为(4+1)/2 =2.5,高于混合策略的得益2。 2.触发策略,博弈方首先采取合作行为,如果发现对方没有进行合作,那么在后 续阶段的博弈中采取不合作策略进行惩罚。
第二节
有限次重复博弈
有限次重复的猜硬币博弈——原博弈为零和博弈 有限次重复的囚徒困境博弈——原博弈有唯一的纯策略纳什均衡 有多个纳什均衡的重复博弈的策略设计——触发策略 有多个纳什均衡重复博弈的得益范围——民间定理
4.2.1 有限次重复的猜硬币博弈 在零和博弈中,双方不存在合作的可能性,因此在长期进行的重复博弈中, 子博弈完美纳什均衡由各个阶段原博弈的纳什均衡构成(例,在猜硬币博弈中 以0.5的概率选择正面或者反面,即采取混合策略)。 实际上,所有以零和博弈为原博弈所构成的重复博弈与猜硬币博弈构成的重 复博弈一样,各博弈方的正确策略就是在每次重复中都采用一次性博弈中的纳 什均衡策略。
4.1.2 有限次重复博弈的概念
定义:给定一个博弈G,重复进行T次G,并且在每次重复之前各博弈方都能观察到 以前博弈的结果,称为G的一个“T次重复博弈”,记为G(T)。其中,G成为G(T) 的原博弈。每次重复称为G(T)的一个阶段。
4.1.2 有限次重复博弈的概念
几个概念: 1 子博弈:从某一阶段(不包括第一阶段)开始,包含以后所有阶段的原重复 博弈的一部分。 2 策略:博弈方在每个阶段针对每种情况如何行动的计划(注:在每一阶段之 前,博弈方是可以观察到以前博弈的结果的)。
4.2.3 有两个纳什均衡的重复博弈 在图4-2中,触发策略的设计为: (1)博弈方1的策略是第一阶段合作A,如果发现对方采取B不合作,则第二阶段采取不 合作的B策略惩罚,否则第二阶段继续合作;第三阶段无条件采取B策略。 (惩罚放在第二阶段) (2)博弈方2的策略是第一阶段合作A,第二阶段无条件选B,如果第一阶段结果是(A, A),则第三阶段A;如果第一阶段结果是(B,A),则第三阶段选B。(惩罚放在第 三阶段) (3)是一子博弈完美纳什均衡,双方每阶段的平均得益为(3+1+4)/3=2.67,效率较高。 (4)如果增加博弈的重复次数到101次。若采用的触发策略是: 博弈方1在前99次中都选A,但从其中的第二次开始,一旦发现
第四章 重复博弈
本章主要内容: 1 重复博弈的概念; 2 作为一种特殊的动态博弈,有限次和无限次重复 博弈的子博弈完美纳什均衡的求解方法; 3 无限次重复博弈古诺模型和效率工资模型。 本章主要结论(民间定理): 由于参与者在重复博弈中具有了长期利益,可以通过在后面阶段中采取的报复 策略使得威胁变得可信,从而摆脱静态博弈中“追求自身利益最大化”导致的囚 徒困境,实现长期合作的结局。
4.2.2 有限次重复的囚徒困境博弈
坦白 坦白 不坦白
不坦白
-5,-5
-8,
图4-1 囚徒困境
0,
0
-8
-1,-1
求解思路:对于有限次重复囚徒困境博弈,根据动态博弈的逆推归纳ቤተ መጻሕፍቲ ባይዱ可以求 解。
4.2.2 有限次重复的囚徒困境博弈
以两阶段(以该博弈作为原博弈G重复两次)为 例:分析最后一阶段,子博弈即为原博弈,唯一的 均衡为(-5,-5);分析第一阶段,将最后阶段 的收益(-5)添加到第一阶段的矩阵中,即:
第一节 几个概念
重复博弈的概念 有限次重复博弈的概念
4.1.1 重复博弈的概念 1 由简单的静态博弈(或动态博弈)的有限次(或无限次)重复进行构成的。 2 每一阶段博弈方、策略集合、规则和得益都相 同。 3 包括:有限次重复博弈和无限次重复博弈 4 例子: 多场决胜负的体育比赛(有限次) 两寡头市场上两个厂商之间的竞争(无限次) 商场与顾客交易
定理 设原博弈G有唯一的纯策略纳什均衡,则对任意正整数T,重复博弈G(T) 有唯一的子博弈完美的解,即各博弈方每个阶段都采用G的纳什均衡策略。各 博弈方在G(T)中的总得益为在G中得益的T倍,平均每阶段得益等于原博弈G 中的得益。
4.2.3 有两个纳什均衡的重复博弈
例 两个厂商1和2,同时 A B 面临两个市场机会A和B。假 A 设每个厂商都只有能力选择 3,3 1, 4 一市场发展,即他们的可选 B 4,1 0,0 择策略都是A或B,其得益矩 阵如图所示。 图4-2 两厂商差别市场博弈 此博弈具有2个纯策略纳什均衡(1,4)、 (4,1)和混合策略纳什均衡概率(0.5,0.5)。
4.1.2 有限次重复博弈的概念
3 路径: 是每个阶段博弈结果(原博弈的一个策略组合)连接而成。对于具有 n个策略组合的原博弈,重复T次的路径数为nT,重复博弈的求解即找出具有 稳定性的均衡路径。 4 得益:不同于一般的动态博弈,重复博弈的得益为各个阶段得益的加总。考 虑到时间的价值,需要引进“贴现系数”将未来的得益折算成当期得益的价 值。