第一章 完全信息静态博弈
规定参与人在什么时候选择什么行动。
一般地,用si表示第i个参与人的一个特定战略,Si={si} 表示第i个参与人的所有可选择的战略的集合 (strategy set)。如果n个参与人每人选择一个战略, n维向量s=(s1,…, si, …sn)称为一个战略组合 ( strategy profile)。
29
2.数学描述
令si’和si’’是参与人i可选择的两个战略 s S , s S
' i i '' i i
如果对于任意的其他参与人的战略组合s-i ,参与人i 从选择si’得到的支付严格小于从选择si’’得到的支付, 即
u (s , s ) u (s , s )si
' i i i '' i i i
囚徒 2 坦 白 坦 白 囚 坦 白 徒 1 抵赖 不坦白 -8, -8 -10, 0 抵赖 不坦白 0, -10 -1, -1
囚徒1:坦白 囚徒2:坦白
两个嫌疑犯的支付矩阵 两个罪犯的支付矩阵
22
1.2纳什均衡
2.占优战略
一般地, 如果对应所有的s-i ,si*是i的严格最优选 择,即:
u (s , s ) u (s , s )
11
6.结果(outcome)
结果是博弈分析者感兴趣的所有东西,如均衡战略组
合,均衡行动组合,均衡支付组合等。
7.均衡(equilibrium)
均衡是所有参与人的最优战略的组合,记为
s*=(s1*,…, si*, …sn*),其中, si*是第i个参与人在均 衡情况下的最优战略,它是i的所有可能的战略中使ui 或Eui最大化的战略。
33
关于智猪博弈的讨论
(1)现实中的例子 小股东搭大股东的便车、股市上的“跟庄”、小 企业对大企业的模仿,公共产品的供给,经济改 革当中存在的问题等都是智猪博弈。 (2)可否改变智猪博弈的结局?
第一篇 非合作博弈理论
1
举例:房地产开发博弈
P32
何种情形适宜用博弈来模型化?
2
第一章 完全信息静态博弈
1、基本概念及战略式表述 2、NASH均衡 3、NASH均衡的应用 4、混合战略NASH均衡 5、NASH均衡的存在性和多重性的讨论
3
1.1博弈论的基本概念及战略式表述
一、基本概念
博弈论的基本概念包括参与人、行动、信息、 战略、支付、结果和均衡,其中,参与人、战略 和支付是描述一个博弈所需要的最少的要素,参 与人、行动和结果统称为博弈规则(the rule of the game ),博弈分析的目的是使用博弈规则预 测均衡。
16
1.2 纳什均衡
诺贝尔经济学家萨谬尔 森:一只鹦鹉也可以成 为经济学家,只要它学 会两个词:供给和需求; 博弈论专家坎多瑞 (Kandori):要成为现 代经济学家,这只鹦鹉 必须再多学一个词,那 就是“纳什均衡”。
17
1.2 纳什均衡
完全信息:每个参与人对所有其他参与人的特
征(战略空间、支付函数等)有完全的了解;
7
共同知识(common knowledge)是一群体人们
之间对某个事实“知道”的关系,即指“所有参与 人知道,所有参与人知道所有参与人知道,所有参 与人知道所有参与人知道所有参与人知道……” 共同知识是博弈论中一个非常强的假定。 寓言:村庄的大屠杀。
8
4.战略(strategies)
战略是参与人在给定信息集的情况下的行动规则,它
26
合作产品研发博弈
基本模型:
欧姆尼 欧姆尼:投入 微型设备:投入 囚 微型 徒 设备 1 投入 留一手 坦 白 投入 5,5 -8, -8 -10, 0 3,2 留一手 不坦白 2,3 0, -10 -1, -1 1,1
占优战略均衡也是合作解。
27
1.2纳什均衡
二、重复剔除的占优均衡
1.举例 智猪博弈
我们说战略si’严格劣于战略si’’。通常,si’称为相对于 si’’的劣战略;对应地, si’’ 称为相对于si’的占优战略。
30
' 如果对于所有的s-i , i i i
,且对 于某些s-i,严格不等式成立,称 si’弱劣于战略si’’, si’’ 称为相对于si’的弱占优战略。 如果战略组合s*=(s1*,…,sn*)是重复剔除劣战略 后剩下的唯一的战略组合,我们称其为重复剔除的占 优均衡(iterated dominance equilibrium )。如果这 种唯一的战略组合是存在的,我们说该博弈是重复剔 除占优可解的。
小猪 按 按 3, 1 7, -1 支付矩阵 等待 2, 4 0,0
基本模型:重复剔除求均衡解
大猪
大猪:按 小猪:等待
等待
这是一个“多劳不多得,少劳不少得”的均衡。
28
1.2纳什均衡
重复剔除严格劣战略的思路:
1)找出某个参与人的劣战略,剔除该劣战略,重新 构造一个不包含已剔除战略的新博弈; 2)再剔除新博弈中的某个参与人的劣战略; 3)继续该过程,直到只剩下一个唯一的战略组合。 这个唯一剩下的战略组合就是该博弈的均衡解,称 为“重复剔出的占优均衡”。
25
社会两难与博弈的合作解
社会两难是一种存在占优战略均衡的博弈,并 且参与者采用这种均衡战略的收益比采用非均 衡战略的收益差。 合作解与非合作解;占优战略均衡通常是一种 非合作解。 占优战略的存在以及它与合作解相悖的事实是 导致社会两难的根本原因。 合约可以为解决社会两难问题提供一个出路。
静态:所有参与人同时选择行动,或者尽管参与
人行动的选择有先后顺序,但后行动的人不知道先 采取行动的人选择的是什么行动。 在完全信息静态博弈中,由于每个人是在不知其他 人行动的情况下选择自己的行动,战略在这里等同 于行动。
18
博弈分析的目的
是预测博弈的均衡,即给定每个参与人都是理性的,每个 参与人都知道每个参与人都是理性的,什么是每个参与人的最 优战略?什么是所有参与人的最优战略组合?纳什均衡是完全 信息静态博弈解的一般概念,也是所有其他类型博弈解的基本 要求。 Nash均衡是指这样一个战略组合,为了极大化自己效用, 每一个局中人所采取的战略一定应该是关于其他局中人所采取 战略的最佳反应。因此没有一个局中人会轻率地偏离这个战略 组合而使自己蒙受损失。
4
1、参与人(players) 参与人指一个博弈中的决策主体,他的目的是 通过选择行动(或战略)以最大化自己的支付(效 用)水平。 其构成:自然人、团体; 虚拟参与人:自然,“自然”指决定外生的随 机变量的概率分布的机制。 一般用i=1,2,3…,n代表参与人;N代表“自 然”。
5
2.行动(actions or moves) 行动是参与人在博弈某个时点的决策变量。 一般地,用ai表示第i个参与人的一个特定行动, Ai={ai} 表示可供i选择的所有行动的集合(action set)。 行动组合(action profile)指在n人博弈中,n个参与 人的行动的有序集a=(a1,…, ai, ….an)。 行动的顺序(the order of play):在博弈中行动顺序 是至关重要的,不同的顺序构成新的博弈。
31
u (s , s ) u (s , s )si
'' i i i
严格劣战略/弱劣战略
基本模型:
坦 白 M1 囚 参与人A 徒 1 N1 N2 1,10 -8, -8 -10, 0 0,10 参与人B M2 不坦白 2,12 0, -10 1,10 -1, -1 1,11
32
3.注意
1)重复剔除劣战略的均衡结果与劣战略的剔除顺序是否有 关? 2)重复剔除的占优均衡要求“理性”是参与人的共同知识; 3)运用重复剔除严格劣战略这种方法对博弈结果的预测经 常是不准确的; 4)有些博弈是无法通过重复剔除劣战略的方法找到均衡解 的; 5)应用重复剔除方法时,一个战略的优与劣可能是相对于 一个特定的战略而言。
13
注意: 区分博弈论中的均衡概念与一般均衡理论中的 均衡概念; 区分博弈论中均衡和均衡结果两个概念。
14
1.1博弈论的基本概念及战略式表述
二、博弈的战略式表述
博弈论中,一个博弈可以用两种不同的方式来表述: 一种是战略式(更适合于静态博弈),另一种是扩 展式(更适合于动态博弈)。 战略式表述(strategic form representation)又称 为标准式表述,在这种表述中,所有参与人同时选 择各自的战略,所有参与人选择的战略一起决定每 个参与人的支付。
* i i i ' i i i
s s
' i
* i
称si*为参与人i的(严格)占优战略,对应地,所有 ' * 的 si si 称为劣战略(dominated strategies略均衡
在博弈的战略式表述中,如果对于所有的i,si*是i的 占优战略,那么,战略组合s*=(s1*,…,si*, …, sn*),称为占优战略均衡(dominant-strategy equilibrium) 占优战略均衡是可以预测到的唯一的均衡; 在囚徒困境博弈中,(坦白,坦白)是占优战略均 衡。
24
总结:
博弈论分析的关键步骤:找出在别人选择既定的 情况下自己的最优反应战略。 最优反应:在其他参与者已经选定战略,或者可 以预计到他们将选择何种战略时,能够给该参与 者带来最大收益的战略。 囚徒困境反映了一个深刻的问题,即个人理性与 集体理性的冲突。 寡头竞争,军备竞赛,团队生产中劳动的供给, 公共产品的供给等问题都是囚徒困境。 占优战略均衡不要求“理性”是共同知识。 思考:若两囚犯建立攻守同盟会改变均衡解吗?
12
用s-i=(s1,…, si-1, si+1 …sn)表示由除i之外的所有参