当前位置:文档之家› 1博弈论概述2完全信息静态博弈3完全信息动态博弈4

1博弈论概述2完全信息静态博弈3完全信息动态博弈4


②从局中人行动的先后顺序可划分为静 态博弈(Static game)和动态博弈 (dynamic game)。静态博弈是指在博弈中, 局中人同时选择行动或虽非同时行动但后行 动者并不知道先行动者采取了什么具体行动。 动态博弈是指局中人的行动有先后顺序,且 后行动者能够观察到先行动者所选择的行动。
③从局中人是否具有有关其他参与人 (对手)的特征、策略空间及支付函数方面 的知识的角度,可划分为完全信息博弈
合作博弈和非合作博弈的区别在于人们的行动为相互 作用时,当事人能否达成一个具有约束力(binding agreement)的协议。若有,就是合作博弈;否则就是非合 作博弈。例如,两个寡头企业,如果他们之间达成一个协议, 联合最大化垄断利润,且各自按该协议生产,即是合作博弈。 其面临的问题是如何分享合作带来的剩余。但若两个企业间 的协议不具有约束力,即没有哪一方能强制另一方遵守该协 议,每个企业都只选择自己的最优产量(或价格),则是非 合作博弈。另外,合作博弈强调的是团体理性、效率、公正 和公平。非合作博弈强调的是个人理性、个人最优决策,其 结果可能是有效率的,也可能是无效率的。
一、占优策略均衡
通常情况下,每个局中人的支付是博弈中所有参与 人策略的函数,故每个局中人的最优策略选择依赖于所 有其他参与人的策略选择。但在一些特殊博弈中,一个 参与人的最优策略选择可能并不依赖于其他参与人的策 略选择,即无论其他参与人选择什么策略,他的最优策 略是唯一的,这种最优策略被称为“占优策略” (dominant strategy)。 例:“囚徒困境” 囚徒困境是博弈论中的经典案例。该故事讲的是,两 个嫌疑犯作案后被警察抓住,分别被关在不同的房间里 进行审讯。警察知道两人有罪,但缺乏有力的证据,除 非两人之中有一个坦白。警察告诉每个人,他们的可选 择的策略与支付如下表:
第二节 完全信息静态博弈
“完全信息”指的是每个局中人对所有其他参与人的特 征(策略空间、支付函数等)有完全的了解,“静态”指的 是所有局中人同时选择行动且只选择一次。纳什均衡是完全 信息静态博弈解的一般概念,也是所有其他类型博弈解的基 本要求。本节先讨论纳什均衡的特殊情况,然后讨论纳什均 衡的一般概念。 在博弈论里,一个博弈可以有两种表述方式:一种是策 略式(strategic form representation)表述,另一种是 扩展式( extensive form representation )表述。前者 适合于讨论静态博弈,后者适合于讨论动态博弈。在策略式 表述中,所有参与人同时选择各自的策略,所有参与人选择 的策略一起决定每个参与人的支付。
博弈论的基本概念包括:局中人、策略、支付。
①局中人(Player):局中人是指在博弈中选择行动以最 大化自身效用的决策主体。可能是个ห้องสมุดไป่ตู้或团体(如国家、企 业等)。
②策略或策略空间(Strategy):策略是局中人选 择行动的规则,它规定局中人如何对其他人的行动作 出反应,即在每种可能的情况下应该如何行动。它与 行动不同,行动是局中人的决策变量。如“人不犯我, 我不犯人;人若犯我,我必犯人”是一种策略,而 “犯”与“不犯”是两种不同的行动,策略规定了什 么时候选择“犯”什么时候选择“不犯”。局中人可 选择的策略的全体构成了策略空间(或策略集)。 ③支付(Payoff)(支付函数与支付矩阵):博弈 论中,可用数值表示各局中人从博弈中所获得的收益 或效用水平,该数值称为支付。支付依赖于各个局中 人所作出的策略,这种收益与策略的依赖关系构成了 支付函数。参与博弈的多个局中人的收益可用一个矩 阵或框图表示,这种矩阵或框图叫做收益矩阵。
John F. Nash Jr
博弈论提供了一种研究人类理性行 为的通用方法,运用这些方法可以更为清 晰完整地分析各种社会力量冲突和合作的 形势,具体分析人与人之间在利益相互制 约下理性主体的策略选择行为及相应结局。 博弈论强调在既定约束条件下追求效用最 大化(服从微观经济学的一般分析方法)。 同时,信息和时序问题成为博弈论的两个
除此之外,博弈论中的基本概念还包括: 行动、信息、结果和均衡。它们关系是:行 动是局中人的决策变量;信息是局中人在进 行博弈时有关其他局中人的特征和行动的知 识;结果是博弈分析者感兴趣的要素的集合; 均衡是所有局中人的最优策略或行动的集合。
一、博弈论的基本概念
①根据博弈者选择的策略,博弈论可划 分为合作博弈与非合作博弈。纳什 (Nash)、泽尔腾(Selten)和海萨尼 (Harsanyi)(1994诺贝尔经济学奖获得 者)的主要贡献在于非合作博弈方面,而 且现在大多数经济学家论及博弈时,也主 要是指非合作博弈。
B
坦白
抵赖
A
坦白 抵赖
-8,-8 -10,0
0,-10 -1,-1
在该博弈中,每个囚徒有两种可能选择的策略:
坦白和抵赖。显然,无论同伙选择什么策略, 每个囚徒的最优策略都是“坦白”。如,B选 择坦白,若A选择坦白时支付为-8,选择抵赖 时支付为-10,因而坦白比抵赖好;若B选择抵 赖,A坦白时的支付为0,抵赖时为-1,因而坦
一、博弈论的基本概念
博弈论研究人与人之间相互“斗智”的形式和结果。 当经济主体间的利益存在冲突时,一方所获得的利益不仅取 决于自己所采取的行动,而且也取决于其他主体采取的行动 或对自己行动的反应。博弈论就是描述在这种形势下各方理 性地选择自己的行动所实现的结果,分析各决策主体的行为 发生相互作用时的决策以及这种决策的均衡问题。
第十章
§1.博弈论概述
博弈论
§2.完全信息静态博弈
§3.完全信息动态博弈
§4.不完全信息静态博弈 §5.不完全信息动态博弈
第一节
博弈论(the
博弈论概述
Game Theory)也就是运筹学 中的对策论,“是关于策略相互作用的理 论”,研究两个或两个以上参加者在对 抗性或竞争性局势下如何采取行动,如 何作出有利于己方的决策及其均衡问题。 对策思想最早产生于我国古代。 对策思想明确地应用于经济领域,始于 Cournot (1838), Bertrand (1883), Edgeworth (1925)等人关于寡头竞争、 产量与价格垄断、产品交易行为的研究。
相关主题