博弈论的基本要素
17
18
19
20
21
An item of information in a game is common knowledge if all of the players know it and all of the players know that all other players know it and all other players know that all other players know that all other players know it, and so on. This is much more than simply saying that something is known by all, but also implies that the fact that it is known is also known by all, etc.
38
博弈的策略式表述
参与人i的效用函数
参与人 i的支付函数,是从博弈局势集 S=S1×S2 …× SN 到实数集R的一个映射,记为 ui(s1, s2, … s N),表示参与人i对局势s = (s1, s2, … sn)的偏好。
一个博弈可以表示为
G = {S1, … ,SN; u1, … ,uN, i ∈N}
25
博弈概念的理解
OPEC成员国选择其年产量;
两家制造商,一家做螺钉,一一家做螺帽, 决定是采用美制标准还是公制标准; 公司董事会为其总经理设立一项期股安排; 一家电力公司在估计了未来10年对电力的需 求后,决定是否购置一套新的发电机组; 明天出去玩,决定是否带伞; 诸葛亮和司马懿进行的空城计;
23
If he gets to the other hilltop and informs the other commander - can we be certain that both will attack in the morning? Note that both commanders now know the message, but the first cannot be sure that the second got the message. Thus, common knowledge implies not only that both know some piece of information, but can also be absolutely confident that the rest know it, and that the rest know that we know it, and so on.
本章主要介绍博弈的策略式表述
35
博弈的策略式表述
参与人集合
N人博弈的参与人集合,往往也记为N。参 与人则记为i, i∈ N 参与人i的策略集,记为Si ,其中的一个特定 策略,可记为si.有si ∈ Si.
36
博弈的策略式表述
对于给定的参与人i, i=1,2,…N, 卡氏积
S1×S2 … ×Si-1 × Si+1 …× Sn
14
15
博弈的基本要素
参与人、各参与人的策略集、各参与人 的支付函数,是博弈最重要的基本要素。
16
1:博弈的基本特征是一个参与人 的支付不仅取决于自己的策略选择,而且取 决于所有其他参与人的策略选择;是策略组 合的函数。
2:效用是参与人真正关心的东西,参 与人在博弈中的目标就是选择自己的策略以 最大化自己的效用函数。
(Feasible actions) (Objectives)
Rules of the game
What is the time-frame for decisions? What is the nature of the conflict? What is the nature of interaction? What information is available?
图1-1
囚徒问题的支付矩阵
博弈的策略式表述
实质上,图1-1已经完全表述了囚徒困境的策略式 表述信息
称图1-1为二人有限博弈的双矩阵 (bimatrix)表述
囚徒2 坦 囚 徒 坦 白 1 不坦白 41 白 不坦白 (0, -10) (-1, -1) (-8, -8) (-10, 0)
图1-1
这就是博弈的策略式表述
39
博弈的策略式表述
例 写出囚徒问题的策略式表述
参与人集合N={囚徒1,囚徒2} 参与人的策略集S1=S2= {坦白,不坦白} 各参与人的支付,可用图1-1表示。 囚徒2 坦 囚 徒 坦 白 1 不坦白 40 白 不坦白 (0, -10) (-1, -1) (-8, -8) (-10, 0)
22
Consider a simple example of two allied armies situated on opposite hilltops waiting to attack their foe. Neither commander will attack unless he is sure that the other will attack at exactly the same time. The first commander sends a messenger to the other hilltop with the message "I plan to attack in the morning." The messenger's journey is perilous and he may die on the way to delivering the message.
囚徒问题的支付矩阵
占优均衡
英文术语:Dominant-strategy Equilibrium
定义:在博弈中如果不管其他参与人选 择什么策略,一个参与人的某个策略给 他带来的支付值始终高于其他策略,或 至少不劣于其他策略,则称该策略为该 参与人的严格占优策略或占优策略。
42
占优策略
对于所有的s-i, si*称为参与人i的严格占 优战略,如果满足:
上一讲内容回顾 博弈论用处(解释、预测和提出建议) 猜数游戏----博弈关注的(interdependence) 博弈论发展简史 囚徒困境 智猪博弈 商业中心区(CBD)的形成 动态博弈与承诺行动
信息不对称(二手车市场)
混合策略
机制设计(定价策略、制度设计等)
博弈论对参与人做两个基本假设 1 理性的(rational)? 1—如果一个决策者在追逐其目标时能 前后一致地做决策,就称他为rational。 Roger B· Myerson (P2) 2—广义而言指的是一种行为方式,他 同在给定条件或约束下最有效地实现预期目 标相关。具体地讲,理性含义如下:
27
28
29
30
31
课程主要内容
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 机制设计 合作博弈
32
完全信息静态博弈概念
概念:各参与人对彼此的策略集、支付 函数有准确了解
博弈行为同时进行 一些实例
石头、剪子、布游戏
彼此了解的两个厂商的价格战
33
完全信息静态博弈概念
ui(si*,s-i)>ui(si',s-i) s-i, si' si*
43
占优均衡
占优均衡定义
一个博弈的某个策略组合中,如果对应的 所有策略都是各参与人的占优策略,则称 该策略组合为该博弈的一个占优均衡。
44
占优均衡
占优战略均衡:每个参与人的占优战略组合(如果存 在的话)被称为占优战略均衡。
囚徒2 坦 囚 徒 坦 白 1 不坦白 白 不坦白 (0, -10) (-8, -8)
24
共同知识趣题
有一群人围坐在一起,假定只有4个人,每人头上带着戴 着一顶帽子,颜色为黑色和白色,每个人看不到自己 头上帽子的颜色,但能看到别人帽子的颜色. 为了分析 的方便,我们假定这四个人均戴的是黑色帽子。这时 候,一个局外人来到他们集体当中,对他们说:“你 们其中至少一个头戴的是黑色帽子。”当他说完这句 话后,他问:“你们知道你们头上的帽子颜色吗?”4 个人都说不知道。这个局外人第二次问道:“你们知 道你们头上帽子的颜色吗?”4个人又都说不知道。局 外人第三次问:“你们知道你们头上帽子的颜色 吗?”4个人又说不知道。局外人第四次问道:“你们 知道你们头上帽子的颜色吗?”这时4个人均说知道了。 你能知道这是为什么吗?
有些实际博弈
虽然决策不是在绝对时间意义上的“同 时”, 但决策的时间先后差别跟博弈结果没有关 系,也可看成是“同时进行的博弈”。
如不同竞标单位作出的工程投标决策
34
博弈的策略式表述
常用G表示一个博弈
博弈模型的两种表示形式
策略式表述 (Strategic form),
扩展式表述(Extensive form)
个人
一个政府 公司的整个董事会 4
5
6
对参与人的理解
博弈中的决策者。每个参与人的目标是选择一个期望最 大化的策略, 要求博弈的决策主体具有行为选择能力,并且对博弈结 果负责的能力,否则不是参与人。众所周知的田忌赛马 博弈,参与人是田忌和齐威王,孙膑仅仅是一个策略分 析者。孙膑并不是决策者,因而不是参与人. 虚拟参与人,又称为自然(nature)。自然在博弈的一 些特定点按照给定的概率随机选择行动。 虚拟参与人与正常的参与人之间在概念上的差异是:参 与人有预先设定的效用函数,而虚拟的参与人对于给定 的结局,不存在任何效用感受。 7
26
Definition of a Game