博弈论的基本要素
图1-2 囚徒问题的支付矩阵
不坦白 (0, -10) (-1, -1)
坦白总是占优策略
占优均衡
囚
徒
坦白
1 不坦白
图1-2 囚徒问题的支付矩阵
囚徒2 坦白 (-8, -8) (-10, 0)
不坦白 (0, -10) (-1, -1)
占优均衡 由于矩阵的对称性,对囚徒2来说亦可得出类似结论
囚
坦白
博弈论对参与人做两个基本假设
1 理性的(rational)?
1—如果一个决策者在追逐其目标时能前后一致地做决策,就称他为rational。Roger B·Myerson (P2)
2—广义而言指的是一种行为方式,他同在给定条件或约束下最有效地实现预期目标相关。 具体地讲,理性含义如下:
博弈论对参与人做两个基本假设
博弈的策略式表述
常用G表示一个博弈 博弈模型的两种表示形式
❖ 策略式表述 (Strategic form), ❖ 扩展式表述(Extensive form) 本章主要介绍博弈的策略式表述
博弈的策略式表述
参与人集合 ❖ N人博弈的参与人集合,往往也记为N。参与人则记为i, i∈ N ❖ 参与人i的策略集,记为Si ,其中的一个特定策略,可记为si.有si ∈ Si.
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 机制设计 合作博弈
课程主要内容
完全信息静态博弈概念
概念:各参与人对彼此的策略集、支付函数有准确了解 博弈行为同时进行 一些实例
❖ 石头、剪子、布游戏 ❖ 彼此了解的两个厂商的价 ❖ 虽然决策不是在绝对时间意义上的“同时”, ❖ 但决策的时间先后差别跟博弈结果没有关系,也可看成是“同时进行的博弈”。 ❖ 如不同竞标单位作出的工程投标决策
博弈论的基本要素
通俗理解博弈论
博弈论是有关取舍策略的科学,它的方程式告诉你在与人接触中怎样得到最大的好处。 博弈论刚开始运用到经济领域,现在几乎在哪个科学领域都能看到它的身影,尤其是
那些涉及到人性与人的行为的科学。
博弈的基本要素
上述问题都有如下共同点 都有若干决策者,我们称之为参与人(players)
Consider a simple example of two allied armies situated on opposite hilltops waiting to attack their foe. Neither commander will attack unless he is sure that the other will attack at exactly the same time. The first commander sends a messenger to the other hilltop with the message "I plan to attack in the morning." The messenger's journey is perilous and he may die on the way to delivering the message.
博弈的策略式表述
❖ 对于给定的参与人i, i=1,2,…N, 卡氏积 S1×S2 … ×Si-1 × Si+1 …× Sn
❖ 表示除了参与人i外所有参与人所有策略的可能组合,通 常记为S-i; ❖ 于是所有参与人不同策略组合构成的策略空间可表示为 ❖ S=(Si , S-i)
博弈的策略式表述
❖ Si中的元素 si 表示参与人i的一个具体策略 ❖ 一旦确定了所有参与人的策略,便形成了一个博弈局势,表示为s=(s1, s2, … sN),
博弈的基本要素 参与人、各参与人的策略集、各参与人的支付函数,是博弈最重要的基本要素。
1:博弈的基本特征是一个参与人 的支付不仅取决于自己的策略选择,而且取决于所有其他参与人的策略选择;是策略组合的函 数。
2:效用是参与人真正关心的东西,参与人在博弈中的目标就是选择自己的策略以最大化 自己的效用函数。
博弈的策略式表述
❖ 实质上,图1-1已经完全表述了囚徒困境的策略式表述信息 ❖ 称图1-1为二人有限博弈的双矩阵 (bimatrix)表述
囚
坦白
徒
1
不坦白
囚徒2 坦白 (-8, -8) (-10, 0)
图1-1 囚徒问题的支付矩阵
不坦白 (0, -10) (-1, -1)
占优均衡
英文术语:Dominant-strategy Equilibrium 定义:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来
Definition of a Game
Must consider the strategic environment ➢ Who are the PLAYERS? ➢ What STRATEGIES are available? ➢ What are the PAYOFFS?
(Decision makers) (Feasible actions) (Objectives)
If he gets to the other hilltop and informs the other commander - can we be certain that both will attack in the morning? Note that both commanders now know the message, but the first cannot be sure that the second got the message. Thus, common knowledge implies not only that both know some piece of information, but can also be absolutely confident that the rest know it, and that the rest know that we know it, and so on.
❖ N-人博弈问题的决策者集合,习惯上也用N表示 ❖ 针对具体问题,参与人可以是
➢ 个人 ➢ 一个政府 ➢ 公司的整个董事会
对参与人的理解
博弈中的决策者。每个参与人的目标是选择一个期望最大化的策略, 要求博弈的决策主体具有行为选择能力,并且对博弈结果负责的能力,否则不是参与人。
众所周知的田忌赛马博弈,参与人是田忌和齐威王,孙膑仅仅是一个策略分析者。孙膑并 不是决策者,因而不是参与人. 虚拟参与人,又称为自然(nature)。自然在博弈的一些特定点按照给定的概率随机选择 行动。 虚拟参与人与正常的参与人之间在概念上的差异是:参与人有预先设定的效用函数,而虚 拟的参与人对于给定的结局,不存在任何效用感受。
博弈概念的理解
OPEC成员国选择其年产量; 两家制造商,一家做螺钉,一一家做螺帽,决定是采用美制标准还是公制标准; 公司董事会为其总经理设立一项期股安排; 一家电力公司在估计了未来10年对电力的需求后,决定是否购置一套新的发电机组; 明天出去玩,决定是否带伞; 诸葛亮和司马懿进行的空城计;
占优均衡 占优战略均衡:每个参与人的占优战略组合(如果存在的话)被称为占优战略均衡。
囚
坦白
徒
1
不坦白
囚徒2 坦白 (-8, -8) (-10, 0)
图1-2 囚徒问题的支付矩阵
不坦白 (0, -10) (-1, -1)
占优均衡 以囚徒1为例,无论囚徒2采取什么策略…
囚
坦白
徒
1
不坦白
囚徒2 坦白 (-8, -8) (-10, 0)
Rules of the game ➢ What is the time-frame for decisions? ➢ What is the nature of the conflict? ➢ What is the nature of interaction? ➢ What information is available?
博弈的基本要素
参与人都存在若干策略(strategies)或行动(actions) ❖ 参与人i的策略用si表示,参与人i的所有策略构成的集合称为策略集,记为Si , si∈ Si ❖ 注意行动与策略的区别
博弈的基本要素
支付(收益、效用)(payoff) ❖ 各参与人对所有参与人不同策略组合(strategy profile),构成了博弈的一个局势。 记为 s ❖ 参与人 i (i∈N)对局势s 有一个主观的偏好,可用一个函数表示这种偏好,这个 偏好函数称为参与人 i 的支付
共同知识趣题
有一群人围坐在一起,假定只有4个人,每人头上带着戴着一顶帽子,颜色为黑色和白色, 每个人看不到自己头上帽子的颜色,但能看到别人帽子的颜色. 为了分析的方便,我们 假定这四个人均戴的是黑色帽子。这时候,一个局外人来到他们集体当中,对他们说: “你们其中至少一个头戴的是黑色帽子。”当他说完这句话后,他问:“你们知道你 们头上的帽子颜色吗?”4个人都说不知道。这个局外人第二次问道:“你们知道你们 头上帽子的颜色吗?”4个人又都说不知道。局外人第三次问:“你们知道你们头上帽 子的颜色吗?”4个人又说不知道。局外人第四次问道:“你们知道你们头上帽子的颜 色吗?”这时4个人均说知道了。 你能知道这是为什么吗?
的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格 占优策略或占优策略。
占优策略 对于所有的s-i, si*称为参与人i的严格占优战略,如果满足: ui(si*,s-i)>ui(si',s-i) s-i, si' si*
占优均衡
占优均衡定义 ❖ 一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则 称该策略组合为该博弈的一个占优均衡。
s∈S。
博弈的策略式表述