2 同时决策博弈(1)
的情形。如,上下游企业。 • 在二人博弈中,个人追求自身利益最大化的行为, 往往并不能导致社会的最大利益,也常常不能真 正实现个人自身的最大利益。出现 “个人理性” 与“集体理性”的冲突。
– 如,卡特尔结盟博弈、公共产品的供给、军备竞争及 经济改革等。
2.策略
• 策略:参与博弈的各局中人在进行决策时,可以 选择的方法、做法或经济活动的水平、量值等。 是局中人的决策内容。
左 1 上 2 2
局中人2 中 5 0
右 3
局中人1
下 1
7
0
2
3
2
左
局中人2 中 1 5
2 7 7 0 3 0
右
3
上 2 局中人1 下 1
对于对手的每一个具体的策略选择,相对优势策略总是有的, 但是不必唯一。
2
• 因为“全局优势策略一定是相对优势策 略”,所以用“劣势策略消去法’’做出 来的“优势策略均衡”,都可以用 “相对 优势策略划线法”做出来。 • 试:囚徒困境 • 公明博弈
个纳什均衡。
• 移动的方向要注意:
– 例如:情侣博弈的(2,1)。
论证否命题
• 一个策略组合要成为博弈的纳什均衡,必须在这
个策略组合下所有博弈参与人都没有单独改变策
略选择的动机。 • 但要论证一个策略组合不是博弈的纳什均衡,只 要指出在这个策略组合下有一个博弈参与人有单 独改变策略选择的动机,就已经足够。
2-5 相对优势策略和纳什均衡
• 相对优势策略
– 与绝对的优势策略不同,局中人的相对优势策 略,是在他的对手选定某个具体策略的条件下 他的优势策略。 – 优劣的相对性,是相对对手的具体策略选择而 言的。 – 在多人博弈的情况下,局中人的相对优势策略, 是在他的每个对手都选定各自的具体策略的条 件下他的优势策人有限博弈的每个局中人,找出 他相对于对手的每种可能的策略选择的相对优势策 略,并且在对手的这种策略选择和自己的相对优势 策略组成的具体的策略对局时自己的得益之下,划 一短线。当这样做完以后,矩阵中两个支付数字下 面都划了线的格子所表征的策略对局,就是这个博 弈的纳什均衡。
情侣博弈
男 足球 2
女 足球 1 0 -1 芭蕾 -1 2 1 芭蕾 0
纳什均衡: 足球,足球;芭蕾,芭蕾 先动优势 • 情侣博弈中,双方都没有严格优势策略和严格劣势策略。 • “纳什均衡”指明了情侣博弈等一大类局中人各策略之间 不存在绝对优劣关系的博弈的可能的结局。 • “相对优势策略”的组合
纳什均衡
• 局中人单独改变策略不会得到好处的对局即策略 组合,就叫做纳什均衡。 • 注意:纳什均衡是对局,是双方策略的组合,而 不是这些对局或者策略组合下相应的支付。
检验纳什均衡
• 盯住一个格子,如果这个格子里面右上方的数字 向右或者向左移动都不变大、这个格子里面左下 方的数字向上或者向下移动也都不变大,那么这 个格子代表的策略组合,就是这个二人博弈的一
3.支付
• 在每一个博弈中,给定一个策略组合,参与博弈 的每一个局中人都会有相应的支付。
• 支付,是指每个局中人从博弈中获得的利益,它 体现每个参与博弈的局中人的追求,也是他们行 为和决策的主要依据。 • 支付本身可以是利润、收入、量化的效用、社会 效益、福利等。
• 支付可取正值,也可取负值,取正值表示得益。
– 一次一次把认定的劣势策略消去,其中有些劣势策略 可以是弱劣势策略。
• 一个博弈的某个策略组合中的所有策略都是各个 局中人各自的优势策略,称为该博弈的一个优势 策略均衡。
寻找优势策略均衡求解的局限
• 关注于寻求优势策略试图得到优势策略均衡,往
往会漏掉博弈的一些可能的结果。如,公明博弈
• 一些博弈根本没有优势策略均衡。
需要说明的两点
• 随便用什么方法来标记都可以。 • 原则上,相对优势策略标记法适用于任何 有限博弈,即可用于多人有限博弈。
2-4 优势策略均衡
例子:公明博弈
• 装修行要2000元,可赚1000元; • 公明的保留价格正好就是2000元; • 以1200元成交,装修行赚了600元,公明省 了800元。
• 弱劣势策略——弱优势策略
• “严格优势策略”和“弱优势策略”统地称为“优 势策略” • “严格劣势策略”和“弱劣势策略”统地称为 “劣势策略”。 • “严格劣势策略逐次消去法”——“普通劣势策略 消去法”
• 二人有限博弈由它的一对支付矩阵A和B决定。 • 用一对支付矩阵(A,B)来表述一个博弈的时 候,称这个博弈被表示为双矩阵形式 (bimatrix form)。
有限博弈
• 局中人数目有限并且每个局中人可以选择 的(纯)策略的数目也有限的博弈,叫做有限 博弈(finite games)。 • 判断:
• 严格优势策略均衡
例子
L 0
T 局中人1 M B 0 2 0 2 1 2 0 4 5 1 1 3 3 局中人2 C
R 0
3 0
3
• 并不是每一个博弈都存在严格优势策略。
– 博弈并不一定存在严格优势策略和与之相对的严格劣
势策略,严格劣势策略逐次消去法在使用上有局限性。
• 弱优势策略:不管其他局中人选择什么策略,一 个局中人选择他的某个策略给他带来的支付(仅仅 只是)不低于他选择任何其他策略。
第二章 同时决策博弈(1)
• 2-1 二人同时博弈的三要素 • 2-2 支付矩阵 • 2-3 优势策略 • 2-4 优势策略均衡 • 2-5相对优势策略和纳什均衡 • 2-6相对优势策略划线法
2-1 二人同时博弈的三要素
• 博弈的三要素
– 局中人 – 策略/行动 – 支付/得益
1.局中人
• 局中人:一般是指博弈中独立决策、独立 承担博弈结果的个人或组织。 • 在不完全信息情形中,有时需要引入一个 “虚拟局中人”(pseudo-player),如,上 帝、老天爷、大自然等等。 • i=l,2,…,n表示局中人
S1 S2 S3 [0,1]
• 支付函数为:
u ( x yz 1 x, y , z) u( x yz 2 x, y , z) u( xy z 3 x, y , z)
2-3 优势策略
• 优势策略(dominant strategy)
– 在某个博弈中,如果不管其他局中人选择什么 策略,一个局中人的某个策略选择给他带来的 支付始终高于其他策略选择,或者至少不低于 其他策略选择,这样,只要这个局中人是一个 理性的局中人,那么他必定愿意选择这个策略。 – 优势策略可分为:
• 用 u i 表示局中人i的支付,它是策略组合 s 的函数。
• 支付向量
例子
• 石头,剪刀,布
– 策略集 – 策略组合 – 支付向量(1赢,0平,-1输)
2-2 支付矩阵
• 试写出“石头剪刀布”支付矩阵
二人博弈的一般性矩阵表示
• 双矩阵分解为两个支付矩阵
T.C.Schelling的贡献
2-6 相对优势策略划线法
• 对于策略之间只存在相对优劣关系的二人博弈问
题,如果策略集是有限的,比如局中人1有m个策
略选择,局中人2有n个策略选择,那么我们可以 写下m行n列共m×n个格子的支付矩阵。那么, 可以采取“相对优势策略划线法”(Method of underlining relatively dominant-strategies),找出 博弈的纳什均衡。
0大于-1
抵赖是B的严格劣策略
抵赖是A的严 格劣策略
严格优势(劣势)策略
严格劣势策略逐次消去法
• 严格劣势策略逐次消去法(Iterated Elimination of Strictly Dominated Strategies)
– 在分析一个局中人的决策行为时,首先把一个严格劣 势策略从该局中人的策略集中去掉,然后在剩下的策 略范围内,试图再找出这个局中人或者别的局中人的 一个严格劣势策略,并将它去掉。不断重复这一过程, 直到对每一个局中人而言,再也找不出严格劣势策略 为止,简记为IESDS。
• 整体的严格优势策略(strictly dominant strategy) 如: 囚徒困境 • 弱优势策略(weakly dominant strategy)
严格劣势策略
案例-囚徒困境
囚徒A
坦白
囚徒 B
抵赖
坦白 抵赖
-8,-8
-10,0
-8大于-10
0,-10
-1,-1
-8大于-10 0大于-1
• 在不同的博弈中,可供局中人选择的策略的数目 很不相同。
– 囚徒困境 – 古诺竞争的产量决策
数学表示
• 一般用 s i 表示局中人i可以选择的一个特定策略, 而 S i 表示局中人i可以选择的所有策略所构成的集 合,称为策略集(strategy set),也称为策略空间 (strategy space)。 • n个局中人每人选择一个特定的策略,则n维向量 s =( s1,… , s n )称为一个策略组合。 • 例:囚徒,古诺
– 诺曼底战役模拟博弈 – 囚徒困境博弈 – 企业古诺产量博弈
三人博弈
• 例子
– 局中人:A、B和C – 每个局中人有三种策略:数字1,2,3 – 支付:每个局中人得到4乘以三人中所选的数 字中的最小者,再减去自己所选的数字。
正规型(策略型)博弈定义
例子
• 考虑三个局中人参加的一个策略型博弈,三个局 中人的策略集一样,都是[0, 1]区间:
• N={1,2,…,n}表示局中人的集合。
• 博弈问题的根本特征是博弈本身具有策略 依存性。 • 博弈中局中人的个数是博弈结构的关键。
• 根据局中人的个数博弈可分为“二人博弈” 和“多人博弈”。
需要注意的两点
• 在二人博弈中,局中人双方的利益并不总是相互
完全冲突的,有时候也会出现双方利益方向一致