当前位置：文档之家› 2 同时决策博弈(1)

2 同时决策博弈(1)

的情形。如，上下游企业。 • 在二人博弈中，个人追求自身利益最大化的行为，往往并不能导致社会的最大利益，也常常不能真正实现个人自身的最大利益。出现 “个人理性” 与“集体理性”的冲突。
– 如，卡特尔结盟博弈、公共产品的供给、军备竞争及经济改革等。
2.策略
• 策略：参与博弈的各局中人在进行决策时，可以选择的方法、做法或经济活动的水平、量值等。是局中人的决策内容。
左 1 上 2 2
局中人2 中 5 0
右 3
局中人1
下 1
7
0
2
3
2
左
局中人2 中 1 5
2 7 7 0 3 0
右
3
上 2 局中人1 下 1
对于对手的每一个具体的策略选择，相对优势策略总是有的，但是不必唯一。
2
• 因为“全局优势策略一定是相对优势策略”，所以用“劣势策略消去法’’做出来的“优势策略均衡”，都可以用 “相对优势策略划线法”做出来。 • 试：囚徒困境 • 公明博弈
个纳什均衡。
• 移动的方向要注意：
– 例如：情侣博弈的（2，1）。
论证否命题
• 一个策略组合要成为博弈的纳什均衡，必须在这
个策略组合下所有博弈参与人都没有单独改变策
略选择的动机。 • 但要论证一个策略组合不是博弈的纳什均衡，只要指出在这个策略组合下有一个博弈参与人有单独改变策略选择的动机，就已经足够。
2-5 相对优势策略和纳什均衡
• 相对优势策略
– 与绝对的优势策略不同，局中人的相对优势策略，是在他的对手选定某个具体策略的条件下他的优势策略。 – 优劣的相对性，是相对对手的具体策略选择而言的。 – 在多人博弈的情况下，局中人的相对优势策略，是在他的每个对手都选定各自的具体策略的条件下他的优势策人有限博弈的每个局中人，找出他相对于对手的每种可能的策略选择的相对优势策略，并且在对手的这种策略选择和自己的相对优势策略组成的具体的策略对局时自己的得益之下，划一短线。当这样做完以后，矩阵中两个支付数字下面都划了线的格子所表征的策略对局，就是这个博弈的纳什均衡。
情侣博弈
男足球 2
女足球 1 0 -1 芭蕾 -1 2 1 芭蕾 0
纳什均衡：足球，足球；芭蕾，芭蕾先动优势 • 情侣博弈中，双方都没有严格优势策略和严格劣势策略。 • “纳什均衡”指明了情侣博弈等一大类局中人各策略之间不存在绝对优劣关系的博弈的可能的结局。 • “相对优势策略”的组合
纳什均衡
• 局中人单独改变策略不会得到好处的对局即策略组合，就叫做纳什均衡。 • 注意：纳什均衡是对局，是双方策略的组合，而不是这些对局或者策略组合下相应的支付。
检验纳什均衡
• 盯住一个格子，如果这个格子里面右上方的数字向右或者向左移动都不变大、这个格子里面左下方的数字向上或者向下移动也都不变大，那么这个格子代表的策略组合，就是这个二人博弈的一
3.支付
• 在每一个博弈中，给定一个策略组合，参与博弈的每一个局中人都会有相应的支付。
• 支付，是指每个局中人从博弈中获得的利益，它体现每个参与博弈的局中人的追求，也是他们行为和决策的主要依据。 • 支付本身可以是利润、收入、量化的效用、社会效益、福利等。
• 支付可取正值，也可取负值，取正值表示得益。
– 一次一次把认定的劣势策略消去，其中有些劣势策略可以是弱劣势策略。
• 一个博弈的某个策略组合中的所有策略都是各个局中人各自的优势策略，称为该博弈的一个优势策略均衡。
寻找优势策略均衡求解的局限
• 关注于寻求优势策略试图得到优势策略均衡，往
往会漏掉博弈的一些可能的结果。如，公明博弈
• 一些博弈根本没有优势策略均衡。
需要说明的两点
• 随便用什么方法来标记都可以。 • 原则上，相对优势策略标记法适用于任何有限博弈，即可用于多人有限博弈。
2-4 优势策略均衡
例子：公明博弈
• 装修行要2000元，可赚1000元； • 公明的保留价格正好就是2000元； • 以1200元成交，装修行赚了600元，公明省了800元。
• 弱劣势策略——弱优势策略
• “严格优势策略”和“弱优势策略”统地称为“优势策略” • “严格劣势策略”和“弱劣势策略”统地称为 “劣势策略”。 • “严格劣势策略逐次消去法”——“普通劣势策略消去法”
• 二人有限博弈由它的一对支付矩阵A和B决定。 • 用一对支付矩阵(A，B)来表述一个博弈的时候，称这个博弈被表示为双矩阵形式 (bimatrix form)。
有限博弈
• 局中人数目有限并且每个局中人可以选择的(纯)策略的数目也有限的博弈，叫做有限博弈(finite games)。 • 判断：
• 严格优势策略均衡
例子
L 0
T 局中人1 M B 0 2 0 2 1 2 0 4 5 1 1 3 3 局中人2 C
R 0
3 0
3
• 并不是每一个博弈都存在严格优势策略。
– 博弈并不一定存在严格优势策略和与之相对的严格劣
势策略，严格劣势策略逐次消去法在使用上有局限性。
• 弱优势策略：不管其他局中人选择什么策略，一个局中人选择他的某个策略给他带来的支付(仅仅只是)不低于他选择任何其他策略。
第二章同时决策博弈（1）
• 2-1 二人同时博弈的三要素 • 2-2 支付矩阵 • 2-3 优势策略 • 2-4 优势策略均衡 • 2-5相对优势策略和纳什均衡 • 2-6相对优势策略划线法
2-1 二人同时博弈的三要素
• 博弈的三要素
– 局中人 – 策略/行动 – 支付/得益
1.局中人
• 局中人：一般是指博弈中独立决策、独立承担博弈结果的个人或组织。 • 在不完全信息情形中，有时需要引入一个 “虚拟局中人”(pseudo-player)，如，上帝、老天爷、大自然等等。 • i＝l，2，…，n表示局中人
S1 S2 S3 [0,1]
• 支付函数为：
u （ x yz 1 x, y , z） u（ x yz 2 x, y , z） u（ xy z 3 x, y , z）
2-3 优势策略
• 优势策略(dominant strategy)
– 在某个博弈中，如果不管其他局中人选择什么策略，一个局中人的某个策略选择给他带来的支付始终高于其他策略选择，或者至少不低于其他策略选择，这样，只要这个局中人是一个理性的局中人，那么他必定愿意选择这个策略。 – 优势策略可分为：
• 用 u i 表示局中人i的支付，它是策略组合 s 的函数。
• 支付向量
例子
• 石头，剪刀，布
– 策略集 – 策略组合 – 支付向量（1赢，0平，-1输）
2-2 支付矩阵
• 试写出“石头剪刀布”支付矩阵
二人博弈的一般性矩阵表示
• 双矩阵分解为两个支付矩阵
T.C.Schelling的贡献
2-6 相对优势策略划线法
• 对于策略之间只存在相对优劣关系的二人博弈问
题，如果策略集是有限的，比如局中人1有m个策
略选择，局中人2有n个策略选择，那么我们可以写下m行n列共m×n个格子的支付矩阵。那么，可以采取“相对优势策略划线法”(Method of underlining relatively dominant-strategies)，找出博弈的纳什均衡。
0大于-1
抵赖是B的严格劣策略
抵赖是A的严格劣策略
严格优势(劣势)策略
严格劣势策略逐次消去法
• 严格劣势策略逐次消去法(Iterated Elimination of Strictly Dominated Strategies)
– 在分析一个局中人的决策行为时，首先把一个严格劣势策略从该局中人的策略集中去掉，然后在剩下的策略范围内，试图再找出这个局中人或者别的局中人的一个严格劣势策略，并将它去掉。不断重复这一过程，直到对每一个局中人而言，再也找不出严格劣势策略为止，简记为IESDS。
• 整体的严格优势策略(strictly dominant strategy) 如：囚徒困境 • 弱优势策略(weakly dominant strategy)
严格劣势策略
案例-囚徒困境
囚徒A
坦白
囚徒 B
抵赖
坦白抵赖
-8，-8
-10，0
-8大于-10
0，-10
-1，-1
-8大于-10 0大于-1
• 在不同的博弈中，可供局中人选择的策略的数目很不相同。
– 囚徒困境 – 古诺竞争的产量决策
数学表示
• 一般用 s i 表示局中人i可以选择的一个特定策略，而 S i 表示局中人i可以选择的所有策略所构成的集合，称为策略集(strategy set)，也称为策略空间 (strategy space)。 • n个局中人每人选择一个特定的策略，则n维向量 s =（ s1，… ， s n ）称为一个策略组合。 • 例：囚徒，古诺
– 诺曼底战役模拟博弈 – 囚徒困境博弈 – 企业古诺产量博弈
三人博弈
• 例子
– 局中人：A、B和C – 每个局中人有三种策略：数字1，2，3 – 支付：每个局中人得到4乘以三人中所选的数字中的最小者，再减去自己所选的数字。
正规型(策略型)博弈定义
例子
• 考虑三个局中人参加的一个策略型博弈，三个局中人的策略集一样，都是[0, 1]区间：
• N＝{1，2，…，n}表示局中人的集合。
• 博弈问题的根本特征是博弈本身具有策略依存性。 • 博弈中局中人的个数是博弈结构的关键。
• 根据局中人的个数博弈可分为“二人博弈” 和“多人博弈”。
需要注意的两点
• 在二人博弈中，局中人双方的利益并不总是相互
完全冲突的，有时候也会出现双方利益方向一致

e商务文档

2 同时决策博弈(1)

相关文档推荐：