完全信息静态博弈
• (三)最优反应函数法 • 所谓最优反应,指的是对某个局中人而言, 当其他人的策略给定时,使自己的收益最 大的那个策略。
Bi (si ) {si Si : ui (si , si ) ui (s 'i , si ), s 'i Si }
• 如果某个策略组合中,彼此都互为最优反 应,那么,这个结果是均衡的,我们称之 为纳什均衡。
• (1) 古诺模型 • 两个寡头企业进行产量竞争, 市场需求函数如 下: p (q1 q2 ) ,边际称为常数c , 产量为 qi 。
• 首先,推导两家企业的最优反应函数。
c qj qi (q j ) 2 2
• 联立方程组,可以解出纳什均衡产量。
2( c) q* 3
• 社会规范是聚点形成的一个重要原因,例 如,大家都靠右边行驶。
• 交通博弈:人们可以选择靠左或靠右行驶。
•
R R L L
1, 1 0, 0
0, 0 1, 1
2. 性别之争(Battle of Sexes)
•
F F O 2, 1 0, 0 O 0, 0 1, 2
• 男士偏好足球,女士偏好看戏。 • 两者既有协作,又有冲突。
• • • •
(F,F)和(O,O)都是纳什均衡。 三个实验: (1)你是其中之一(男士),如何选? (2)如果女士有权声明:看戏,你如何选? (cheap talk) • (3)如果女士有权发表如上声明,但放弃 了,你如何选?
3. 协作与风险占优
A A B
B
9, 9 8, -15
-15, 8 7, 7
• 如果一方坦白,而另一方不坦白。则坦白 的一方因立功而释放;不坦白的一方因抗 拒且证据确凿,从众判10年徒刑。
参加者 策略 Player 1 坦白 抵赖
Player 2 坦白 -8, -8 -10, 0 抵赖 0, -10 -1, -1
• 囚徒困境博弈表明什么道理? • 个人理性的决策一定能够得到好的结果吗?
最优反应函数的图形
• (2) 伯川德模型 • 两家寡头生产完全同质的产品。
• 同时设定价格pi (i = 1; 2) ,生产的边际成本 为常数c。
• 市场需求函数为q = D(p) ,消费者总是购买 价格较低的产品。
• 两家企业的需求如下:
• 纳什均衡是什么?
• 唯一的纳什均衡是: • (p1*; p2*) = (c; c).
四、博弈的求解
• • • • 我们会讲解三种博弈的求解方法,分别是: (1)占优策略均衡法(特殊); (2)重复剔除劣策略法(特殊); (3)最优反应函数法(一般),又经常被 称为“划线法”。
• (一)占优策略方法 • 什么是占优策略(dominant strategy)? • 指的是无论其他人选择什么策略,居中人 的策略si的收益总是大于其他策略的收益。
• 课堂实验: • 你会选择什么策略? • 有多少人选 A?
• 分析: • 1. 有两个纳什均衡:(A,A) 、 (B,B)。 A 帕累托优于B。
• 2. 然而,现实中,人们更多选择B。因为选 A风险较高。
• Harsanyi-Selten 提出了风险占优的概念。
• 假设选A和B的概率各位0.5,可以看出此时 选B更合理。
• 练习: • 求解纳什均衡。
ห้องสมุดไป่ตู้
进一步练习纳什均衡的求解
一个不严格纳什均衡的例子
L T B 1, 1 1, 0 M 1, 0 0, 1 R 0, 1 1, 0
不同均衡概念 的关系
占优均衡
DSE 重复剔除劣策略均衡 IEDE 纯策略纳什均衡 PNE
五、策略连续的情形
• 1. 古诺模型 • 2. 伯川德模型
第2章 完全信息静态博弈
一、完全信息静态博弈的含义
• (一)什么是完全信息(complete information)? • 每个博弈的参加者都了解彼此的特征 (characteristics)。
• (二)什么是静态博弈?
• 在博弈中,每个局中人只行动一次,且所 有的局中人同时行动。 • 你能想出符合上述定义的例子吗?
• • • • • • •
囚徒困境的例子: (1)公地的悲剧; (2)价格战; (3)军备竞赛; (4)小车 vs.SUV; (5)合作中的偷懒行为; „„
• 练习: • 猎鹿博弈。两个猎人合作可以抓住一只鹿, 但如果一个人去抓鹿,则无法捕获;然而, 一个人就可以独自抓住一只野兔。 • 假设一只鹿的总收益为10,一只兔子的收 益为3。 • 请画出此博弈的策略式矩阵。
• 注:penny是一便士或一分钱的意思。
• The players then reveal their choices simultaneously. • If the pennies match (both heads or both tails) Player A keeps both pennies, so wins one from Player B (+1 for A, −1 for B).
• 如下都是纳什均衡:(A; A;A), (B;B;B), (C;C;C),(A;B;A), (A;C;C).
• 纽约博弈的两个结果无所谓优劣,两个参 加者是完全协作的关系。
• Schelling (1961) 提出了多重均衡中的聚点 (focal point),也就是更容易出现的均衡 结果。
• 对于每个博弈的结果而言,局中人都得到 了对应的收益(payoff)。
• 一个例子:Match pennies game的策略式 矩阵:
Bob
Head 1, -1 -1, 1
Adam
Head
Tail -1, 1
1, -1
Tail
三、几类经典的模型
• 1. 零和博弈(Zero-sum Game) • 在所有的博弈结果中,局中人的收益之和 恒等于0。
• A的期望收益为-3,而选B的期望收益为 7.5。B风险占优于A。
七、混合策略纳什均衡
• 社会福利博弈
流浪汉 寻找工作 政府 救济 不救济 没有一个策略组合构成纳什均衡 3, 2 -1,1 0, 0 流浪 -1,3
猜谜游戏
两个儿童各 拿一枚硬币, 若同时正面 朝上或朝下, A给B 1分钱, 若只有一面 朝上,B给A 1分钱。 正面 正面 反面
• 思考:中国的猜硬币游戏和国外的match pennies 有什么异同之处?
二、策略式矩阵
• 如何表示完全信息静态博弈? • 一个基本的工具就是策略式矩阵 (stategic matrix),实际上是一个表格。 • 用表格的行和列分别表示两个局中人的策 略(strategies); • 每一个空格代表博弈的一个结果 (outcome),或称为策略组合(strategy profile);
• 例如:猜硬币游戏 • 游戏规则:首先,一个人盖住硬币,然后, 另外一个人猜被盖住的硬币是正面还是反 面朝上。 • 属于静态博弈:(1)两个人都只行动一次; • (2)盖硬币的人选正面还是反面,猜的人 看不到。
• 国外的硬币游戏:Match pennies. • The game is played between two players, Player A and Player B. Each player has a penny and must secretly turn the penny to heads or tails.
• 纳什均衡(Nash Equilibrium):对任意一 个局中人而言,当其他人的策略给定时, 他当前所选的策略使其收益达到最大,通 过改变策略,无法使收益进一步增加。
* * ui (si* , s ) u ( s , s i i i i )
• 严格纳什均衡:
ui (s , s ) ui (si , s )
• 夫妻之争博弈的特点:当事人之间既有合 作又有冲突。
• 3. 鹰鸽博弈(Hawk-dove Game) • 鹰:强硬 • 鸽:温和
• 4. 囚徒困境(Prisoners’ Dilemma) • 两个嫌疑犯被分开审讯,他们各有两个选 择,坦白或者不坦白。 • 有四种结果: • (1)双方都不坦白,因证据较少,各判1 年徒刑; • (2)双方都坦白,证据充分,各判8年徒 刑;
* i * i * i
• 纳什均衡和最优反应函数有什么关系? • 根据互为最优反应的结果,能够找到纳什 均衡。 • 接下来,仍以囚徒困境为例,使用最优反 应函数法进行求解。
参加者 策略 Player 1 坦白 抵赖
Player 2 坦白 -8, -8 -10, 0 抵赖 0, -10 -1, -1
If the pennies do not match (one heads and one tails) Player B keeps both pennies, so receives one from Player A (−1 for A, +1 for B).
This is an example of a zero-sum game, where one player's gain is exactly equal to the other player's loss.
• 零和博弈的内涵: • 代表着当事人之间无可调和的利益冲突。
• 零和博弈的实例:财产分割、职位竞争、 赌博,etc.
• 2. 夫妻之争(Battle of Sexes) • 故事情节: • 夫妻二人决定如何度周末,各有两个选择: 看足球比赛或者看戏剧。 • 两人希望一起度周末,但男方偏爱看足球 比赛,而女方偏爱看戏剧。
• 占优策略的例子,囚徒困境中有没有占优 策略?
参加者 策略 Player 1 坦白 抵赖
Player 2 坦白 -8, -8 -10, 0 抵赖 0, -10 -1, -1