当前位置：文档之家› 完全信息静态博弈

完全信息静态博弈

• （三）最优反应函数法 • 所谓最优反应，指的是对某个局中人而言，当其他人的策略给定时，使自己的收益最大的那个策略。
Bi (si ) {si Si : ui (si , si ) ui (s 'i , si ), s 'i Si }
• 如果某个策略组合中，彼此都互为最优反应，那么，这个结果是均衡的，我们称之为纳什均衡。
• (1) 古诺模型 • 两个寡头企业进行产量竞争, 市场需求函数如下: p (q1 q2 ) ，边际称为常数c ，产量为 qi 。
• 首先，推导两家企业的最优反应函数。
c qj qi (q j ) 2 2
• 联立方程组，可以解出纳什均衡产量。
2( c) q* 3
• 社会规范是聚点形成的一个重要原因，例如，大家都靠右边行驶。
• 交通博弈：人们可以选择靠左或靠右行驶。
•
R R L L
1, 1 0, 0
0, 0 1, 1
2. 性别之争（Battle of Sexes）
•
F F O 2, 1 0, 0 O 0, 0 1, 2
• 男士偏好足球，女士偏好看戏。 • 两者既有协作，又有冲突。
• • • •
(F,F)和(O,O)都是纳什均衡。三个实验：（1）你是其中之一（男士），如何选？（2）如果女士有权声明：看戏，你如何选？（cheap talk) • （3）如果女士有权发表如上声明，但放弃了，你如何选？
3. 协作与风险占优
A A B
B
9, 9 8, -15
-15, 8 7, 7
• 如果一方坦白，而另一方不坦白。则坦白的一方因立功而释放；不坦白的一方因抗拒且证据确凿，从众判10年徒刑。
参加者策略 Player 1 坦白抵赖
Player 2 坦白 -8, -8 -10, 0 抵赖 0, -10 -1, -1
• 囚徒困境博弈表明什么道理？ • 个人理性的决策一定能够得到好的结果吗？
最优反应函数的图形
• (2) 伯川德模型 • 两家寡头生产完全同质的产品。
• 同时设定价格pi (i = 1; 2) ，生产的边际成本为常数c。
• 市场需求函数为q = D(p) ，消费者总是购买价格较低的产品。
• 两家企业的需求如下：
• 纳什均衡是什么？
• 唯一的纳什均衡是： • (p1*; p2*) = (c; c).
四、博弈的求解
• • • • 我们会讲解三种博弈的求解方法，分别是：（1）占优策略均衡法（特殊）；（2）重复剔除劣策略法（特殊）；（3）最优反应函数法（一般），又经常被称为“划线法”。
• （一）占优策略方法 • 什么是占优策略（dominant strategy）? • 指的是无论其他人选择什么策略，居中人的策略si的收益总是大于其他策略的收益。
• 课堂实验: • 你会选择什么策略? • 有多少人选 A?
• 分析: • 1. 有两个纳什均衡：(A，A) 、 (B，B)。 A 帕累托优于B。
• 2. 然而，现实中，人们更多选择B。因为选 A风险较高。
• Harsanyi-Selten 提出了风险占优的概念。
• 假设选A和B的概率各位0.5，可以看出此时选B更合理。
• 练习： • 求解纳什均衡。
ห้องสมุดไป่ตู้
进一步练习纳什均衡的求解
一个不严格纳什均衡的例子
L T B 1, 1 1, 0 M 1, 0 0, 1 R 0, 1 1, 0
不同均衡概念的关系
占优均衡
DSE 重复剔除劣策略均衡 IEDE 纯策略纳什均衡 PNE
五、策略连续的情形
• 1. 古诺模型 • 2. 伯川德模型
第2章完全信息静态博弈
一、完全信息静态博弈的含义
• （一）什么是完全信息（complete information）? • 每个博弈的参加者都了解彼此的特征 (characteristics)。
• （二）什么是静态博弈？
• 在博弈中，每个局中人只行动一次，且所有的局中人同时行动。 • 你能想出符合上述定义的例子吗？
• • • • • • •
囚徒困境的例子：（1）公地的悲剧；（2）价格战；（3）军备竞赛；（4）小车 vs.SUV；（5）合作中的偷懒行为； „„
• 练习： • 猎鹿博弈。两个猎人合作可以抓住一只鹿，但如果一个人去抓鹿，则无法捕获；然而，一个人就可以独自抓住一只野兔。 • 假设一只鹿的总收益为10，一只兔子的收益为3。 • 请画出此博弈的策略式矩阵。
• 注：penny是一便士或一分钱的意思。
• The players then reveal their choices simultaneously. • If the pennies match (both heads or both tails) Player A keeps both pennies, so wins one from Player B (+1 for A, −1 for B).
• 如下都是纳什均衡：(A; A;A), (B;B;B), (C;C;C),(A;B;A), (A;C;C).
• 纽约博弈的两个结果无所谓优劣，两个参加者是完全协作的关系。
• Schelling (1961) 提出了多重均衡中的聚点（focal point），也就是更容易出现的均衡结果。
• 对于每个博弈的结果而言，局中人都得到了对应的收益(payoff)。
• 一个例子：Match pennies game的策略式矩阵：
Bob
Head 1, -1 -1, 1
Adam
Head
Tail -1, 1
1, -1
Tail
三、几类经典的模型
• 1. 零和博弈（Zero-sum Game） • 在所有的博弈结果中，局中人的收益之和恒等于0。
• A的期望收益为-3，而选B的期望收益为 7.5。B风险占优于A。
七、混合策略纳什均衡
• 社会福利博弈
流浪汉寻找工作政府救济不救济没有一个策略组合构成纳什均衡 3， 2 -1，1 0， 0 流浪 -1，3
猜谜游戏
两个儿童各拿一枚硬币，若同时正面朝上或朝下， A给B 1分钱，若只有一面朝上，B给A 1分钱。正面正面反面

• 思考：中国的猜硬币游戏和国外的match pennies 有什么异同之处？
二、策略式矩阵
• 如何表示完全信息静态博弈？ • 一个基本的工具就是策略式矩阵（stategic matrix），实际上是一个表格。 • 用表格的行和列分别表示两个局中人的策略（strategies）； • 每一个空格代表博弈的一个结果（outcome），或称为策略组合（strategy profile）；
• 例如：猜硬币游戏 • 游戏规则：首先，一个人盖住硬币，然后，另外一个人猜被盖住的硬币是正面还是反面朝上。 • 属于静态博弈：（1）两个人都只行动一次； • （2）盖硬币的人选正面还是反面，猜的人看不到。
• 国外的硬币游戏：Match pennies. • The game is played between two players, Player A and Player B. Each player has a penny and must secretly turn the penny to heads or tails.
• 纳什均衡（Nash Equilibrium）：对任意一个局中人而言，当其他人的策略给定时，他当前所选的策略使其收益达到最大，通过改变策略，无法使收益进一步增加。
* * ui (si* , s ) u ( s , s i i i i )
• 严格纳什均衡：
ui (s , s ) ui (si , s )
• 夫妻之争博弈的特点：当事人之间既有合作又有冲突。
• 3. 鹰鸽博弈（Hawk-dove Game） • 鹰：强硬 • 鸽：温和
• 4. 囚徒困境（Prisoners’ Dilemma） • 两个嫌疑犯被分开审讯，他们各有两个选择，坦白或者不坦白。 • 有四种结果： • （1）双方都不坦白，因证据较少，各判1 年徒刑； • （2）双方都坦白，证据充分，各判8年徒刑；
* i * i * i
• 纳什均衡和最优反应函数有什么关系？ • 根据互为最优反应的结果，能够找到纳什均衡。 • 接下来，仍以囚徒困境为例，使用最优反应函数法进行求解。
参加者策略 Player 1 坦白抵赖
Player 2 坦白 -8, -8 -10, 0 抵赖 0, -10 -1, -1

If the pennies do not match (one heads and one tails) Player B keeps both pennies, so receives one from Player A (−1 for A, +1 for B).
This is an example of a zero-sum game, where one player's gain is exactly equal to the other player's loss.
• 零和博弈的内涵： • 代表着当事人之间无可调和的利益冲突。
• 零和博弈的实例：财产分割、职位竞争、赌博，etc.
• 2. 夫妻之争（Battle of Sexes） • 故事情节： • 夫妻二人决定如何度周末，各有两个选择：看足球比赛或者看戏剧。 • 两人希望一起度周末，但男方偏爱看足球比赛，而女方偏爱看戏剧。
• 占优策略的例子，囚徒困境中有没有占优策略？
参加者策略 Player 1 坦白抵赖
Player 2 坦白 -8, -8 -10, 0 抵赖 0, -10 -1, -1

e商务文档

完全信息静态博弈

相关文档推荐：