当前位置:文档之家› 1博弈论第一章

1博弈论第一章


1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
-1,1 1,-1 1,-1 1,-1 3,-3 1,-1
1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
收益矩阵
策略无好坏之分! 取胜关键:不让对方猜到自己策略,尽可能猜出对方策, 随机出招。
3
2015/12/5
二、猜硬币博弈
三、石头、剪子、布

一、三厂商离散产量
Q q1 q2 q3
P P(Q) 20 Q {


Cournot模型是寡头产量竞争,是市场经济 中最常见的问题之一 Cournot 1838年提出,直到现在还是经常 使用 Cournot模型有很多扩展 Cournot模型与囚徒困境相似,对理解市场 经济和博弈分析本身都有重要价值
坏天气(25%)
-16000 -10000
好天气 (75%)
0
坏天气 (25%)


1
运输路线收益矩阵
两人博弈就是两个各自独立决策,但是策略和利益相 互依存的参与人的决策问题 两人博弈最常见,研究最多,是最基本和有用的博弈 类型 囚徒困境、猜硬币、田忌赛马等都是两人博弈 两人博弈有多种可能性,参与人的利益方向可能不一 致,也可以一致;掌握信息多的并不能保证获胜;追 求个体利益最大化,常导致不能实现社会利益最大化, 从而也不能真正实现个体利益最大化
i 1
n n
n
厂商i的收益:
i 1
qi P( qi ) cqi qi [ P( qi ) c]
i 1
厂商i的收益不仅与自己既定成本和产量有关,还与 其他厂商的产量决策有关。
1.3.1 博弈中的参与人 1.3.2 博弈中的策略 1.3.3 博弈中的收益 1.3.4 博弈的过程 1.3.5 博弈的信息 1.3.6 参与人的能力和理性 1.3.7 博弈的分类
4
2015/12/5
1.3.1 博弈中的参与人
参与人:独立决策、独立承担博弈结果的个 人或组织。只要在一个博弈中统一决策、统一行动、
统一承担结果,不管一个组织有多大,甚至大到一个国家 或多国,都可以作为一个参与人。囚徒困境中的警察、田 忌赛马中的孙膑都不是参与人。

一、单人博弈——只有一个参与人的博弈
有限博弈(Finite Games):参与人个数是有限的, 每个参与人的策略数是有限的。总可以用矩阵、扩展或
罗列法将所有策略、结果和收益表示出来。

无限博弈(Infinite Games):至少有某些参与人的 策略有无限多个。无法列举,只能用数集、函数表示。
5
2015/12/5
1.3.3 博弈中的收益
田忌赛马分析
田 忌 上 中 下 上 下 中 中 上 下 中 下 上 下 上 中 下 中 上
齐 威 王
上中下 上下中 中上下 中下上 下上中 下中上
3,-3 1,-1 1,-1 -1,1 1,-1 1,-1
1,-1 3,-3 -1,1 1,-1, 1,-1 1,-1
1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
西方经济学的基石。
二、双寡头削价竞争
寡头2 高 价 寡 头 1 高 价 低 价 低 价
1.2.2 赌胜博弈

100,100
150,20
20,150
70,70

双寡头的收益矩阵
赌博、竞技等构成的博弈问题,在经济中 也有许多应用,赌胜博弈也是一类重要的 博弈问题,对研究经济竞争和合作有很大 启示 赌胜博弈的特点是一方得等于另一方失, 不可能双赢,属于对称“零和博弈”
《学弈》(《孟子•告子》)
弈秋,通国之善弈也。使 弈秋侮二人弈,其一人专 心致志,惟弈秋之为听; 一人虽听之,一心以为有 鸿鹄将至,思援弓缴而射 之。虽与之俱学,弗若之 矣。为是其智弗若与?吾 曰:非然也。
1
2015/12/5
诺曼底登陆与游戏

诺曼底登陆与游戏

T.C.Schelling: 用一个矩阵表 示双方得失
哲理:相生相克,以柔克刚
猜硬币方 正 面 反 面 1, -1 -1, 1 参 与 人 1 石 头 剪 子 布 石 头 0, 0 -1, 1 1, -1 参与人2 剪 子 1, -1 0, 0 -1, 1 布 -1, 1 1, -1 0, 0
盖 硬 币 方
正 面 反 面
-1, 1 1, -1
1.2.3 产量决策Cournot模型
2
2015/12/5
一、基本模型
对社会利益而言,罪犯受到了惩罚。 对囚徒个人,从个体利益出发既没有实现个人利益最大化,也没有实现两人总 利益最大化。 Prisoner 2 Mum Mum Prisoner 1 Fink -1, -1 0, -9 Fink -9,0 -6, -6
囚徒困境的启示
个人理性与集体理性的冲突:从个体利益出发没能实现集体利益最大 化;也没有实现个体利益最大化。从各人追求利己行为而导致的最 终结局是一个“均衡”,是对所有人都不利的结局。两人在坦白与抵
严格地讲,单人博弈由于不存在其他参与人的反应和反 作用,因此不属于博弈论的研究对象。但是讨论单人 博弈会使理论更完整,为多人博弈提供基础和启示。 例一:单人迷宫 扩展型
入口 右 A B 0 出口(奖金M) 右 M
A,1
左 B,1

博弈规则面前参与人之间平等,不因参与 人之间权利、地位的差异而改变 参与人数量对博弈结果和分析有影响。根
据参与人数量分单人博弈、两人博弈、多人博弈等。最常 见的是两人博弈,单人博弈是退化的博弈
左 0
例二:运输路线
一批货物价值90000,AB之间有水陆两条路线,陆路运输成本10000,水路 成本7000,但是水路风险:暴风雨概率1/4,损失10% 自 然
二、两人博弈

好天气(75%)
商 人 水 路 陆 路 -7000 -10000
一、田忌赛马 忌数与齐诸公子驰逐重射。孙子见其马足不甚 相远,马有上、中、下辈。于是孙子谓田忌曰: “君弟重射,臣能令君胜。”田忌信然之,与 王及诸公子逐射千金。及临质,孙子曰:“今 以君之下驷与彼上驷,取君上驷与彼中驷,取 君中驷与彼下驷。”既驰三辈毕,而田忌一不 胜而再胜,卒得王千金。 ——史记卷六十五 列传第五 孙武吴起



零和博弈:也称“严格竞争博弈”。参与人之 间利益始终对立,偏好通常不同。参与人之间 不可能和平共处 —猜硬币,田忌赛马,石头-剪刀-布 常和博弈:参与人之间利益的总和为常数。参 与人之间的利益是对立的且是竞争关系。参与 人较容易相互妥协、和平共处 —分配固定数额的奖金、利润,遗产官司 变和博弈:零和博弈和常和博弈以外的所有博 弈。合作利益存在,博弈效率问题的重要性。 —囚徒困境、产量博弈、制式问题等
P
1
8
20 20 25 33 49
2
16
25 20 25 33 21
3
12
30 24 25 33 21
2
5 4 5 11 7
二、n个厂商连续产量
n个厂商的总产量: 市场出清价格:
n
1.3 博弈的要素和分类
n
Q
qபைடு நூலகம்
i 1
i
P P(Q) P( qi )
i 1
厂商i的收益:
qi P qi P ( qi )
20 (q1 q 2 q3)
0
Q 20 Q 20
i P qi [20 (q1 q2 q3 )] qi
初步结论 1. 三厂商中每个厂商最大产量不会超过20 2. 每个厂商产量不会超过10
q1
4
4 5 5 3 7
q2
8
5 5 5 3 4 3
q3
6
6 6 5 3 3
我方2个师的兵力,敌方3个师的兵力,只能整 师调动。有两条进攻路线。我方兵力超过敌方, 则获胜;我方兵力小于或等于敌方兵力,则我 方负。问如何决策?
A a -,+
B +,-
C
D
敌方方案:A、三个师都驻守甲方向; B、三个师都驻守乙方向; C、两个师驻守甲方向,一个师驻守乙方向; D、一个师驻守甲方向,两个师驻守乙方向。 我方方案:a、两个师从甲方向进攻; b、两个师从乙方向进攻; c、兵分两路,两个方向各派一个师进攻。
2015/12/5
教材及参考书:
自编讲义
Game Theory 博弈论
谢识予. 经济博弈论(第三版). 上海: 复旦大学出版社, 2007. 罗伯特·吉本斯. 博弈论基础. 北京: 中国社会科学出版社, 1999. Gibbons . Game Theory for Applied Economists . Princeton University Press (July 13, 1992) 张维迎. 博弈论与信息经济学. 上海: 上海三联书店, 1996. A. K. Dixit, S. Skeath. 策略博弈. 北京: 中国人民大学出 版社, 2009. A. K. Dixit, B. J. Nalebuff. 策略思维. 北京: 中国人民大学 出版社, 2002.

b c
博弈:策略起关键作用
博弈就是策略对抗,或策略有关键作用的游戏

1.1.2 一个通俗定义
定义:博弈就是一些个人、队组或其他组织,面对一定 的环境条件,在一定的规则下,同时或先后,一次或多 次,从各自允许选择的行为或策略中进行选择并加以实 施,各自取得相应结果的过程。
四个方面 博弈的参加者(Players)——参与人 各参与人的策略(Strategies)或行为(Actions) 博弈的次序(Orders) 参与人的收益(Payoffs)
-7000
相关主题