博弈论的几个经典模型
不按(等待)
(9,-1)
(0,0)
大猪和小猪分别该如何选择。
博弈论的几个经典模型
模型一、智猪博弈/完全信息静态博弈
选择等待是小猪的占优策略。
大猪的最佳选择取决于小猪的行动,如果小猪 去按,大猪最好选择等待;如果小猪不去按, 则最佳选择是大猪亲自去按。 也就是说,在智猪博弈中,大猪没有占优策略, 而小猪有占优策略,它的最佳选择就是耐心 等待大猪去按钮,才能获得最佳结果。 “小猪躺着大猪跑”的现象是由于故事中的游 戏规则所导致的。规则的核心指标是:每次落 下的事物数量和踏板与投食口之间的距离。
学大辞典》“博弈论”辞条的看法,标准的
博弈论分析出发点是理性的,而不是心理的
或社会的角度。不过,近30年来结合心理学
和行为科学、实验经济学的研究成就而对博 弈 论 进 行 一 定 改 造 的 行 为 博 弈 论 (behavoiral game theory )也日益兴起。
博弈论的几个经典模型
失火了,你往哪个门跑——这就是博弈论
博弈论的几个经典模型
模型二、囚徒困境/非合作博弈
乙
甲
坦白 抵赖
坦白 (-8,-8) (-10,0)
抵赖 (0,-10) (-1,-1)
不难看出,“坦白”是任一犯罪嫌疑人的占 优战略,而(坦白,坦白)是一个占优战略 均衡。
博弈论的几个经典模型
模型二、囚徒困境/非合作博弈
对于两个犯罪嫌疑人总体而言,他们设想 的最好的策略可能是都不交代。但任何一个 犯罪嫌疑人在选择不交代的策略时,都要冒 很大的风险,一旦自己不交代而另一犯罪嫌 疑人交代了,自己就将可能处于非常不利的 境地。对于A而言,不管B采取何种策略,他的 最佳策略都是交代。对于B而言也是如此。最 后两人都会选择交代。
博弈论的几个经典模型
博弈的类型
根据参与者能否形成约束性的协议,以便 集体行动,博弈可分为合作性博弈和非合作 性博弈。纳什等博弈论专家研究得更多的是 非合作性博弈。 • 合作性博弈:是指参与者从自己的利益出发 与其他参与者谈判达成协议或形成联盟,其 结果对联盟方均有利; • 非合作性博弈:是指参与者在行动选择时无 法达成约束性的协议。人们分工与交换的经 济活动就是合作性的博弈,而囚徒困境则是 非合作性的博弈。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
• 海萨尼转换的具体方法
一个虚拟的参与人“自然”,自然首先决定参 与人的类型,赋予各参与人的类型向量 t,其 中 t (t1, t2 ,, tn ) ; 自然告知参与者自己的类型,却不告诉其他参 与者的类型; 参与者同时选择行动,每一参与者i 从可行集 Ai中 选择行动方案 ; 各方得到收益 Ai (a1, a2 ,, ai , ti ) 。
第四章 博弈论的几个经典模型
讲授人 谭建国
引言
博弈论又被称为对策论(Game Theory), 按照2005年因对博弈论的贡献而获得诺贝尔经 济学奖的Robert Aumann教授的说法,博弈论 就是研究互动决策的理论。所谓互动决策, 即各行动方(即局中人[player])的决策是相互 影响的,每个人在决策的时候必须将他人的 决策纳入自己的决策考虑之中,当然也需要 把别人对于自己的考虑也要纳入考虑之 中……在如此迭代考虑情形进行决策,选择 最有利于自己的战略(strategy)。
博弈论的几个经典模型
引言
你的选择必须考虑其他人的选择,而其 他人的选择也考虑你的选择。你的结果—— 博弈论称之为支付,不仅取决于你的行动选 择——博弈论称之为策略选择,同时取决于 他人的策略选择。你和这群人构成一个博弈 (game)。 上述博弈是一个叫张翼成的中国人在1997 年提出的一个博弈论模型,被称之为少数者 博弈或少数派博弈(Minority Game)。 生活中博弈的案例很多,你会见到很多 例子。只要涉及到人群的互动,就有博弈。
博弈论的几个经典模型
引言
博弈论的应用领域十分广泛,在经济学、 政治科学(国内的以及国际的)、军事战略问
题、进化生物学以及当代的计算机科学等领域
都已成为重要的研究和分析工具。此外,它还与
会计学、统计学、数学基础、社会心理学以及
诸如认识论与伦理学等哲学分支有重要联系。
博弈论的几个经典模型
引言
按照Aumann所撰写《新帕尔格雷夫经济
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
• 什么是海萨尼转换? 海萨尼提出了一种处理不完全信息博弈的方 法,即引入一个虚拟的局中人——“自然”。 自然首先行动,它决定每个局中人的特征。 每个局中人知道自己的特征,但不知道别的 局中人特征。这种方法将不完全信息静态博 弈变成一个两阶段动态博弈,第一个阶段是 自然N的行动选择,第二阶段是除N外的局中 人的静态博弈。这种转换被称为“海萨尼转 换”,这个转换把“不完全信息”转变成为 完全但不完美信息,从而可以用分析完全信 息博弈的方法进行分析。
博弈论的几个经典模型
参考书
• 汪贤裕、肖玉明编著,博弈论及其应用,
科学出版社,2008年2月
• 潘天群著,博弈生存(第二版),中央编
译出版社,2004年10月
• 王春永编著,博弈论的诡计,中国发展出 版社,2007年1月
博弈论的几个经典模型
基本术语
• 博弈论研究的对象:是理性的行动者或参与 者如何选择策略或如何作出行动的决定。理 性的人是对现实的人的基本假定,即假定参 与者努力用自己的推理能力使自己的目标最 大化。“理性的”与“道德的”不是一回事, 理性的与道德的有时会发生冲突,但是理性 的人不一定是不道德的。
博弈论的几个经典模型
模型二、囚徒困境/非合作博弈
该博弈刻划了两大难题: • 冲突情形下,参与人的目标是什么?是采用(作 为个人)他自己的最好策略,还是采用(作为集 体的一员)他们共同的最好策略?前者导致均衡 策略(坦白,坦白),支付为(-8,-8);后者的最 好策略是(抵赖,抵赖),支付为(-1,-1)。这里 反映了个体理性行为与集体理性行为之间的矛 盾、冲突。 • 此博弈只进行一次还是重复进行?如果博弈只 进行一次,参与人似乎只有坦白才是最好的策 略,因为没有理由相信对手会对你有信心,他 总认为你自己会坦白;因此,双方都采取坦白 策略。然而,若博弈进行多次,则结论将会发 生变化。
博弈论的几个经典模型
模型二、囚徒困境/非合作博弈
在博弈论中,含有占优战略均衡的一个
著名例子是由塔克给出的“囚徒困境”
(prisoners’dilemma)博弈模型。该模型用 一种特别的方式为我们讲述了一个警察与小 偷的故事。
博弈论的几个经典模型
模型二、囚徒困境/非合作博弈
假设:有两个小偷A和B联合犯事、私入民宅被 警察抓住。警方将两人分别臵于不同的两个 房间内进行审讯,对每一个犯罪嫌疑人,警 方给出的政策是:如果一个犯罪嫌疑人坦白 了罪行,交出了赃物,于是证据确凿,两人 都被判有罪。如果另一个犯罪嫌疑人也作了 坦白,则两人各被判刑8年;如果另一个犯罪 嫌人没有坦白而是抵赖,则以妨碍公务罪(因 已有证据表明其有罪)再加刑2年,而坦白者 有功被减刑8年,立即释放。如果两人都抵赖, 则警方因证据不足不能判两人的偷窃罪,但 可以私入民宅的罪名将两人各判入狱1年。
博弈论的几个经典模型
博弈的类型
博弈又可分静态博弈和动态博弈。
• 静态博弈:指参与者同时采取行动,或者尽 管参与者行动的采取有先后顺序,但后行动 的人不知道先采取行动的人采取的是什么行 动。
• 动态博弈:指参与者的行动有先后顺序,并 且后采取行动的人可以知道先采取行动的人 所采取的行动。
博弈论的几个经典模型
博弈论的几个经典模型
引言
博弈论的出现只有60多年的历史。博弈 论的开创者为诺意曼与摩根斯坦,他们1944 年出版了《博弈论与经济行为》。博弈论天 才纳什(John Nash)的开创性论文《n人博弈 的均衡点》(1950)、《非合作博弈》(1951)等 等,给出了纳什均衡的概念和均衡存在定理。 今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义, 它正成为社会科学研究范式中的一种核心工 具,以至于我们可称博弈论是“社会科学的 数学”,或者说是关于社会的数学。
博弈论的几个经典模型
引言
什么叫博弈? 博弈的英文为game,我们一般将它翻译成“ 游戏”。而在西方,game的意义不同于汉语 中的游戏。在英语中,game即是人们遵循一 定规则下的活动,进行活动的人的目的是使 自 己 “ 赢 ” 。 奥 林 匹 克 运 动 会 叫 Olympic Games。在英文中,game有竞赛的意思,进 行game的人是很认真的,不同于汉语中游戏 的概念。在汉语中,游戏有儿戏的味道。因 此将关于game的理论,即game theory翻译成 博弈论或者对策论,是恰当的。
博弈论的几个经典模型
模型一、智猪博弈/完全信息静态博弈
例:猪圈里有两只猪,一只比较大,一只比较 小。猪圈狭长,猪食槽在一头,猪食按钮在 另一头,按一下会有10个单位的猪食落进槽 里。由于按钮和食槽距离较远,按按钮的体 力耗费相当于2个单位的食物。
小猪 大猪 按 按 (5,1) 不按(等待) (5,3)
博弈论的几个经典模型
模型二、囚徒困境/非合作博弈
囚徒困境可以用来说明许多现象。 寡头定价 拍卖出价 推销员的努力 政治上的讨价还价 军备竞赛等(冲突中出现两败俱伤的情况, 往往要考虑到囚徒困境) *(纯策略)纳什均衡
博弈论的几个经典模型
问题与思考
• 什么是博弈论?试举两个你生活中的例子说明。 • 某年在荷兰召开了一次“合作及社会两难困境研讨 会”,与会者都是博弈论的专家。 当大会结束之后,有两个学者,麦息克和路特提议 大家玩一个游戏。 他们将一个大信封拿出来,请在场的43位专家拿 出金钱装到这个信封里。如果到最后这信封里的钱 超过250元,麦息克和路特将自己掏腰包,退还 每人10元。不过,如果最后信封内的钱不足25 0元,就统统没收,大家拿不到半毛钱。 仔细想一想,如果你也在场,你会奉献多少钱呢?