当前位置:文档之家› 博弈论与策略行为

博弈论与策略行为

博弈论与策略行为G a m e T h e o r y a n dS t r a t e g y B e h a v i o r蔡继明 教授/主任清华大学政治经济学研究中心Center for Political Economy at Tsinghua UniversityCPET目录第一讲:导论一、博弈论的研究对象第二讲:占优战略与社会两难第三讲:纳什均衡和双人博弈第四讲:三人博弈与n人博弈第五讲:纯战略和混合战略第六讲:博弈的合作解第七讲:序贯博弈与子博弈完美均衡第八讲:重复博弈第九讲:企业经营决策的博弈分析第十讲:企业内部组织分析第十一讲:政府行为分析第一讲导论博弈论是研究理性的决策主体在其行为发生直接的相互作用时的策略选择及策略均衡的理论。

博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应策略(给自己带来最大收益的策略)。

二、博弈论的产生和发展博弈又称博戏,是一门古老的游戏。

1. 博弈在中国《学弈》(《孟子•告子》):弈秋,通国之善弈也。

使弈秋侮二人弈,其一人专心致志,惟弈秋之为听;一人虽听之,一心以为有鸿鹄将至,思援弓缴而射之。

虽与之俱学,弗若之矣。

为是其智弗若与?吾曰:非然也。

《世本》说,“乌曹作博”,乌曹乃是夏代著名之能工巧匠。

千百年来,博弈更是与人们的生活紧紧相连,从博棋到牌戏,从斗戏到彩票,中华民族的历史长河中就这样形成了别具风情的博弈文化从孙子兵法到三十六计从田忌赛马到孙庞斗智从运筹帷幄到韬光养晦从曹刿论战到论持久战12. 博弈论的开山之作1943 年,冯 · 诺依曼和摩 根斯顿发表《博弈论和经 济行为》的一书,标志着博弈论作为一门独立科学的开始,也标志着新古典经济学进入了一个新的发展阶段。

3. 1994年三位获诺奖的博弈论学者John NashJohn HarsanyLeihaden Selten4. 1996年诺贝尔经 济学奖得 主 : 詹 姆 斯·莫里 斯:主要贡 献:不对 称 信 息 条 件下的激励理论6. 2005年二位获诺奖的博弈论学者5. 2001 年 诺贝尔经济学奖得主: 迈克 尔 · 斯 宾塞:在不对称信息市 场分析方面所做出开创性研究。

Robert AumannThomas Shelling2美丽心灵三、基本概念1.局中人或参与者(Players)2.规则(rules):规定博弈各方的行动顺序、方式、以及最终的结果等。

3.策略(Strategy):一整套的行动方案,规定了各种情况下的行动。

比如:敌进我退,敌退我追,敌驻我扰,敌疲我打。

4. 相机策略(contingent strategy):仅在不确定事件发生时才会采取的策略。

如:人不犯我,我不犯人;人若犯我,我必犯人。

5. 行动:局中人在特定条件下的行为6. 支付( Pay-off ):博弈结束时,各方得到的收益。

7. 策略均衡:参与者之间稳定的、可预测的互动行为模式,就是策略均衡。

8.纳什均衡如果a*代表选手A在选手B选择b*时的最佳行动,而b*代表选手B在选手A选择a*时的最佳行动,那么,策略组合(a*, b*)就是2-人博弈的均衡解。

9.不完全信息博弈在一些博弈中,经常出现其中的一方或双方都具有私人信息(即一方知道而对方不知道的信息)。

比如,消费者在购物时,知道物品对自己的效用大小,而商家不知道;但商家知道商品的质量如何,而消费者未必清楚。

我们采用类型(type)的概念来描述局中人掌握的私人信息。

一般来说,对于不同的类型,局中人的最优策略也不一样,这样,对手的最优策略也不同。

10.类型显示对于没有私人信息的一方来说,希望能采用某种行动使得局中人的类型能够显示出来。

比如,甲为了知道乙的类型,让乙在白酒和啤酒之间选择。

如果乙喝白酒,则更可能是强硬的,如果喝啤酒,则更可能是软弱的。

甲的这种行动被称为是类型显示(reveal tape)行动。

311.信号传递对于具有私人信息的一方来说,有时希望自己能采用某种行动来主动向对方揭示自己的类型。

比如,强壮的乙可能击毁一块砖头来显示自己的类型。

这类行动被称为信号传递(signal)。

四、博弈的表述形式1. 标准式:博弈过程以数字矩阵(支付矩阵)来表示,矩阵两侧为参与者的不同策略选择。

标准式博弈突出了博弈以及与博弈类似的互动行为所具有的一个重要特征:即每个参与者的收益不仅取决于自己的策略,而且受其他参与者所选策略的影响。

2.扩展式(博弈树):博弈过程以树形图来表示,其中每一树枝节点代表了一种策略选择。

价格战-5,2五、博弈的分类1. 合作博弈与非合作博弈:不管是通过协议还是其他形式的强制手段,只要参与者们都能够履行协调后的策略,他们所选的策2.常数和博弈与非常数和博弈(零和博弈与非零和博弈);3.双人博弈与n-人博弈;进入1不进入2共享3,5略及其收益就是一个博弈的合作解;在没有可能达成有约束力的协议以协调不同参与者的策略时,参与者们所选的策略及其收益就是一个博弈的非合作解。

4.静态博弈与动态博弈;5.一次性博弈和重复博弈;6.完全信息和不完全信息博弈4损人利己?史密斯倾倒雇卡车琼斯倾倒4000,40005000,3500雇卡车3500,50004500,4500第二讲占优策略与社会两难一、占优与被占优策略所谓占优策略(dominant strategy)是指无论对方采取什么策略,对当事人来说都是最优反应的策略;如果无论对手选择哪种策略,一个策略的收益总是高于另一个策略,第二个策略被第一个策略占优,称为劣策略(dominated strategy)。

若前者称为上策,后者则称为下策。

如果每个参与者都有占优策略,并且也实施其占优策略,则该博弈可实现占优策略均衡。

三、垃圾处理博弈四、类似的其他例子④广告大战囚徒困境的启示“囚徒的两难选择”有着广泛而深刻的意义。

④价格大战④军备竞赛④环境污染④公共卫生……个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。

他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。

只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。

5欧姆尼投入留一手微型设备投入5,52,3留一手3,21,1张教授400页600页800页李教授400页45,4515,5010,40600页50,1540,4015,45800页40,1045,1535,35“纳什均衡”对亚当·斯密的“看不见的手”的原理提出挑战。

按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。

《国富论》中有这样一句名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。

从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。

两个囚徒的命运就是如此。

从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。

因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。

但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。

也就是中国人说的“己所不欲勿施于人”。

但前提是人所不欲勿施于我。

五、社会两难与博弈的合作解④社会两难是一种存在占优策略均衡的博弈,参与者采用这种均衡的收益比采用非均衡策略要差。

④占优策略的存在以及它与合作解相悖的事实是导致社会两难的根本原因。

④合约为解决社会两难问题提供了一个出路。

垃圾处理博弈的合作解(雇卡车,雇卡车)六、合作产品开发七、教科书博弈八、结论④占优策略均衡是一个非合作均衡,其中每个参与者都独立行动,而不是一起协商其策略选择。

如果博弈中的参与者都能够保证自己履行协商后的策略,那么,他们选择的策略就被称为合作均衡。

④合作均衡与占优策略均衡可能一样,也可能不一样。

④并非所有博弈都存在占优策略或占优策略均衡。

6厂商I采可取的策略厂商II可采取的策略行最小值123A300200400200B100150300100列最大值300200400第三讲纳什均衡和双人博弈一、纳什均衡纳什均衡是全部参与者所选策略的一个组合,其中每个人的策略都是针对其他人策略的最优反应。

如果有两个策略(或者更一般地,有多个策略,每个策略对应一个参与者),并且每个策略都是另一策略(或其他参与者的策略)的最优反应,我们就称这一策略组合为纳什均衡策略。

如果一个博弈存在纳什均衡策略,参与者也选择了这组策略,我们就得到了这个博弈的一个纳什均衡。

三、最大最小化或最小最大化启示两利相权取其重前行两害相权取其轻7七、金发女郎约翰追求金发女郎追求其他女士雷哈德追求金发女郎0,02,1追求其他女士1,21,1五、选择电台节目谢林点:人们把以线索为基础选择的均衡摇滚乐乡村音乐谈话摇滚乐35,3540,5010,80乡村音乐50,4020,2010,40谈话80,1040,105,5称为谢林点(Schelling point)或焦点。

托马斯·谢林(Thomas C. Schelling,1921-),博弈理论家。

③(推,推)均衡是收益(payoff)占优均衡;③(不推,不推)被称为风险(risk)占优纳什均衡③推与不推博弈是一个纯协调博弈。

八、性别战男子的选择2,10,0女子的选择0,01,28九、胆小鬼博弈不转向转向不转向转向-10,-10-5,55,-50,0改变方案一:减量方案投食仅原来的一半分量。

结果是小猪大猪都不去踩踏板了。

小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。

谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。

如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。

改变方案二:增量方案投食为原来的一倍分量。

结果是小猪、大猪都会去踩踏板。

谁想吃,谁就会去踩踏板。

反正对方不会一次把食物吃完。

小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。

对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。

改变方案三:减量加移位方案投食仅原来的一半分量,但同时将投食口移到踏板附近。

结果呢,小猪和大猪都在拼命地抢着踩踏板。

等待者不得食,而多劳者多得。

每次的收获刚好消费完。

对于游戏设计者,这是一个最好的方案。

成本不高,但收获最大。

9其他例子富人和穷人,谁修路大股东和小股东,谁来监督经营者大企业和小企业,谁主动投资R&D智猪博弈的启示原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。

但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。

相关主题