当前位置:文档之家› 博弈名词解释

博弈名词解释

一、名词解释:1、零和游戏——游戏者有输有赢,但整个游戏的总成绩永远为零。

2、纳什均衡——只有在这一点上,任何一人单方面改变选择,他只会得到较差的结果。

这一点就是纳什均衡。

3、帕累托最优——指资源分配的一种状态,在不使任何人境况变坏的情况下,不可能再使某些人的处境变好。

说得更经济学点,群体所有的社会资源的配置已将整个群体的效用最大化了,没人能够在不减损别人的利益的同时改善自己的利益。

二、简答题1.博弈的四个要素是什么?1.博弈要有2个或2个以上的参与者(Player)。

2.博弈要有参与各方争夺的资源或收益(Resources或Payoff)。

3. 参与者有自己能够选择的策略(Strategy)。

4. 参与者拥有一定量的信息(Information)。

2.什么是触发策略?触发策略有何优点如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略,在博弈论里面称之为触发策略(Trigger strategy),或称冷酷策略好的策略必须具有的一个特点是“清晰性”,针锋相对策略就有很好的清晰性,让对方很快发现规律,从而不得不采取合作的态度。

如果对方知道你的策略是触发策略,那么对方将不敢采取不合作策略,因为一旦他采取了不合作策略,双方便永远进入不合作的困境。

因此,只要有人采取触发策略,那么双方均愿意采取合作策略。

3.请描述“囚徒困境”的案例。

两个嫌疑犯(甲和乙)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”:如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判15年;如果都不坦白则各判1年。

从表面上看,他们应该互相合作,保持沉默。

但他们不得不仔细考虑对方可能采取什么选择。

甲、乙两个人都十分精明,而且都只关心减少自己的刑期,并不在乎对方被判多少年(人都是有私心的嘛)。

甲会这样推理:假如乙不招,我只要一招供,马上可以获得自由,而不招却要坐牢1年,显然招比不招好;假如乙招了,我若不招,则要坐牢15年,招了只坐10年,显然还是以招认为好。

无论乙招与不招,我的最佳选择都是招认。

还是招了吧。

自然,乙也同样精明,也会如此推理。

4.请举例说明理性决策的困境。

分钱博弈一个宾馆服务员捡到了100元,他想据为己有;可是另一个服务员看到了,于是威胁如果不分给他一部分,他就要向领班报告,在那种情况下,这笔钱就要上缴,谁也得不到。

A提方案时要猜测B的反应,A会这样想:根据“理性人”的假定,A无论提出什么方案给B——除了1分钱都不给B这种极端的情况,B只有接受,因为B接受了还有所得,而不接受将一无所获——当然此时A也将一无所获。

此时理性的A的方案可以是:留给B一点点比如1分钱,而将99.99元归为己有,即方案是:99.99:0.01。

B接受了还会有0.01元,而不接受将什么也没有。

三、论述题:1.麦当劳和肯德基为什么总是相邻设店?假设有条完全笔直的公路,连接城市A到城市B之间的交通。

这条公路上每天行驶着大量的车辆,并且车流量在公路上是均匀分布的。

假设麦当劳和肯德基要在这条公路上选择一个位置,招揽来往车辆。

一个合乎逻辑的假定:通常情况下,车辆总是乐意到距自己最近的快餐店购买食物。

从资源的最佳配置来看,麦当劳、肯德基应该分别开在1/4、3/4处是最优。

在这种均匀散布的情况下,每家快餐店所有拥有的客户从距离最近的城市到两家快餐店的中心为止,因此都拥有1/2的顾客量,同时对于开车的人们总体来说,这种策略的选择,车辆到快餐店的总的距离最短。

肯德基与麦当劳都是百年老店,自然是精明之至,从经济学上就是具有经济理性,总是希望自己的生意尽可能地红火,至于其他人的生意的好坏则与己无关。

出于这种理性,肯德基肯定会想到:如果将店铺从3/4点处向左移一点,将从麦当劳抢夺走部分顾客,这对于肯德基单方面来说无疑是一个好主意。

当然麦当劳也不甘示弱,作为一个“理性人”,麦当劳自然也应该想到将自己的店铺从1/4点处向右移动以争取更多的顾客。

肯德基与麦当劳都是百年老店,自然是精明之至,从经济学上就是具有经济理性,总是希望自己的生意尽可能地红火,至于其他人的生意的好坏则与己无关。

出于这种理性,肯德基肯定会想到:如果将店铺从3/4点处向左移一点,将从麦当劳抢夺走部分顾客,这对于肯德基单方面来说无疑是一个好主意。

当然麦当劳也不甘示弱,作为一个“理性人”,麦当劳自然也应该想到将自己的店铺从1/4点处向右移动以争取更多的顾客。

2.请举例说明一次博弈和多次博弈的区别。

就恋爱博弈来看,男女双方在交往的过程,随时都在博弈,因为相爱的过程中任何一个时点都是有可能分手的。

用博弈论的术语来说,这是一种囚徒困境的重复博弈。

无数爱情故事中的悲欢离合、精彩跌宕正是这个博弈模型的表现。

素不相识一对男女的一夜情是一次性囚徒困境博弈3.请举例说明逆向选择的困境,并说明走出逆向选择的途径?保险市场上的逆向选择现象相当普遍。

不同投保人的风险水平可能不同。

有些人可能有与生俱来的高风险,比如他们容易得病,或者有家族病史;而另一些人可能有与生俱来的低风险,比如他们生活有规律,饮食结构合理,或者家族寿命都比较长。

这些有关风险的信息是投保人的私人信息,保险公司无法完全掌握。

如果保险公司对所有投保人制定统一保险费用(这属于总体保险合同),由于保险公司事先无法辨别潜在投保人的风险水平,这个统一的保险费用只能按照总人口的平均发病率或平均死亡率来制定,所以它必然低于高风险投保人应承担的费用,同时高于低风险投保人应承担的费用,从而使得低风险投保人由于保险费用过高而退出保险市场,保险市场上只剩下高风险的投保人,即出现高风险投保人驱逐低风险投保人的逆向选择现象。

其结果是保险公司的赔偿概率将超过根据统计得到的总体损失发生的概率,这将导致保险公司出现亏损甚至破产。

逆向选择的困境,解决的途径除有三个:一是“信号传递”;二是“信息甄别”;三是制度设计。

四、案例分析:1.某城市政府采购办公用品,每年招标,只挑选两个供应商。

政府每个月采购一次,两个供应商每个月就当月采购商品报价。

实行“价低者得”原则,如两供应商报价相同,则订单分为均等的两半,两供应商各得50%。

如报价不同,则全部订单给价低者。

请问这两个供应商应如何报价?为什么?两供应商相互合作,共同报一相同高价,获取最大利润,自是双方的最优策略。

两供应商共同合作了11个月,但在第12个月,两供应商知道这是今年最后一次,对方很有可能背叛。

与其对方背叛,不如自己背叛。

两供应商知道第12次对方会背叛,那么第11次不如我就背叛,因为第11次采用合作的态度并不会促使对方在第12次时合作。

同理,第10次、第9次……第1次,每一次都应该背叛。

因此双方不可能合作共同报高价,而是相互竞争地报低价。

2.假设你是一个处于古战场前线的士兵,当面对敌方的阵线时你采取何种策略最佳?如果己方获胜,你的贡献不太可能是决定性的,你倒是冒着有可能受伤或者牺牲的风险;如果敌方取胜,你伤亡的可能性就更大了。

于是唯一合理的结论是:逃跑。

如果每个士兵都如此推理的话,恐怕战争就不存在了。

请说明为什么大多的士兵并没有逃跑?上述是一个典型的囚徒困境的推理,这样的事情当然不会发生,大多的士兵并没有逃跑,这是因为有比上面简单推理更多的东西,至少对逃跑士兵的处决,就使得逃跑的代价比起与战友同生共死来得严重。

对那些缺乏意志与勇气的士兵,军队中往往会通过惩罚临阵逃脱来激发他们的斗志。

大部分军队中,假如有士兵在战士逃跑,他就会被就地正法。

因此,退缩就会被枪毙,对士兵逃跑造成了巨大压力。

临阵退缩遭受惩罚也意味着一种无耻的死,那么,选择勇往直前更具吸引力。

还有每个士兵,拥有对自己的国家的自豪感,使得他们会坚持作战下去。

而不是想到轻易地逃跑。

再说,战场中,士兵之间是多次博弈,一定程度上可能成为契约集体。

而且在军队中存在威胁和惩罚,使得士兵不敢轻易背叛做逃兵。

因此,士兵们在策略选择上,会比较慎重,会考虑,因此而产生的后果可能增加交易成本。

而不使简单的自私自利的选择逃跑。

3.仅1985年至2000年的15年里,中央就下达“减负令”49次。

减轻中小学生过重负担喊了20多年,实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。

请说明数十道“减负令”难见效,中小学生课业负担不减反增的原因。

上述问题中,学生事实上被置于囚徒困境。

囚徒困境是一个博弈论中的词汇,主要说做出选择时,个体理性和群体理性的关系。

而个人,又总是在为自身利益最大化的追求来做出自己的选择。

他们明知,朝着整体利益做选择时,对自己有利。

但人的私心总希望自己占多一些便宜,此时做出选择,却不是好的选择。

所以虽然下达多次减负令,而事实上没每个学校、每位家长、每个学生都会基于自身利益最大化的角度考虑,最终导致合作无法产生。

减负之后,不少家长会这样想:假定其他孩子减负玩耍,我家孩子在家苦读,将来考大学会有优势。

假定其他孩子也在家苦读,我家孩子就得加倍苦读,否则就会在将来的高考为别人垫底了。

于是,家长对孩子的学习发而抓得更严。

还有,学生自己也会想:别人都补课,我总不能不补。

加上学校为了提高升学率,也不得不竞相增加学生的可与作业。

事实上,减负并不减负,其原因是显然的,只要进大学还要考,中学生还只能走高考这一条独木桥。

负是难减的,所谓上有政策,下有对策。

相关主题