当前位置:文档之家› 囚徒困境

囚徒困境

囚徒困境囚徒困境(Prisoner's dilemma)--为什么甚至在合作对双方都有利时,保持合作也是困难的囚徒困境最早是由美国普林斯顿大学数学家阿尔伯特·塔克(Albert tucker)1950年提出来的。

他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论,这个故事后来成为博弈论中最着名的案例。

故事内容是:两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8 年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。

经典的囚徒困境1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。

经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。

于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。

若二人都互相检举(互相“背叛”),则二人同样判监2年。

用表格概述如下:甲沉默(合作) 甲认罪(背叛)乙沉默(合作) 二人同服刑半年甲即时获释;乙服刑10年乙认罪(背叛) 甲服刑10年;乙即时获释二人同服刑2年如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。

参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势策略”,理性的参与者绝不会选择。

另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。

囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。

就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。

试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。

若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。

二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。

背叛是两种策略之中的支配性策略。

因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。

这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。

以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。

但根据以上假设,二人均为理性的个人,且只追求自己个人利益。

均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。

这就是“困境”所在。

例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。

竞争在我们生活中常见的不外乎三种结局:第一种:动态输——赢关系,即以牺牲一方的情感或者利益为代价换取了另一方的胜利。

强的爬出去,弱的在下面被垫底---所以很多都是清除叛徒因为对组织的伤害确实很大,重点是清除叛徒与动摇分子不坚定分子第二种:纳什均衡点输——输关系,即两败俱伤,很显然本故事中的螃蟹就是这种情况-----竹篓里的螃蟹:不管能不能爬出来,至少把别人踩在脚底下就行了,自然选择的结果同质化竞争其实就是自残独木桥就是谁也别爬出去大家一块儿死文革时候很多人是不是怕被批斗,才争着去斗别人唉,恶毒可怕的导向第三种:帕累托最优赢——赢关系,而要做到这一点,必须要彼此信任,学会合作,也就是只有合作才能共同爬出篓子,达到双赢。

(囚徒博弈)人为选择的结果抢夺规则权阳关道囚徒困境(Prisoner's dilemma)--为什么甚至在合作对双方都有利时,保持合作也是困难的囚徒困境最早是由美国普林斯顿大学数学家阿尔伯特·塔克(Albert tucker)1950年提出来的。

他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论,这个故事后来成为博弈论中最着名的案例。

故事内容是:两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8 年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。

沈雅涵怪老头2014-4-8 10:08:20经典的囚徒困境1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。

经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。

于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。

若二人都互相检举(互相“背叛”),则二人同样判监2年。

用表格概述如下:甲沉默(合作) 甲认罪(背叛)乙沉默(合作) 二人同服刑半年甲即时获释;乙服刑10年乙认罪(背叛) 甲服刑10年;乙即时获释二人同服刑2年如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。

参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势策略”,理性的参与者绝不会选择。

另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。

囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。

就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。

试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。

若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。

二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。

背叛是两种策略之中的支配性策略。

因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。

这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。

以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。

但根据以上假设,二人均为理性的个人,且只追求自己个人利益。

均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。

这就是“困境”所在。

例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。

竞争在我们生活中常见的不外乎三种结局:第一种:动态输——赢关系,即以牺牲一方的情感或者利益为代价换取了另一方的胜利。

强的爬出去,弱的在下面被垫底---所以很多都是清除叛徒因为对组织的伤害确实很大,重点是清除叛徒与动摇分子不坚定分子第二种:纳什均衡点输——输关系,即两败俱伤,很显然本故事中的螃蟹就是这种情况-----竹篓里的螃蟹:不管能不能爬出来,至少把别人踩在脚底下就行了,自然选择的结果同质化竞争其实就是自残独木桥就是谁也别爬出去大家一块儿死文革时候很多人是不是怕被批斗,才争着去斗别人唉,恶毒可怕的导向第三种:帕累托最优赢——赢关系,而要做到这一点,必须要彼此信任,学会合作,也就是只有合作才能共同爬出篓子,达到双赢。

(囚徒博弈)人为选择的结果抢夺规则权阳关道普京说的真好!南京死三十万除了是鬼子太残暴,还有就是是国人太聪明要知道去杀三十万只猪或狗,一不小心还会弄个工伤事故、感染死亡什么的,难道三十万南京人真的是猪狗不如?一个台湾老兵、南京大屠杀的幸存者回忆那段历史时写道:我们可能永远不懂五个日本鬼子就可以押着两千人去屠杀!两千人,像猪一样任凭五个人屠杀,多么可怕的事情啊!虽然那五个日本兵有枪,也有刀,但是那两千人并没有被捆着,完全可以动手反抗。

可是他们没有,据某个幸存者口述,他曾经怂恿其他人一起冲上去,可惜回应他的除了沉默,还是沉默。

因为大家都是聪明人,他们明白虽然两千人肯拼命肯定能赢,但是第一个冲上去的肯定会死,所以他们聪明地独善其身,把希望寄托在有其他人第一个冲上去。

可惜的是,大家都是聪明人,没有蠢材,所以他们就只能像猪一样任凭屠杀。

虽然每一个人都是聪明人,但是聚在一起却只是一群聪明的猪而已!生物价值观要求人努力获取最大的利益以维持生存、延续基因,这是理性人假设得以成立的基础人与人之间的关系是经过多次博弈才能看出来的这个多次博弈就是检验品就是说你选择的合作对象首先你必须熟悉,对她的性格一目了然。

这个熟悉的过程就是经验品,比如我看了一下我周围的人,几乎没有可以合作的认。

唯一一个可以合作的他有一个外号傻子,人家直呼其名傻子很多的家庭模式在穷的时候是双赢模式一旦赚钱了就是双输或者是输赢模式穷的时候比较齐心啊一心赚钱有钱了有人想继续赚钱有人却感觉赚钱累。

举个例子我们两个人合作去抢劫然后抢来分。

相关主题