囚徒困境及其启示 1
然而实际上,如果两人都抵赖,那么都会无罪释放,显然这 个结果是最好的。但人在理性算计排除了这一结果。
这个故事讲得就是囚徒困境,是在1950年,由就职于兰德公 司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔 (Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔 伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒 困境”。
囚徒困境
小组成员:王嘉瑶 王洁霞 王孟佳 王晓斌
什么是博弈论?
博弈论又被称为对策论(Game Theory)既是现代数学的一个新分 支,也是运筹学的一个重要学科。
博弈论主要研究公式化的激励结构间的相互作用。是研究具有斗 争或竞争性质现象的数学理论和方法。 博弈论考虑游戏中的个体 的预测行为和实际行为,并研究它们的优化策略。生物学家使用 博弈理论来理解和预测进化论的某些结果。
有2个涉嫌共同作案偷窃的嫌疑人 A和B离审讯,每个犯罪嫌疑人都无法 观察到对方的选择。
警方怀疑他们作案,但并没有掌 握他们作案的确凿证据,于是明 确地分别告诉2名嫌疑人:对他们 犯罪事实的认定及相应的量刑, 完全取决于他们自己供认与否。
如果一方与警方合作,坦白所做违 法之事,而另一方抵赖,招认方将无 罪释放,另一方则会被判重刑8年;
如果双方都与警方合作共同招认, 各被判刑5年;
如果双方均不认罪,因为警察找不 到其他证明他们违法的证据,则判刑 1年。
A B
不坦白
坦白
不坦白 坦白
A:判刑1年 B:判刑1年 A:判刑8年 B:无罪释放
A:无罪释放 B:判刑8年 A:判刑5年 B:判刑5年
现实中,基于人是理性的这一前提,无论同伙是否坦白,自 己坦白总是比不坦白好。两个人这样一算计,最好的结果都 是选择坦白,各判刑5年。
5)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即 相关量处于稳定值。在供求关系中,某一商品市场如果在某一价 格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出, 此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是 一稳定的博弈结果。
“囚徒困境”是1950年美国兰德公司提出的博弈论模 型。两个共谋犯罪的人被关入监狱,不能互相沟通情 况。如果两个人都不揭发对方,则由于证据不确定, 每个人都坐牢一年;若一人揭发,而另一人沉默,则 揭发者因为立功而立即获释,沉默者因不合作而入狱 十年;若互相揭发,则因证据确实,二者都判刑八年。 由于囚徒无法信任对方,因此倾向于互相揭发,而不 是同守沉默。
台湾要买美国的F16,中国希望欧洲对华军售,两个地区的政府都在 为武器画着大价钱从而损失了国家的经济发展力,这也是囚徒困 境的模式,都会担心如果一旦开战会对自己不利,如果我没有先 进武器,你有先进武器,那么开战的话我就会吃亏。如果我有先 进武器你没有的话,我就会得利。所以我一定要有先进武器。殊 不知如果两岸达成和平条约,双方都不购买先进武器,把资金都 放在经济发展人民收入上,那才是真的双赢。
政治博弈也是一种非零和博弈。
零和效应:实力相当的双方在谈判时做出大体相等的让 步,方可取得结果,亦即每一方所得与所失的代数和大 致为零,谈判便可成功。然而,人类社会发展的历程越 来越走向“非零和”也就是我们现在所说的双赢。
要素
1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为 一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多 于两个局中人的博弈称为 “多人博弈”。
2)策略:一局博弈中,每个局中人都有选择实际可行的完整的行 动方案,即方案不是某阶段的行动方案,而是指导整个行动的一 个方案,一个局中人的一个可行的自始至终全局筹划的一个行动 方案,称为这个局中人的一个策略。
之政治博弈
50年后军事解密,朝鲜战争的起因,因为中国和美国都有考虑, 我国是怕韩国如果统一朝鲜后美军会侵略中国,而美军是怕如果 朝鲜统一韩国后,中国军队会侵略日本,在占领日本后威胁美国 本土。所以双方都是以出兵和不出兵考虑,如果出兵,会有经济 损失,如果不出兵会威胁自己的领土,所以双方在”囚徒困境 “模式下都选择了出兵,最后两败俱伤。
基本概念中包括局中人、行动、信息、策略、收益、均衡和结果 等。其中局中人、策略和收益是最基本要素。局中人、行动和结 果被统称为博弈规则。
类型
(1)合作博弈——研究人们达成合作时如何分配合作得到的收益,即收 益分配问题。
(2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自 己的收益最大,即策略选择问题。
(3)完全信息/不完全信息博弈:参与者对所有参与者的策略空间及策 略组合下的支付有充分了解称为完全信息;反之,则称为不完全信息。
(4)静态博弈和动态博弈
静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动 者不知道先行动者的策略。
动态博弈:指双方的的行动有先后顺序并且后行动者可以知道先行动 者的策略。
非零和博弈是一种合作下的博弈,博弈中各方 的收益或损失的总和不是零值,它区别于零和 博弈。在经济学研究中比较有用。 在这种状况 时,自己的所得并不与他人的损失的大小相等, 连自己的幸福也未必建立在他人的痛苦之上, 即使伤害他人也可能“损人不利己”,所以博 弈双方存在 “双赢”的可能,进而达成合作。
现实中的囚徒困境
3)得失:一局博弈结局时的结果称为得失。每个局中人在一局博 弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且 与全局中人所取定的一组策略有关。所以,一局博弈结束时每个 局中人的“得失”是全体局中人所取定的一组策略的函数,通常 称为支付(payoff)函数。
4)对于博弈参与者来说,存在着一博弈结果 。
囚徒困境的核心理念是:博弈全输,合作双赢,怀疑或不信 任导致失败。
要诀:注重合作,力求双赢;注重策略选择,善于换位思考。
囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个 人最佳选择并非团体最佳选择。虽然困境本身只属模型性质, 但在现实中政治、经济、军事、企业经营、社会生活、组织 管理等方面,也会频繁出现类似情况。