当前位置：文档之家› 囚徒困境及其启示 1

囚徒困境及其启示 1

然而实际上，如果两人都抵赖，那么都会无罪释放，显然这个结果是最好的。但人在理性算计排除了这一结果。
这个故事讲得就是囚徒困境，是在1950年，由就职于兰德公司的梅里尔·弗拉德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问阿尔伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。
囚徒困境
小组成员：王嘉瑶王洁霞王孟佳王晓斌
什么是博弈论？
博弈论又被称为对策论（Game Theory）既是现代数学的一个新分支，也是运筹学的一个重要学科。
博弈论主要研究公式化的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。
有2个涉嫌共同作案偷窃的嫌疑人 A和B离审讯，每个犯罪嫌疑人都无法观察到对方的选择。
警方怀疑他们作案，但并没有掌握他们作案的确凿证据，于是明确地分别告诉2名嫌疑人：对他们犯罪事实的认定及相应的量刑，完全取决于他们自己供认与否。
如果一方与警方合作，坦白所做违法之事，而另一方抵赖，招认方将无罪释放，另一方则会被判重刑8年；
如果双方都与警方合作共同招认，各被判刑5年；
如果双方均不认罪，因为警察找不到其他证明他们违法的证据，则判刑 1年。
A B
不坦白
坦白
不坦白坦白
A：判刑1年 B：判刑1年 A：判刑8年 B：无罪释放
A：无罪释放 B：判刑8年 A：判刑5年 B：判刑5年
现实中，基于人是理性的这一前提，无论同伙是否坦白，自己坦白总是比不坦白好。两个人这样一算计，最好的结果都是选择坦白，各判刑5年。
5)博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。所谓纳什均衡，它是一稳定的博弈结果。
“囚徒困境”是1950年美国兰德公司提出的博弈论模型。两个共谋犯罪的人被关入监狱，不能互相沟通情况。如果两个人都不揭发对方，则由于证据不确定，每个人都坐牢一年；若一人揭发，而另一人沉默，则揭发者因为立功而立即获释，沉默者因不合作而入狱十年；若互相揭发，则因证据确实，二者都判刑八年。由于囚徒无法信任对方，因此倾向于互相揭发，而不是同守沉默。
台湾要买美国的F16,中国希望欧洲对华军售，两个地区的政府都在为武器画着大价钱从而损失了国家的经济发展力，这也是囚徒困境的模式，都会担心如果一旦开战会对自己不利，如果我没有先进武器，你有先进武器，那么开战的话我就会吃亏。如果我有先进武器你没有的话，我就会得利。所以我一定要有先进武器。殊不知如果两岸达成和平条约，双方都不购买先进武器，把资金都放在经济发展人民收入上，那才是真的双赢。
政治博弈也是一种非零和博弈。
零和效应：实力相当的双方在谈判时做出大体相等的让步，方可取得结果，亦即每一方所得与所失的代数和大致为零，谈判便可成功。然而，人类社会发展的历程越来越走向“非零和”也就是我们现在所说的双赢。
要素
1)局中人：在一场竞赛或博弈中，每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。
2)策略：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。
之政治博弈
50年后军事解密，朝鲜战争的起因，因为中国和美国都有考虑，我国是怕韩国如果统一朝鲜后美军会侵略中国，而美军是怕如果朝鲜统一韩国后，中国军队会侵略日本，在占领日本后威胁美国本土。所以双方都是以出兵和不出兵考虑，如果出兵，会有经济损失，如果不出兵会威胁自己的领土，所以双方在”囚徒困境 “模式下都选择了出兵，最后两败俱伤。
基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。
类型
(1)合作博弈——研究人们达成合作时如何分配合作得到的收益，即收益分配问题。
(2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大，即策略选择问题。
(3)完全信息/不完全信息博弈：参与者对所有参与者的策略空间及策略组合下的支付有充分了解称为完全信息；反之，则称为不完全信息。
(4)静态博弈和动态博弈
静态博弈：指参与者同时采取行动，或者尽管有先后顺序，但后行动者不知道先行动者的策略。
动态博弈：指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。
非零和博弈是一种合作下的博弈，博弈中各方的收益或损失的总和不是零值，它区别于零和博弈。在经济学研究中比较有用。在这种状况时，自己的所得并不与他人的损失的大小相等，连自己的幸福也未必建立在他人的痛苦之上，即使伤害他人也可能“损人不利己”，所以博弈双方存在 “双赢”的可能，进而达成合作。
现实中的囚徒困境
3)得失：一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff）函数。
4)对于博弈参与者来说，存在着一博弈结果。
囚徒困境的核心理念是：博弈全输，合作双赢，怀疑或不信任导致失败。
要诀：注重合作，力求双赢；注重策略选择，善于换位思考。
囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但在现实中政治、经济、军事、企业经营、社会生活、组织管理等方面，也会频繁出现类似情况。

e商务文档

囚徒困境及其启示 1

相关文档推荐：