囚徒困境的根源与启示解读
但是,假如自己提出这样的政策,而对方并不附和,则自己会落得糟糕的下场。显而易见,对每 一方而言,保持被动是一个优势策略。而这正是真实发生的情况:这一届国会根本没有作出任何 加税决定。这就是为什么美国是世界上最富有的国家,却同时又是最大的债务国的原因。
举例来是说,我是供应商,你是大超市,你可 以选择拖欠货款,我也可以选择延迟发货或较低的 质量,套用上面的模型:
在囚徒困境中,参与者会受到背叛(坦白)的 短期诱惑,但是通过与对方建立长期的合作的 模式,可以获得更多的长期的好处。
所以,要破解囚徒困境,就要跳出这个模型本 身,从更高的层面上给以制度性的约束,或让
大家都明白合作的好处。
1984年,美国联邦预算赤字实在太高了。裁减必要的巨 额开支在政治上并不可行,因此,大幅增税应该是不可避免 的。不过,谁愿意带头主张这么做呢?
下一个问题是,双方都有相同的想法,明知第九局对方会背叛自己,所 以第八局保持沉默也是没有意思的,第七局亦然,如此类推,纳什均衡是十 局都会互相背叛,建立互信关系是没有可能的。
只有在囚徒困境的局数大家都不肯定的情况下,上述的推论才不会发生, 才会出现互相保持沉默的现象
在个体之间存在行为和利益相互制约的博弈 结构中,以个体理性和个体选择为基础的分 散决策方式,无法有效地协调各方面的利益, 并实现整体、个体利益共同的最优。简单地 说,“囚徒的困境”问题都是个体理性和集 体理性的矛盾引起的。
单次发生的囚徒困境,和多次重复的囚徒困境结果 不会一样。
在重复的囚徒困境中,博弈被反复地进行。因 而每个参与者都有机会去“惩罚”另一个参与者前 一回合的不合作行为。这时,合作可能会作为均衡 的结果出现。欺骗的动机这时可能被受到惩罚的威 胁所克服,从而可能导向一个较好的、合作的结果的其他例证,囚徒困境假定每 个参与者(即“囚徒”)都是利己的,即 都寻求最大自身利益,而不关心另一参与 者的利益。参与者某一策略所得利益,如 果在任何情况下都比其他策略要低的话, 此策略称为“严格劣势”,理性的参与者 绝不会选择。另外,没有任何其他力量干 预个人决策,参与者可完全按照自己意愿 选择策略。
“纳什均衡”对亚当·斯密的“看不见的手”的原 理提出挑战。按照斯密的理论,在市场经济中, 每一个人都从利己的目的出发,而最终全社会达 到利他的效果。《国富论》中有这样一句名言: “通过追求(个人的)自身利益,他常常会比其实 际上想做的那样更有效地促进社会利益”。从 “纳什均衡”我们引出了“看不见的手”的原理 的一个悖论:从利己目的出发,结果损人不利己, 既不利己也不利他。两个囚徒的命运就是如此。
从这个意义上说,“纳什均衡”提出的悖论实际 上动摇了西方经济学的基石。因此,从“纳什均 衡”中我们还可以悟出一条真理:合作是有利的 “利己策略”。但它必须符合以下黄金定律:按 照你愿意别人对你的方式来对别人,但只有他们 也按同样方式行事才行。也就是中国人说的“己 所不欲勿施于人”。但前提是人所不欲勿施于我。
囚徒困境的现实意义
简单的说,就是如果你认为以后大家还要相处, 那么最好选择合作;反之,如果你认为以后不再会 相遇或对你以后的利益不太关心,那么就 选择背叛 (把对方供出来)。这样又回到问题的原点:如果 未来是重要的,那么就要选择合作,而合作的策略 取决于对方的策略。 于是结论是:没有最优策略!
囚徒困境的现实意义
民主党总统候选人沃尔特·蒙代尔在竞选活动中提出增税 政策,却被罗纳德·里根打得落花流水,因为里根许诺绝不加 税。
里根当选之后,这个议题陷入僵局,无论你怎么划分政 治派别,民主党对共和党,众议院对参议院,还是政府对国 会,各方都希望把提出加税的主动权推给对方。
双方都知道,联合起来共同倡议加税和削减开支,可以 共同分享荣誉,分担谴责。这么做与同时坚守被动,眼看巨 额赤字上升而无所作为相比,显然会对整个国家更有利,即 便对他们自己的政治生涯从长期而言也会有好处。
这种想法合理吗? 在第十局时,互信的关系明显是没有意义的,因为十局已经完结,囚徒
没有必要为维持互信的关系而沉默(没有第十一局),所以第十局囚徒一定会 背叛对方的,理由和只有一局囚徒困境一样。
问题是,既然大家都知道在第十局,无论如何对方都会背叛自己的,你 在第九局保持沉默也是没有意思的,要知道,保持沉默(友好关系)的原因是 为了希望下一局别人保持沉默。所以第九局双方都一定会背叛对方的。
不合作 供应商
合作
不合作 -5 -5
-8 2
超市 合作 2 -8
11
在这个假设的模型里,超市会想:如果供应 商合作,我只要不合作,就可以得到2个单位的 利润,而合作却只有1个单位的利润,显然不合 作比合作好;如果供应商不合作,我若合作,则 要损失8个单位的利润,但不合作却只损失5个单 位的利润,显然还是不合作比较好。无论供应商 是否合作,超市的最佳策略都是不合作。
囚徒困境的现实意义
囚徒困境的现实意义就是个人理性导致集体非理性。 在囚徒博弈的模型中,只存在一个纳什均
衡,即:在参与者理性的情况下,坦白为最优策 略。这同时导致了集体利益的最小化。
事实上,在囚徒困境中的最佳策略取决于对 方采用的策略,特别是取决于这个策略为双方 合作留出多大的余地。而这个原则的基础是:以 后对于现在的权重足够大,即:未来是重要的。
“囚徒的两难选择”有着广泛而深刻的意义。个 人理性与集体理性的冲突,各人追求利己行为而 导致的最终结局是一个“纳什均衡”,也是对所 有人都不利的结局。他们两人都是在坦白与抵赖 策略上首先想到自己,这样他们必然要服长的刑 期。只有当他们都首先替对方着想时,或者相互 合谋(串供)时,才可以得到最短时间的监禁的结 果。
试想像囚徒困境的情况进行十次。 我们可以合理地设想,如果囚徒第一次被对方指控,第二次这个囚徒也
会指控对方。相反,如果第一次 别人保持沉默,建立了互信的关系,你也会保持沉默,达致帕累托最优。
当然,两个囚徒都会有相似的想法,在第一局保持沉默,以期望建立互 信关系,所以双方都会保持沉默。第二局时,双方亦应有相似的想法,继续 保持沉默,以期继续在互信的情况下进行第三局,以致余下的八局。