背景:两个人因盗窃被捕,警方怀疑其有抢劫行为,但未获得确凿证据可以判他们犯了抢劫罪,除非有一个人供认或两个人都供认。
即使两个人都不供认,也可判他们犯盗窃物品的轻罪。
囚徒被分离审查,不允许他们之间互通消息,并交代政策如下:如果两个人都供认,每个人都将因抢劫罪加盗窃罪被判2年监禁;如果两个人都拒供,则两个人都将因盗窃罪被判处半年监禁;如果一个人供认而另一个拒供,则供认者被认为有立功表现而免受处罚,拒供者将因抢劫罪、盗窃罪以及抗拒从严而被重判5年。
如下表所示。
囚徒困境
在这个模型中,最终两人选择的策略都是供认,因为每个囚徒都会发现:如果对方拒供,则自己供认便可立即获得释放,而自己拒供则会被判0.5年,因此供认是较好的选择;如果对方供认,则自己供认将被判2年,而自己拒供则会被判5年,因此供认是较好的选择。
在上表中明显能够看到存在一种对双方都有利的策略:拒供。
这种策略是一个有利的结局:分别被判0.5年徒刑。
“囚徒困境”有着广泛而深刻的意义。
个人理性与集体理性的冲突,个人追求利己行为而导致的最终结局是一个“纳什均衡”(以其研究者数学家纳什命名),也是对所有人都不利的结局。
甲、乙两人都是在供认与拒供策略上首先想到自己,这样他们必然要服长的刑期。
只有当甲、乙都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。
从利己目的出发,结果是损人不利己,既不利己也不利他。
两个囚徒的命运就是如此。
因此,我们从“纳什均衡”中可以悟出:合作是有利的“利己策略”。
也就是我们所说的“己不所欲勿施于人”。
其次,“纳什均衡”是一种非合作博弈均衡,在现实商务伙伴之间非合作的情况要比合作情况普遍,因此对非合作博弈的研究更具有现实意义。