浅析博弈中的囚徒困境
班级:
姓名:
学号:
摘要:囚徒困境是博弈论的非零和博弈中具代表性的例子,个人最佳选择并非团体最佳选择,个人理性有时会导致集体的非理性——机关算尽却因而作茧自缚,这就是囚徒困境所反映的问题。
一经典的囚徒困境
“囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。
两个共谋犯罪的人被关入监狱,不能互相沟通情况。
如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人隐瞒,则揭发者因为立功而立即获释,隐瞒者因不合作而入狱五年;若互相揭发,则因证据确实,二者都判刑三年。
从集体上看,他们应当互相合作,都隐瞒,这样总服刑时间最短(为2年)。
但他们会仔细考虑对方可能采取什么样的选择,并从自身利益出发做出选择。
他们会意识到,如果同伙隐瞒而自己背叛,就能使自身利益最大化(0年)。
但他也意识到,他的同伙也不傻,也会这样来设想,这样的话,他就更不可能让同伙得利(服刑0年)而自己受害(服刑5年)所以结论就是,唯一正确的选择就是背叛同伙,把一切都告诉警方,如果他的同伙保持隐瞒,那么他就会是那个获释出狱,服刑0年。
而如果他的同伙也向警方交代了,那么,他只需服刑3年而不是5年。
所以结果只能是两个囚犯都坐牢服刑3年,而不是都服刑1年。
所以对于他们个人来说都是理性的,然而对集体来说却是非理性的。
二重复多次
如果囚徒困境的情况重复多次,会有什么新的变化?假设重复10次。
我们可以合理地设想,如果囚徒第一次被对方指控,第二次这个囚徒也会指控对方。
相反,如果第一次相反,如果第一次别人保持隐瞒,建立了互信的关系,你也会保持隐瞒,导致最优。
当然,两个囚徒都会有相似的想法,在第一局保持隐瞒,以期望建立互信关系,所以双方都会保持隐瞒。
第二局时,双方亦应有相似的想法,继续保持隐瞒,以期继续在互信的情况下进行第三局,
以此类推。
直到第十局时,互信的关系明显是没有意义的,因为十局已经完结,囚徒没有必要为维持互信的关系而隐瞒(没有第十一局),所以第十局囚徒一定会背叛对方的,理由和单次囚徒困境一样。
问题是,既然双方都知道在第十局,对方都会背叛自己,那么在第九局保持隐瞒也是没有意义的,因为,保持隐瞒(友好关系)的原因是为了下一局对方继续保持隐瞒,所以第九局双方又都会背叛对方的。
然后是第八局,明知第九局对方会背叛自己,所以第八局保持隐瞒也是没有意思的,第七局亦然,如此类推,结果是十局都会互相背叛,建立互信关系又是没有可能的。
但是随着重复次数的增加,最后一局的比重降低,而且得出“纳什均衡”需要的思考次数增多,双方都选择隐瞒的几率也随之上升。
所以在囚徒困境的局数较多或者不确定的情况下,出现互相隐瞒的结果几率较大。
三典型案例
生活中,经常会遇到各种各样的价格战,比如前些时间的打车软件血拼,再比如支付宝与微信支付的各种优惠,普遍的各种促销等等。
这些价格战的受益者是消费者。
在这里,我们可以认为价格战是一个囚徒困境,而且价格战的结果是谁都没多少钱赚。
竞争的结果是稳定的,即是一个“纳什均衡”。
这个结果对消费者是有利的,但对厂商而言是不利的。
竞争削价促销的结果或“纳什均衡”可能导致一个有效率的极低利润结局。
如果不采取价格战,每一个企业都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。
如果垄断可以形成,则博弈双方的共同利润最大。
这种情况就是垄断经营所做的,通常会抬高价格。
另一个极端的情况是厂商用正常的价格,双方都可以获得利润。
事实上,完全竞争的均衡就是“纳什均衡”。
在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。
在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了低利润,也就是说价格等于边际成本。
在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。
如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。
这就是反垄断的原因所在。
四如何走出囚徒困境
1.进行多次重复博弈
在第二节中提到,随着重复次数的增加,最后一局的比重降低,而且得出“纳什均衡”需要的思考次数增多,双方都选择隐瞒的几率也随之上升。
比如,在公共汽车上,两个陌生人会为一个坐位争吵,而两个互相认识的人,就会相互谦让。
对于任何一个参与者的任何一次背叛都会招致对方在下一次博弈时的报复,这就使得当前的背叛相对于整个未来的接触过程来说不是那么有诱惑力,于是参与者更倾向于选择合作的策略。
实际上,在无限次重复博弈的情况下,合作可能是稳固的。
无限次重复囚徒困境或者让局中人认为该博弈将重复无限次,这样的话人们会更加倾向于合作,于是,囚徒困境就有可能被破解。
2.进行信息沟通
博弈各方可以进行有效的信息沟通来达成某种协议,将博弈双方变成一个整体,使博弈各方通过合作走出“囚徒困境”,从而实现双赢或多赢。
这便将各方由原先的对立关系转化为合作关系。
在这个过程中,将个体理性,逐渐向集体理性的方向调整。
3.借助外力
引进外力,对不合作者进行惩罚,这样能极大增强博弈各方之间的信任,从而使合作得以形成。
这种外力一方面可以是法律。
另一种外力可以是道德。
通过外力对某些不合作行为进行惩罚。
自私不合作的人会面临严重的后果,这样就会促使人们走向合作,帮助人们走出囚徒困境。