微观经济学作业
-从囚徒困境看纳什均衡和帕累托最优纳什均衡又称为非合作赛局平衡,是博弈论的一个重要概念。
根据帕金的《经济学》一书对于纳什均衡的定义为:参与者A在给定B行为的条件下采取最好的行为,B也在给定A行为的条件下采取最好的行为。
纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。
设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的),则此策略组合被称为纳什均衡。
帕累托最优,也称为帕累托效率,是指资源分配的一种理想状态,即假定固有的一群人和可分配的资源,从一种分配状态到另一种状态的变化中,在没有使任何人境况变坏的前提下,也不可能再使某些人的处境变好。
换句话说,就是不可能再改善某些人的境况,而不使任何其他人受损。
需要指出的是,帕累托最优只是各种理想态标准中的“最低标准”。
也就是说,一种状态如果尚未达到帕累托最优,那么它一定是不理想的,因为还存在改进的余地,可以在不损害任何人的前提下使某一些人的福利得到提高。
但是一种达到了帕累托最优的状态并不一定真的很“理想”。
比如说,假设一个社会里只有一个百万富翁和一个快饿死的乞丐,如果这个百万富翁拿出自己财富的万分之一,就可以使后者免于死亡。
但是因为这样无偿的财富转移损害了富翁的福利(假设这个乞丐没有什么可以用于回报富翁的资源或服务),所以进行这种财富转移并不是帕累托改进,而这个只有一个百万富翁和一个饿死乞丐的社会可以被认为是帕累托最优的。
这里可以与古典功利主义的标准做一比较。
按功利主义的标准,理想的状态是使人们的福利的总和最大化的状态。
如果一个富翁损失很少的福利,却能够极大地增加乞丐的福利,使其免于死亡,那么社会的福利总和就增加了,所以从功利主义的角度看,这样的财富转移是一种改善,而最初的极端不平等状态则是不理想的,因为它的福利总和较低。
可以看到,帕累托改进要求在提高某些人福利的时候不能减少任何一个人的福利,而功利主义则允许为了提高福利总和而减少一些人的福利。
囚徒困境的大意是囚徒困境是一个非零和博弈。
大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判一年,而对方将被判刑十年;如果两人均招供,将均被判刑三年。
如果两人均不招供,将最有利,只被判刑二年。
于是,两人同时陷入招供还是不招供的两难处境。
但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳许均衡点。
这时,个体的理性利益选择是与整体的理性利益选择不一致的。
基于经济学中“理性经济人”的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑半年就不会出现。
事实上,这样两人都选择坦白的策略以及因此被判两年的结局被称作是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。
在上述囚徒困境模型中,如果甲相信乙招供,那么他的最佳策略是招供,而如果乙相信甲招供,那么他的最佳策略仍是招供。
这就是一个纳什均衡,它是“自确定”的。
但是,这个纳什均衡不是帕累托最优。
根据帕累托最优的定义,显然,在上述囚徒困境模型当中,甲乙两个人都从理性的角度出发,追求自身效用的最大,结果是双方不合作,都认罪了。
也就是说,实现了纳什均衡。
但是,如果甲与乙合作,产生的结果要比双方不合作好得多。
也就是说,如果双方合作,就存在帕累托改进那么,为什么两人不敢合作呢?甲会这样推理:“假如乙不招供,我只要一招供,只要坐牢一年,而不招供却要坐牢2年,显然招供比不招供好;假如乙招供了,我若不招供,则要坐牢10年,招供了只坐3年牢,显然还是招供的好。
可见,无论乙招供与不招供,我的最佳选择都是招供。
”同理,乙也会如此推理。
于是,谁也不敢选择合作。
所以,在囚徒困境这个模型当中,从个人的理性出发,推导不出帕累托最优。
由此可见,纳什均衡只是一种平衡,而不是一种帕累托最优,不是一种完美的结局。
根据帕累托最优,也许两个都选择不招供会是一个更好的选择。
关于纳什均衡有着很大的局限性,它的研究是针对两三个节点的小规模博弈论。
这个假设的不完善处,可能比假设大家都是合作的更严重。
因为在经济学里,一个庞大社会里的人极不可能全部都是合作的,非合作的情况通常在庞大对象的情形中更普遍,而在两三个节点的小规模经济中倒反而影响较小。
既然改了合作前提为非合作前提,却仍然停留在两三个节点的小规模博弈论中,这是一个不可忽视的缺陷。
因此即使知道平衡不动点解存在,在很多情况下却找不到,因此仍不能解决问题
而帕累托最优,如同上面指出的,一个帕累托最优的经济系统只是在“最低”的意义上是“理想”的,并不能保证其中没有贫困或严重的贫富差距。