中国特色社会主义理论与实践研究:浅谈囚徒困境在社会制度建设中的启示摘要:博弈论(Game Theory),是研究既定规则下对局各方的策略选择的一门学科,属于数学的一个分支,是生物学、经济学、国际关系学、政治、军事等学科的重要分析工具。
博弈论中最基本的博弈模型——囚徒困境,阐述了在参与双方在背叛和合作选择中的策略倾向,在社会各个领域,小到生活,大到国际关系,都广泛的存在。
对于假定理性自私的博弈参与者,其策略倾向完全取决于博弈规则的制定,从而达到特定的平衡点。
社会制度建设,是为保障和改善民生的社会建设提供相关的管理、分配制度,从而更有效地推动社会事业、维护社会秩序、建设社会和谐,充当着社会“大博弈”系统的规则制定。
社会体系错综复杂,涉及群体庞大多样,难以用单一或若干个模型完全地加以精确描述。
但是囚徒困境模型因其存在的普遍性,通过对囚徒模型的拓展,可以从某些侧面对社会运作的分析和社会制度建设提供一定参考价值。
关键词:社会制度、社会制度建设、博弈论、囚徒困境1、博弈论与囚徒困境模型1.1 博弈论概述博弈论(Game Theory),主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法,属应用数学的一个分支, 也是运筹学的一个重要学科,目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
具有竞争或对抗性质的行为成为博弈行为。
在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。
为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。
比如日常生活中的下棋,打牌等。
博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。
事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。
数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。
1.2 囚徒困境模型囚徒困境模型便是博弈论中对广泛存在的具体问题中的本质规律进行的一种抽象,其广泛性表现在人们社会活动中的各个方面,对人们在合作机制下的决策制定心理做出了深刻的揭示。
囚徒困境属于博弈论中的非零和博弈,反映个人最佳选择并非团体最佳选择。
囚徒困境模型:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。
结果如表格:乙方策略甲方策略合作背叛合作(甲方0.5年乙方0.5年)(甲方10年乙方0年)背叛(甲方0年乙方10年)(甲方2年乙方2年)模型说明:由上表可知,一方无论在对方做何种选择下,坚持选择背叛总会取的比选择合作得到更好的结果。
即假设乙方选择合作,甲方选择背叛比合作更有好处(背叛则无罪释放,合作则判刑0.5年),假设乙方选择背叛,同样甲方选择背叛的结果优于合作(即背叛则判刑2年,合作则判刑10年)。
同样的对于乙方,也是背叛策略总比选择合作取得更好的结果。
这在博弈论里面称作严格优势策略,即无论对手如何决策,本方某个选择总比其他选择更有优势。
而与严格优势策略对应,选择合作便成为严格劣势策略(即该选择总比其他选择带来更差的结果)。
博弈论中指出,“不要选择你的严格劣势策略”。
因此,对于理性自私的参与者而言,双方必将最后双双选择背叛(决策平衡点),从而导致一个次优结果。
很明显,这个博弈存在着一个优于该结果的情况,但是却无法实现。
1.3 囚徒困境模型的模型拓展与现实意义由上述分析可知,虽然存在合作的可能性,并且合作将会带来整体最优的方案,但是往往结果却导致次优,甚至会由于规则的不同而导致双输。
囚徒困境揭示的本质现象是,当存在合作与不合作情况时,合作往往会带来双方理想的情况,而某方单方面的背叛会带来额外的收益并导致另一方受损,因此在假定参与双方理性自私的前提下,决策平衡点将出现在双方背叛的情况。
在现实生活中,囚徒困境的现象普遍存在。
如宿舍2人打扫卫生,如果两人均自觉打扫,则都能享受卫生的生活环境,但是任何一方只要通过偷懒而企图让对方行动,则他可以不付出劳动而坐享其成(额外收益),因此结果便出现双双拒绝劳动而导致宿舍卫生条件不理想。
又如两大饮料公司的定价,假设市面上只有这2种饮料,如果双双提高价格,则不改变双方销售比,但由于售价提高双双收益,但是采取低价策略的公司更能吸引顾客而增加盈利,从而不采取低价策略的公司受到损失,因此最终结果便不会出现双双高价的双赢局面,没有一方愿意冒险首先提高价格(串通价格不为法律所允许,因此假设双方无法互通是合理的)。
但是经典囚徒困境模型只针对于二人参与、单次博弈情况,而现实存在的更多的是参与者大于2人甚至是远大于2人,个体差异明显,且博弈多次重复的情况,因此把囚徒困境模型推广到多人博弈、重复博弈上更具有普遍性,而不改变其实质。
如囚徒困境往后发展,双方出狱后,被背叛的一方很可能对另一方采取报复,因而双方在选择背叛前需要作出更多的思考,从而导致选择的改变。
又如最普通的排队情况,人人遵守先来后到的排队规则,则能够维护队伍秩序,并减少整体排队时间。
但是任何一个打破规则(不合作)都会带来额外收益(不需要更长的排队时间),因此如果人人,或者大部分人都选择了不合作,那么将会导致整体的混乱和时间损耗。
双人单次博弈的结果往往与多人多次博弈的结果有很大的不同,这其实是制度,或者说游戏规则和收益条件的变动导致的,并不改变人们倾向于实现个人利益最大化的基本特性。
可以说,需要合作的地方,就存在囚徒困境的影子。
而和谐社会的构建,需要社会各个群体的相互协调配合。
因此,在考虑涉及社会大众的、长期的社会制度建设中,借鉴囚徒困境模型带来的一些启示是有意义的。
2、囚徒困境模型与社会制度建设2.1 囚徒困境模型的本质经典囚徒困境模型指出,对于背叛行为会产生额外收益的博弈,结果往往倾向于导致双方均采取背叛策略从而导致合作的破裂和结果的不理想。
而多次博弈,由于参与者需要考虑到后续的影响或后续博弈的结果,便倾向于选择友好的策略。
而这个现象的出现,来源于游戏规则对选择背叛策略的制约(惩罚),任何一方在选择背叛后,将会在下一次博弈中付出大于额外收益的代价。
因此,对于这种博弈,引导参与者选择合作的机制,不单单是选择合作带来的理想结果,更重要的是对选择背叛进行的惩罚。
2.2 社会制度建设中的囚徒困境现象囚徒困境现象在社会生活中普遍存在,如前述的宿舍卫生、公众排队秩序、商业竞争等等。
盗车事件普遍发生而屡禁不止,对社会安定和谐和人民财产安全造成极大的损害。
笔者从母校华南理工大学的学习经历出发,简述其中的囚徒困境现象。
为简化模型突出规律,假设学校及周边车行为封闭系统,新车购买使用后变成旧车。
由于学校地理环境因素,学生上下课需要使用自行车,因此学校单车需求量大,流通量大。
入学新生(及丢车者)往往有两个选择:购买新车和二手车。
新车价格贵,而且由于容易成为盗窃目标,所以大部分同学倾向于购买二手车。
然而市面上合适的正规渠道二手车数量有限,大部分属于赃车,因此为赃车的销售创造了很好的市场,并导致了更多车辆,包括新车和旧车的丢窃,从而出现了纷纷买车又纷纷丢车的现象。
笔者班上统计,人均丢车率高达0.9辆,单人丢车数最高达5部。
这个现象可以解释为,购车者有两种选择:合作(买新车)和背叛(买旧车)。
背叛往往会带来额外收益(价格便宜且不易被偷),而合作却需要承担更多的风险(价格贵,且其他人均买旧车会加大新车被偷窃的概率),若人人选择背叛,则导致整体风险增加(旧车市场大,旧车同样成为盗窃目标,且以“羊毛出在羊身上”的形式在同学之间反复销赃流通),反而如果人人坚持合作,则虽然个别人或者前期会付出一定代价,但整体最终将达成较安定状态(赃车无销售市场,盗窃风险得不到回报,自然得到有效抑制)。
环境保护和生态保护关乎社会根基和长久发展,然而我国环境、生态保护力度和效果却见效甚微。
我们知道,安全生产、环保处理需要增加商家的额外成本,任何商家可以通过不合作的方式取得额外的收益(降低生产成本、提高商业竞争力),而单方面合作的商家却需要付出更多的代价。
因此在缺乏有力管制下,不合作的现象普遍出现,从而导致环境问题愈加严重。
这种整体受损的情况与前述不同,受损的往往不是不合作的商家,而是其他周边的非当事人和后来者,这相当于商家们把自己的生产成本转移到群众身上而自谋其利,背叛产生的副作用不直接作用在商家身上,反而助长其劣行。
生态保护同样具有这方面的规律。
渔业休渔本是为了科学捕鱼,建立长久平衡的捕鱼机制。
但是任何一方在休渔期违背约定,总能在市场供鱼量稀缺时卖出好价钱,获得额外收益。
然而若纷纷违约,不仅额外收益下降(供应量上升),且对渔业的科学持续发展造成深刻的损害。
需要合作的地方,存在背叛产生额外收益的地方,就会出现囚徒困境的影子。
从社会契约论的角度看,国家的产生是人们相互之间或人民同统治者之间相互订立契约的结果。
推广开来,一个组织,一个社会的形成和和谐发展,源于成员之间对某种契约的制定、遵守和维护。
每个个体是生而自由的,但是自由的竞争生存方式往往缺乏足够的保障。
因此人们通过契约的制定,彼此约束对方的行为达到群体共赢,放弃天然自由而转向契约自由,并由契约产生领导者对组织加以领导,同时领导者也受到相关契约的制约。
从这个角度上讲,契约便是社会大系统的总规则,而社会制度则是其中针对民生保障方面的部分。
制定契约,就是制定一系列的合作机制和约束,为社会营造合作互助的融洽生存、竞争氛围,约束会导致群体受损的自由,引导人们进行合作。
因此,社会制度建设,就是对社会合作机制的制定,如何引导人们决策的走向,需要充分认识到其中出现的囚徒困境。
我们可以看到,从单次博弈到多次博弈,囚徒的选择从背叛转变到合作,起关键性因素的便是囚徒需要考虑的后续效应——惩罚。
选择背叛是出于其对合作方的不信任和对额外收益的追求,如果引入合适的惩罚机制,使惩罚代价大于额外收益,并各方约束加强各方的信任和合作趋势,便能有效地引导合作抑制背叛。
合适的激励和惩罚机制,可以加强人民彼此之间的信任和对政府的信任,对合作趋势取到润滑作用。
个体在作出抉择前,清晰地认识到,自己选择合作会比背叛取得更好的结果,而同时也相信其他人同样会选择合作。
这里合适的机制,首应做到的便是公平性。