当前位置：文档之家› 公共品的社区提供博弈论的一个应用

公共品的社区提供博弈论的一个应用

公共品的社区提供：博弈论的一个应用——从“脏乱的男生宿舍”导出的一般性分析苏创（财政系00级）[内容提要]东汉的陈蕃曾说：“一屋不扫，何以扫天下？”但现在的大学男生宿舍不扫一屋的现象颇为普遍。

本文就试图分析为什么没有人扫这区区一屋，如何才能保证有人打扫这一屋？出于自由主义的哲学观，我排除掉了学校的管制，考察大学生内部能够演化出来一种机制来，是宿舍有人打扫清洁。

我运用了博弈论为基本的理论框架，进行了经济学分析，这很有益处，但后来发现新古典的人的行为假定实在是太过简单，于是我后来回到常识，接受了“利他主义”的“意识形态”，从而证明男生宿舍每人打扫清洁关键不在于个人成本-收益不合算，而在于我们的教育对“利他主义”的宣传和弘扬不够。

[关键词]公共资源、域、关联博弈、利他主义、意识形态经济学似乎不甘于仅仅研究经济现象的寂寞，而逐渐把它的触须伸到客观世界中普遍存在的两难困境1。

比如在大学男生宿舍里面，同学一方面想享受干净的环境，另一方面却又希望别人代自己打扫而做一个“自由骑士”（free rider ）；如果每个人都这样投机的话，则室友们估计只能望着堆积如山的垃圾默默兴叹，而对拿起扫帚犹疑不决。

这是大多数男生宿舍的现实，不合适的现实，因为清洁对我们的身体健康和宿舍形象显然是有利的。

于是，我要在本文讨论的就是，为什么会没人主动的打扫清洁？有没有可能走出这个两难困境？如果有可能，那要靠什么规则，内生的演化抑或外生的规制？任何经济分析，思路是至关重要的；在一个框架下进行系统的展开，可以得出一个比较全面的认识，可以避免古代士大夫发表大而无当的宏论所引起的“此亦一是非，彼亦一是非”的莫衷一是的局面。

研究宿舍成员的行为，甚至一切人类行为，的本质是探讨人们之间的相互关系；而这正是博弈论的看家本领。

并且据我了解，博弈论框架下的参与人不再被简单的假定为传统意义上的理性（这是理性被等同于“自利”，阿尔蒂亚⋅森把这称为“自利理性观”，认为把任何偏离自利最大化的行为都看成是非理性行为，就意味着拒绝伦理考虑在实际决策中的作用2）或者有限理性，而是立足于基本的常识：一个现实生活中真实而普通的人。

比如在公共品提供的问题上的林达尔机制，精致的模型画了一大通，最后由于不能保证人们诚实的显示偏好即在对付人们搭便车（社会上大部分人都会如此，我坚信这是事实）面前无能为力而被轻易的驳倒了。

于是我们需要按照常识设定参与人（这些参与人没有学过经济学，不懂得那些假造的术语，他们不仅懂得追求自身利益最大化，而且也会对可能产生的“集体非理性”表示忧虑），这里我假定宿舍只有两个成员1和2，也就是考虑最通常的二人博弈，他们的行动集相同A i ={打扫，不打扫}，重要的是考察他们的收益函数中的自变量是哪些。

根据我的观察，由两部分：一是清洁的环境带来的正的效用，记为Cl ；另一个应是打扫清洁带来负效用的努力成本，记为e = θ i E （>0，E 表示打扫一次清洁需要的总的劳动付出，θi 则表示努力的每人分担，在二人博弈中可以认为θ 1=θ2=12），于是可以将每个人的效用简单的记为u i = Cl –e 。

首先，我们考虑一次性的阶段博弈（静态，两人同时行动）。

而我认为人们是完全信息的，因为每个人的类型都是可以观测到的，比如平时着装的整洁程度，枕巾被单的干净程度都是很容易得到的信息。

于是，在静态的分析中我们可以画出下面这个收益矩阵：参与人2打扫不打扫用画线法可以求出该博弈的纳什均衡。

当参与人1“打扫”时，参与人自然“不打扫”，因为Cl>Cl-12E ；问题是，当参与人1“不打扫”的时候，参与人2就面临两种选择，关键看Cl 和E 的大小：如果Cl>E ，这时我把参与人类型定义为“清洁的强偏好”，选择“打扫”；反之，参与人2就是“清洁的弱偏好”者，选择“不打扫”的行动。

根据参与人的不同偏好，我们可以将这个博弈分成三种：一、两人都是“清洁的弱偏好者”，那么这个博弈就是“囚徒困境”，（不打扫，不打扫）成为一次性博弈的纳什均衡。

二、如果1是“强偏好者”而2是“弱偏好者”，那么最后的纳什均衡是（打扫，不打扫）；着类似于“智猪博弈”。

三、如1《新兴古典主义与超边际分析》P??，杨小凯张永生，中国人民大学出版社，北京。

参与人1果两人都是“强偏好者”的话，最后会形成“你进我退，你退我进”的“斗鸡博弈”状态，有双重纳什均衡（打扫，不打扫）或者（不打扫，打扫）3。

在第二、三种情况下，爱干净的人自然会打扫清洁，比如女生宿舍大多干净整洁就与这种偏好有关。

而在第一种情况下，则是没有人愿意打扫清洁的；然而我们需要而且学校希望我们的居住环境保持卫生，以利于正常的生活和学习。

于是，谁来打扫清洁，提供“宿舍清洁”这种公共品就成为“相关参与人”共同关心的话题。

我借着“关联博弈”的概念造出“关联参与人”，用来指将一个特定博弈中的追求目标（如宿舍成员博弈中的“宿舍清洁”）纳入自身效用函数的参与人，这里至少可以举出处于这个特定博弈中的“宿舍成员”和不处于其中的“学校”两个。

很明显，赏罚并重的学校管制是督促同学打扫清洁的一个可行制度选择，比如规定每周一早上楼长检查清洁，检查到如果打扫清洁了，则每人奖励一个洗衣币；否则，则要通报批评以使名誉受损。

这或许确实是一种很好的办法，但是出于自由主义的经济哲学观．．．．．．．．．．，我是不太欢迎这种外生制度安排的。

向来崇尚自由民主的北大学生对管制是很是反感。

我在本文主要想探讨的是在博弈主体内部内生衍化出来的制度。

显然，在一次性的博弈中，达不到（打扫，打扫）的合作解，但是博弈是不断重复下去的，在完全信息动态博弈的框架下，可以求出一个贴现值δ，使得当这一贴现值大于某一个具体的值的时候，参与人采取触发策略（trigger strategy）对重复的阶段博弈的总收益是有利的：即对方打扫，我就打扫；对方不打扫，我就永远不打扫。

4但是我对该观点有两点疑问：一、时间价值如何计算，即使参与人根据自己的耐心可以大致的估计出δ从而采取策略，忍受不了长期的肮脏环境的人可以预料他会主动打扫，但是仍然存在二、无限重复的阶段博弈假定的最初的合作状态是如何形成的？触发战略的理论背景是无限重复的阶段博弈，人的生命有限，我们不可能也没必要在这个芝麻大点（并不是特指“宿舍清洁”，而可以推广到许多公共品的提供上）的问题上“千年等一回”，所以这个策略尽管可以维持．．合作状态，然而未免悲观了些，我想知道是否还有其他一些内生的（排除掉楼长的条例）制约机制在起作用，促使参与人更快的形成．．提供公共品的制度，也即打扫宿舍，消除恶臭。

顺藤摸瓜，我们有必要沿着第二和第三点疑问进一步的思考，制度作为“旨在约束追求主体福利或效用最大化利益的个人行为”的“一系列被制定出来的规则、守法程序和行为的道德伦理规范”5是如何起源的？我也曾经冥思苦想，但青木昌彦将制度分析纳入博弈论框架的著作《比较制度分析》已经对这一问题作了比较好的解释，于是我愿意这里介绍一下。

“域”（domain）的概念具有“一语惊醒梦中人”的功效。

他写道，“把参与人的行动集合的总和成为博弈的域。

”6显然，“如果域中所有的参与人，给定其自身关于别人策略选择的预期，均选择一定的行动计划，使其当期报酬或当期和未来报酬的现值之和达到最大，那么，这种情形就成为是一种博弈。

”7这只不过是博弈的一般性描述，传统的博弈理论都仅仅考察在一个特定的情形（即一个特定的“域”）下进行，但真实的世界并非如此，世界是各种事物如此复杂的交织在一起以至根本不可能明确的划分出一个特定的域来（移民、交叉学科、模糊产权都是例子），各种域相互影响相互联接。

青木昌彦将“域”分成六种基本的类型：公用资源、交易（经济交换）、组织、社会交换、政体和一般性组织领域。

8考察相关域或跨域的博弈被认为是有生命力的，我觉得这不仅仅包括不同类型的“域”之间的互动，还包括同一种“域”的不同情形之间的互动（一个特例是“社会嵌入”social embeddedness）。

本3关于智猪博弈和斗鸡博弈可参见张维迎《博弈论与信息经济学》导论，上海三联上海人民出版社，1996 4参见《博弈论基础》P71，Robert Gibbens 著，高峰译，中国社会科学出版社，北京，19995《经济史中的结构与变迁》P225-226，Douglass North 著，陈郁罗华平等译，上海三联上海人民出版社，19946《比较制度分析》P12，青木昌彦著，周黎安译，上海远东出版社，上海，20017《比较制度分析》P24文讨论公共品的提供问题，切合“共用资源域”（Commons Domain）：在该域内的参与人集合是由那些使用共用资源的个人构成的，共用资源是任何参与人都可获得的（或由他们联合生产提供的）资源。

其实“宿舍清洁”这种公共品更侧重于“非排他性”，于是“共用资源”还不够清晰的话，不妨引用“Common-Pool Resource”，指一个自然的或人造的资源系统（resource system）足够大以至排除潜在的获利者获利是相当费事的。

9这里没有提到德姆塞茨的“非竞争性”。

青木昌彦在书中举的德川时期日本村庄灌溉系统的例子10。

灌溉系统是一个非排他性的公共品，一旦村民在村民在灌溉系统建成之后成了使用者，即便他在集体劳动中偷懒，也很难不让他接近水源，以示处罚。

在出钱修建灌溉系统时或者集体劳动中就不可避免地出现机会主义者，如果人们预测到这一结局，很可能在最初出现囚徒困境村民出钱的激励很小，从而个体理性导致集体非理性，灌溉系统不会修建。

但实际上灌溉系统修建好了，而且大多数村民得到了好处。

为什么呢？因为“抬头不见低头见”的村民不仅进行“灌溉博弈”，还要进行广泛的“社区的交换博弈”，联结两个博弈和汇合不同的激励约束有助于放松激励约束。

经过一些简单的数学运用，青木昌彦证明了这个策略是重复博弈的均衡：⑴如果在一个博弈中选择了偷懒，那么在灌溉博弈中就会选择偷懒，在社区的交换博弈中选择不合作；否则在灌溉博弈和社区的社会交换博弈中均采取合作；⑵对于任何在灌溉博弈中曾经偷过懒的农户，其他农户一律将他驱逐出所有未来的社会活动，而且只驱逐那些偷过懒的农户。

也就是说，尽管存在技术上的非排他性，禁止偷懒者参加村庄其他日常社会、政治和经济生活，仍然可以构成一种可信．．的威胁。

做个类比，清洁博弈显然只是宿舍成员众多博弈（青木昌彦两个博弈只是一个简化，重要的是关联博弈的精髓）中的一个。

比如，涉及“共用资源域”的还有打水博弈、学习博弈（学习优秀者的作业往往成为共用资源）；还有“社会交换域”博弈，比如聚餐博弈（AA制已然形成一种习俗了）；还有一些类似处于“交易（经济交换）域”中的博弈，该类型的域是由那些私人拥有可以自由交换或处置的物品的个人构成，比如使用电脑博弈（拥有个人电脑的宿舍成员提供墨水使用权一定程度上可以换取别人的好感，从而作为贡献获得在其他一些博弈中的一些优惠或者“特权．．”）；等等。

e商务文档

公共品的社区提供博弈论的一个应用

相关文档推荐：

e商务文档

公共品的社区提供 博弈论的一个应用

相关文档推荐：

公共品的社区提供博弈论的一个应用