博弈论的基础知识与应用(转)1 基础知识博弈论是一种独特的处于各学科之间的研究人类行为的方法。
与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。
博弈论(如同计算科学理论和许多其他的贡献一样)是由约翰.冯.诺伊曼(John von Neumann)创立的。
博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡.摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。
当然,摩根斯坦把新古典经济学的思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。
■一个科学的隐喻由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个科学的隐喻。
在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。
在博弈论中常常讨论的问题包括:1)当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选择战略意味着什么?2)在允许共同得益或者共同损失的“博弈”中,寻求合作以实现共同得益(或避免共同损失)是否“理性”?或者,采取侵略性的行动以寻求私人利益而不顾共同得益或共同损失,这是否是“理性”的?3)如果对2)的回答是“有时候是”,那么在什么样的环境下侵略是理性的,在什么样的情况下合作是理性的?4)在特定情况下,正在持续的关系与单方退出这种关系是不同的吗?5)在理性的自我主义者的行为互动中,合作的道德规则可以自然而然地出现吗?6)在这些情况下,真正的人类行为与“理性”行为是否相符?7)如果不符,在那些方面不符?相对于“理性”,人们更倾向于合作?或者更倾向于侵略?抑或二者皆是?因而,博弈论研究的“博弈”包括:破产门口的野蛮人(Barbarians at the Gate)网络战(Battle of the Networks)货物出门,概不退换(Caveat Emptor)征召(Conscription)协调(Coordination)逃避(Escape and Evasion)青蛙呼叫配偶(Frogs Call for Mates)鹰鸽博弈(Hawk versus Dove)Mutually Assured Destruction多数决定原则(Majority Rule)Market Niche共同防卫(Mutual Defense)囚徒困境(Prisoner’s Dilemma)补贴小商业Subsidized Small Business公共地悲剧Tragedy of the Commons最后通牒Ultimatum视频系统协调Video System Coordination■理性新古典经济学与博弈论之间的关键链接就是理性。
新古典经济学建基于这样一个假设之上,即人类在其经济选择行为中是绝对理性的。
确切地说,这个假设意味着每个人在其所面临的环境中都会最大化自身的报酬——利润、收入或主观利益。
在资源配置研究中,上述假说服务于两个目的:一是稍稍缩小可能发生事物的范围;二是提供了一个衡量经济体制效率的标准。
如果经济体制导致部分人的报酬减少,而又没有对其他人产生更多的报偿(宽泛地讲就是成本大于收益),那么在某些方面就产生了失误。
污染、渔业资源的过度开发、不恰当的资源用于研究(inadequate resources committed to research)都是这类问题的例子。
在新古典经济学中,理性的个人面临特定的体制或制度,包括产权、货币和高度竞争的市场。
这些是个人纳入最大化报酬计算的许多“情况”之一。
财产权利、货币经济以及理想化的竞争市场的隐含意义是经济个体不需要考虑自己与其他经济个体的行为互动。
他或她只需要考虑自己的境况和“市场条件”。
但这导致了两个问题:一是理论的范围受到局限。
只要竞争受到限制(但没有垄断)或者产权没有完全界定,众望所归的新古典经济学理论就不适用了,并且新古典经济学也从未产生可接受的理论扩展以覆盖上述情况。
对于新古典经学来说,决策是在货币经济之外做出的,这也是有问题的。
博弈论正好面对上述问题:提供一个关于人们直接(而不是“通过市场”)互动的经济和战略行为的理论。
在博弈论中,“博弈”始终是针对人类社会严肃的互动行为的一个隐喻。
博弈论也许是关于纸牌游戏或者棒球运动的理论,但却不是关于象棋的理论,它是关于这样一些严肃的互动行为比如市场竞争、军备竞赛和环境污染的理论。
只不过博弈论涉及这些问题的时候使用的是博弈的隐喻意义:在这些严肃的互动行为中,就象在游戏中一样,个体的选择实质上是战略选择,行为互动的结局依赖于每个参与人所选择的战略。
通过这样的阐释,研究“博弈”可以真正告诉我们关于严肃的互动行为的一些事情。
但是,究竟会告诉我们多少?在新古典经济学理论中,理性地进行选择就是要最大化自身的收益。
在某种观点看来,这是一个数学问题:在给定环境条件下选择最大化报酬的行动。
因而我们可以把理性的经济选择当作一个数学问题的“解”。
在博弈论中,情况就更复杂了。
既然结局不仅依赖于自身的战略和“市场”条件,也直接依赖于其他人所选择的战略,但我们仍然可以把理性的战略选择当作一个数学问题——最大化行为互动中的决策制定者群体的报酬——从而我们再次称理性的结果是博弈的“解”。
2 囚徒的困境■囚徒困境博弈■占优战略(Dominant Strategies)这里发生的情况是,两个囚犯陷入了“占优战略均衡”。
定义:占优战略——让博弈的参与人单独地评估他面临的战略组合中的每一个战略,并且,对于每一个组合,他从自己的所有战略中选择一个使他赢利最多的战略。
如果对于参与人面临的每一个不同的战略组合,参与人都选择同一个战略,这个被选择的战略就叫该参与人在博弈中的“占优战略”。
定义:占优战略均衡——在一个博弈中,如果每个参与人都有一个占优战略,且每个参与人都采取占优战略,那么(占优)战略组合及其相应的赢利被认为是构成了博弈的占优战略均衡。
在囚犯困境博弈中,坦白是占优战略,当两个囚犯都选择坦白时,那就是占优战略均衡。
■囚犯困境中需要考虑的问题导致占优战略均衡的推理也许是强制进行的,但它并不是推导出问题的唯一方式。
也许它根本就不是最理性的答案。
3 一个信息技术的例子博弈论提供了一个很有发展前途的方法去理解各类战略问题,囚犯困境及其他类似例子的简明和威力使它们有了一个自然而然的起点。
但是在更为复杂和现实的应用中,常常有一些我们必须考虑的冲突。
怎样从一个简化的博弈转移到更现实的博弈模型?现在让我们来看一个真实世界的战略思考的例子:选择信息系统。
这个例子中,参与人是:一个正在考虑选择新的内部电邮系统(internal e-mail system)或内部互联网系统(intranet system)的公司,以及一个正在考虑制造它们的供应商。
两个选择是:建立技术先进的系统,或者建立一个功能简单的一般系统。
我们假定更先进的系统真的能够提供更多的功能,因此两个参与人的赢利,用户支付给供应商的净额如表3-1所示。
表3-1用户先进一般供应商先进20,200,0一般0,05,5我们发现,如果建立先进系统,两个参与者的净收入都将更好。
(我们不是宣称现实永远如此!我们仅仅是假设在这个特定的决策下是如此)。
可能发生的最糟糕的情况是一个参与者确定先进系统而另一个参与者却坚持一般系统。
在这样的情况下将没有交易,大家也就没有赢利。
为了在一起工作,供应商和用户必须具有一个相容的标准,既然标准的选择即战略选择,那么他们的战略必须相互吻合。
尽管第一眼看上去这很象囚犯困境博弈,但它实际上是更复杂的博弈。
我们将逐一探讨几个复杂的方面:仔细看一看,我们发现这个博弈没有占优战略。
每个参与人的最优战略依赖于对方所采取的战略。
因而,我们需要一个新的可以容纳这种复杂性的博弈均衡概念。
当没有占优战略时,我们通常用一个叫做“纳什均衡”(Nash Equilibrium)的概念来称呼均衡。
纳什均衡是根据诺贝尔奖得主纳什来命名得。
纳什均衡是一个非常美妙简单的思想:给定其他参与人所选择的战略,每个参与人都选择最优战略,我们将得到纳什均衡。
例如,如果用户选择先进系统,那么供应商最好也选择先进系统。
于是(先进,先进)就是一个纳什均衡。
但是,请留意,如果用户选择一般系统,那么供应商最好也选择一般系统。
这里存在两个纳什均衡!究竟哪一个会被选择呢?看起来选择先进系统是更好的,因此它可能更容易出现,但是如果每个参与人都认为对方陷在一般系统——恰如陷入泥土中的手杖之一段——那么双方选择一般系统将是最好的。
假定对方是一根陷入泥土的手杖,双方都会正确选择的。
这是一类非常危险的经典博弈,叫做“协调博弈”(coordination game)。
我们已经学习到的是,相容标准选择是协调博弈。
我们假定赢利是确定而且大家都知道的。
在现实世界,每一个战略决策都有风险——针对先进系统的决策可能比针对一般系统的决策具有更大的风险。
因而,要使例子完全现实化,我们还需要考虑参与人对风险的主观态度,考虑他们的“风险规避”(risk adversion)。
在这个例子中我们不做这样的尝试,但是我们必须把这些记在脑海里。
在例子中我们假定赢利是以货币计量的。
因而,我们不仅不考虑风险规避,而且没有考虑无法用货币来计量的主观收益或损失。
经济学家有办法用货币项目来测度主观收益——有时候他们确实这样做——不过,我们将跨过这个问题并假定所有的报酬或惩罚都已经货币计量化,并且在用户与供应商之间可以进行转移,反之亦然。
现实中,信息系统的选择可能包括两个以上的参与人,至少在长期是如此——用户可能在几个供应商之间选择,而供应商也可以有很多客户。
这使得协调问题更难以解决。
例如,假设“beta”是先进系统而“VHS”是一般系统,假设90%的市场使用“VHS”。
那么尽管“beta”是更好的系统,但仍将被“VHS”接管。
许多经济学家,博弈理论家和其他人相信,这是某种技术标准获得支配地位的原因。
(Macintosh机正在谱写这样的篇章。
你是否能想到其他的象beta与VHS的例子?)另外,例子中用户和供应商不能坐下来等待并观察对方采取什么行动——他们可以坐下来商量,并达成协议。
事实上,他们的确这样做,因为用户支付给供应商的金额——在此之前我们忽略了这个战略决策——也必须达成协议。
换句话说,与囚犯困境不同,这是一个合作博弈(cooperative games),而不是非合作博弈(noncoorperative game)。
在一方面,这将使协调标准的问题变得容易,至少在短期如此;在另一面,合作博弈需要不同的方法去求解。