当前位置:文档之家› 博弈论的基础知识(doc 21页)

博弈论的基础知识(doc 21页)

博弈论的基础知识与应用(转)1 基础知识博弈论是一种独特的处于各学科之间的研究人类行为的方法。

与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。

博弈论(如同计算科学理论和许多其他的贡献一样)是由约翰.冯.诺伊曼(John von Neumann)创立的。

博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡.摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。

当然,摩根斯坦把新古典经济学的思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。

■一个科学的隐喻由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个科学的隐喻。

在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。

在博弈论中常常讨论的问题包括:1)当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选择战略意味着什么?2)在允许共同得益或者共同损失的“博弈”中,寻求合作以实现共同得益(或避免共同损失)是否“理性”?或者,采取侵略性的行动以寻求私人利益而不顾共同得益或共同损失,这是否是博弈论的基础知识与应用(转)1 基础知识博弈论是一种独特的处于各学科之间的研究人类行为的方法。

与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。

博弈论(如同计算科学理论和许多其他的贡献一样)是由约翰.冯.诺伊曼(John von Neumann)创立的。

博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡.摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。

当然,摩根斯坦把新古典经济学的思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。

■一个科学的隐喻由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个科学的隐喻。

在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。

在博弈论中常常讨论的问题包括:1)当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选择战略意味着什么?2)在允许共同得益或者共同损失的“博弈”中,寻求合作以实现共同得益(或避免共同损失)是否“理性”?或者,采取侵略性的行动以寻求私人利益而不顾共同得益或共同损失,这是否是“理性”的?3)如果对2)的回答是“有时候是”,那么在什么样的环境下侵略是理性的,在什么样的情况下合作是理性的?4)在特定情况下,正在持续的关系与单方退出这种关系是不同的吗?5)在理性的自我主义者的行为互动中,合作的道德规则可以自然而然地出现吗?6)在这些情况下,真正的人类行为与“理性”行为是否相符?7)如果不符,在那些方面不符?相对于“理性”,人们更倾向于合作?或者更倾向于侵略?抑或二者皆是?因而,博弈论研究的“博弈”包括:破产门口的野蛮人(Barbarians at the Gate)网络战(Battle of the Networks)货物出门,概不退换(Caveat Emptor)征召(Conscription)协调(Coordination)逃避(Escape and Evasion)青蛙呼叫配偶(Frogs Call for Mates)鹰鸽博弈(Hawk versus Dove)Mutually Assured Destruction多数决定原则(Majority Rule)Market Niche共同防卫(Mutual Defense)囚徒困境(Prisoner’s Dilemma)补贴小商业Subsidized Small Business公共地悲剧Tragedy of the Commons最后通牒Ultimatum视频系统协调Video System Coordination■理性新古典经济学与博弈论之间的关键链接就是理性。

新古典经济学建基于这样一个假设之上,即人类在其经济选择行为中是绝对理性的。

确切地说,这个假设意味着每个人在其所面临的环境中都会最大化自身的报酬——利润、收入或主观利益。

在资源配置研究中,上述假说服务于两个目的:一是稍稍缩小可能发生事物的范围;二是提供了一个衡量经济体制效率的标准。

如果经济体制导致部分人的报酬减少,而又没有对其他人产生更多的报偿(宽泛地讲就是成本大于收益),那么在某些方面就产生了失误。

污染、渔业资源的过度开发、不恰当的资源用于研究(inadequate resources committed to research)都是这类问题的例子。

在新古典经济学中,理性的个人面临特定的体制或制度,包括产权、货币和高度竞争的市场。

这些是个人纳入最大化报酬计算的许多“情况”之一。

财产权利、货币经济以及理想化的竞争市场的隐含意义是经济个体不需要考虑自己与其他经济个体的行为互动。

他或她只需要考虑自己的境况和“市场条件”。

但这导致了两个问题:一是理论的范围受到局限。

只要竞争受到限制(但没有垄断)或者产权没有完全界定,众望所归的新古典经济学理论就不适用了,并且新古典经济学也从未产生可接受的理论扩展以覆盖上述情况。

对于新古典经学来说,决策是在货币经济之外做出的,这也是有问题的。

博弈论正好面对上述问题:提供一个关于人们直接(而不是“通过市场”)互动的经济和战略行为的理论。

在博弈论中,“博弈”始终是针对人类社会严肃的互动行为的一个隐喻。

博弈论也许是关于纸牌游戏或者棒球运动的理论,但却不是关于象棋的理论,它是关于这样一些严肃的互动行为比如市场竞争、军备竞赛和环境污染的理论。

只不过博弈论涉及这些问题的时候使用的是博弈的隐喻意义:在这些严肃的互动行为中,就象在游戏中一样,个体的选择实质上是战略选择,行为互动的结局依赖于每个参与人所选择的战略。

通过这样的阐释,研究“博弈”可以真正告诉我们关于严肃的互动行为的一些事情。

但是,究竟会告诉我们多少?在新古典经济学理论中,理性地进行选择就是要最大化自身的收益。

在某种观点看来,这是一个数学问题:在给定环境条件下选择最大化报酬的行动。

因而我们可以把理性的经济选择当作一个数学问题的“解”。

在博弈论中,情况就更复杂了。

既然结局不仅依赖于自身的战略和“市场”条件,也直接依赖于其他人所选择的战略,但我们仍然可以把理性的战略选择当作一个数学问题——最大化行为互动中的决策制定者群体的报酬——从而我们再次称理性的结果是博弈的“解”。

2 囚徒的困境博弈论近来的发展,特别是1994年诺贝尔纪念奖授予给三位博弈论理论家以及89岁高龄的塔克(A. W. Tucker)在1995年1月的去世,唤起了人们对博弈论创立时的回忆。

尽管博弈论可以追索到更早的时代,但其兴起的关键时期是20世纪40年代。

当然,《博弈论与经济行为》的出版是一个特别重要的台阶。

但是,在某种程度上,塔克发明的“囚徒困境”例子更为重要。

这个可以在一页纸上求解出来的例子在20世纪下半叶的社会科学中可能是最具影响的一页。

这个杰出的创见并不是出自研究论文,而出自于课堂。

正如S. J. Hagenmayer在《费城调查者(Philadelphia Inquirer)》(“Albert W. Tucker, 89, Famed Mathematician,“ Thursday, Feb. 2, 1995, p.. B7)中写到:“在1950年,作为访问教授,塔克在斯坦福大学向由心理学家组成的听众发表演说的时候,创造了‘囚徒困境’来说明分析某些类型博弈的困难。

塔克的简单解释导致了后来大量的文献。

这些文献来自不同的领域,比如哲学、伦理学、生物学、社会学、政治科学、经济学,当然还有博弈论。

”■囚徒困境博弈塔克是从这样一个小故事开始的:两个夜贼,鲍伯(Bob)和艾尔(Al),在行窃现场附近被抓获并被警方隔离拷问。

每个夜贼都必须选择是否坦白和揭发对方。

如果两个贼都不坦白,他们都将被判刑一年。

如果每个贼都坦白并揭发对方,他们都将在监狱中度过10年。

但是,如果一个贼坦白并揭发对方,而另一个贼不坦白,那么与警方合作的贼将被释放而另一个贼将在监狱中度过20年。

在这个例子中的战略是:坦白与不坦白。

赢利(payoff)(实际上是处罚)是判刑。

我们可以用“赢利表(payoff table)”简洁地表达上述信息,这类赢利表已经成为博弈论中很好的标准表达式。

以下是囚徒困境博弈的赢利表。

表2-1艾尔坦白不坦白鲍伯坦白10,100,20不坦白20,01,1这个表的读法是这样的:每个囚犯从两个战略中选择一个。

即,艾尔选择一列,鲍伯选择一行。

每个单元格的两个数字告诉两个囚犯相应的战略被选择后的结果。

逗号左边的数字表示选择行的人(鲍伯)的赢利,逗号右边的数字表示选择列的人(艾尔)的赢利。

因此(先阅读第一列),如果他们都选择坦白,每人将判刑10年,但是如果艾尔坦白而鲍伯不坦白,鲍伯被判20年而艾尔将被释放。

那么:怎样求解这个博弈?如果双方都想使自己呆在监狱的时间最短,他们选择什么战略是“理性的”?艾尔可能会做这样的推理:“两种事件可能发生:鲍伯要么坦白要么保持沉默。

假定鲍伯坦白,我不坦白的话将被判20年,我也坦白的话则判10年。

另一方面,如果鲍伯不坦白,我不坦白我被判刑1年,但在这种情况下,如果我坦白我可以被释放。

无论怎样,我选择坦白都是最好的。

因此,我将坦白。

”但是鲍伯能够而且大概也将做同样的推理——因此他们都将坦白并且都在监狱呆10年。

然而,如果他们“不理性”地行动,都保持沉默,他们都可以在1年后被释放。

■占优战略(Dominant Strategies)这里发生的情况是,两个囚犯陷入了“占优战略均衡”。

定义:占优战略——让博弈的参与人单独地评估他面临的战略组合中的每一个战略,并且,对于每一个组合,他从自己的所有战略中选择一个使他赢利最多的战略。

如果对于参与人面临的每一个不同的战略组合,参与人都选择同一个战略,这个被选择的战略就叫该参与人在博弈中的“占优战略”。

定义:占优战略均衡——在一个博弈中,如果每个参与人都有一个占优战略,且每个参与人都采取占优战略,那么(占优)战略组合及其相应的赢利被认为是构成了博弈的占优战略均衡。

在囚犯困境博弈中,坦白是占优战略,当两个囚犯都选择坦白时,那就是占优战略均衡。

■囚犯困境中需要考虑的问题这个不同寻常的结果——两个囚犯出于自利的个体理性行动导致双方情况变得更糟糕——在现代社会科学中产生了广泛的影响。

相关主题