博弈论——换一种方式思考问题博弈论——换一种方式思考问题花了一个月的时间研究了下博弈论,收获很多,于是又花了一个礼拜写了这篇算是读后感的日志,希望能激起大家对博弈论的兴趣,尤其是几个经典博弈,真的很有意思。
Ø 博弈论的内涵什么是博弈论?简单的说,就是“互动的决策论”,指在充分考虑对方的决策后做出的决策。
“博弈论”的英文是“Game Theory”,所以博弈论最贴切的直译是“游戏理论”。
现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,对于冯·诺伊曼我们更为熟知的头衔是“计算机之父”,其实,他还有另一个身份,就是“博弈论之父”。
1944年,他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。
诺伊曼与摩根斯特恩认为,博弈论就是运用数学的方法研究有利益冲突的双方在竞争性活动中制定最优化策略的理论。
但是诺伊曼所解决的只有二人零和博弈,1949年,21岁的纳什写下一篇著名的论文《多人博弈的均衡点》,提出了纳什均衡的概念和解法。
这是整个现代博弈论中最重要的思想之一。
相信很多人都知道纳什,因为那部经典的奥斯卡最佳影片《美丽心灵》,他传奇的人生,坚强的毅力,深深的打动了我。
他在普林斯顿大学深造时,冯·诺伊曼正好在普林斯顿任教,那个时候的普林斯顿还聚集了众多著名的科学大师,包括罗伯特?奥本海默、诺曼·斯蒂恩罗德以及爱因斯坦,据说纳什曾经造访过爱因斯坦,向他讲述自己对于重力的看法。
在一个小时的讨论之后,爱因斯坦对纳什说:“年轻人,你应该来学一点物理。
”1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。
他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。
表面上看,博弈论似乎是数学家玩的游戏,而事实上,博弈论首先是我们思考现实世界的一套逻辑,其次才是把这套逻辑严密化的数学形式,博弈论的目的在于巧妙的策略,而不是解法。
我们学习博弈论的目的,不是为了享受博弈论的分析过程,而在于赢得更好的结局。
说到底,博弈论只是一个分析问题的工具,用这个工具来简化问题,使问题的分析清晰明了就够了。
Ø 博弈论的基本概念首先我们需要了解的是纳什均衡。
在某个房地产开发中,假定市场需求有限,只能满足某种规模的开发量,A、B两个开发商都想开发这一规模的房地产,如果A选择开发,则B的最优策略是不开发,同样,如果B选择开发,则A 的最优策略是不开发。
这时无论对A还是B,都不存在一种策略优于另一种策略,也不存在严格劣策略(不论其它人采取的策略,某人采取对自己不利的策略)。
研究这类问题的均衡解,需要引入纳什均衡。
在纳什均衡中,每个参与人都确信,在给定其它参与人的策略情况下,己方选择了最优策略。
所以在纳什均衡点上,每个参与者的策略都是最好的,此时没人愿意先改变或主动改变自己的策略。
在博弈论中,博弈行为都可以分为两类,即零和博弈与非零和博弈。
零和博弈是一种完全对抗,强烈竞争的对局。
参与者的总收益为零,因此一个参与者的所得必然是另一个参与者的损失。
而非零和博弈,是各参与者的目标不完全对立,参与者只按本身的厉害关系单方面做出决策,有时为了共同利益而合作,有时为了个人利益而对立,收益的总和是可变的,参与者可以同时有所得和有所失。
在博弈论中,最基本的假设之一就是:人是理性的。
所谓理性人是指行动者具有推理能力,在具体策略选择时的目的是使自己的利益最大化。
而现实生活中,人们在做决策时往往是有限理性的。
每个人都不是绝对聪明的人,而且绝对聪明的人也未必会用绝对聪明的方式去做决策,因此博弈论是有局限性的。
尽管如此,人类至今还没有找到一种比博弈更好的思考工具,可以对现实的客观世界进行如此近似的描述。
就像力学是自然科学的哲学和数学一样,博弈论是社会科学的哲学与数学。
没有牛顿力学我们连最简单的物理现象都无法理解;同样的道路,没有博弈论我们也无法解释分析很多的社会现象。
Ø 囚徒困境:博弈论的经典模型有这样一个案例:两个共同偷窃的犯罪嫌疑人甲和乙被带到警察局。
警方对两名犯罪嫌疑人实行隔离关押,隔离审讯,每个犯罪嫌疑人都无法观察到同伴的选择。
警方虽然怀疑他们作案,但手中没有掌握确凿的证据,于是分别告知两名犯罪嫌疑人:对犯罪事实的认定及相应的量刑完全取决于他们自己的招供。
如果你们一方供认,而另一方抵赖,那么供认方将作为证人无罪释放,而另一方将被判10年徒刑;如果双方都与警方合作,共同招认,则都将被判5年有期徒刑;如果双方均不认罪,则各判2年。
我们先不管这样的量刑方式是否合理,假设规则就是这个样子,从常理来看,双方都不认罪是最好的选择,但从博弈论角度出发,对于A 来说,如果B招供,则A如果不招供的话,将会受到重罚,因此A的最佳策略是招供,如果B 不招供,A的最佳策略仍然是招供,所以理性的A一定会选择招供,对于B来说,也是一样的道理。
这样双方都招供就是一个纳什均衡。
从逻辑上分析确实没问题,但生活中我们可以这样来分析问题吗?有这样一则故事:两位交往甚密的大学生修化学课。
两人在小考、实验和中期考中都表现都很优秀。
在期末考试前的周末,他们非常自信,于是去参加了一场聚会。
聚会太尽兴了,结果周日这天睡过了头,来不及准备周一的考试,要知道,大学里的考试全都要看考前一两天的复习。
他们没有参加考试,而是向老师撒了个谎,说在回来的路上轮胎爆了,由于没有备用胎,只好整夜在路边整夜等待救援。
现在他们太累了,请求老师容许他们隔天再考。
老师想了想,同意了。
他们便好好准备了一个晚上,周二来考试了。
老师安排他们在两间教室做答。
第一个题目在考卷第一页,占了十分,非常简单,两人都写出了正确答案,心情舒畅的翻到了第二页,第二页只有一个问题,占了九十分,题目是:“请问是哪只轮胎爆了?”结果不言而喻,两位学生只有乖乖向老师认错。
所以利用囚徒困境,我们至少可以学到一点,在生活中,如果能善于建立囚徒困境,往往能将看似很棘手的问题用很简单的方法解决。
也许你现在跟我一样有一个疑问,按照上面的分析,对每个参与者来说选择背叛永远比选择合作获得更多的利益,在现实生活中,这显然不合理。
原因在于博弈的次数问题,在任何博弈中,表现最好的策略直接取决于对方采用的策略,总的来说,如果你认为今后将难以与对方相遇,或者你不关心自己未来的利益,那现在就选择背叛。
而事实上,现实生活中反复交往的人际关系,则是一种“不定次数的重复博弈”。
因此,我们在博弈过程中,必然要考虑是否还有重复博弈的可能,如果将来的重复博弈带来的利益要更多的话,那当前博弈就会选择合作。
有了重复博弈还是不够的,当我们在确定合作时必须要制定相应的规则,规定背叛后的惩罚,只有带剑的契约才是游戏合作的保证。
当参与者在博弈过程中选择背叛后为此要付出更大的代价后,就自然降低了他的背叛动机。
从囚徒困境中我们获得以下几点启发:第一,善于建立囚徒困境,如上面警察与教授就通过建立囚徒困境成为了“渔翁得利”者。
第二,当自己处于不利地位时可以将对方也拉入囚徒困境中,为自己谋得最大利益。
《战国策》有这样一则故事,公元前522年,楚平王怀疑太子谋反,迁怒于伍家,将伍子胥的父亲与哥哥均杀害,伍子胥只身逃往吴国。
在逃亡中,伍子胥被守关的斥候抓住,伍子胥说:“你知道楚王为什么要抓我吗?是因为有人跟楚王说我有一颗宝珠,可我的宝珠已经丢失了,楚王不信,以为我在欺骗他。
没有办法,我只有逃走,现在你抓住我,还要把握交给楚王,那我将在楚王面前说是你夺去了我的宝珠,并吞到肚子里,楚王为了得到宝就一定会先把你杀掉。
”斥候信以为真,就赶紧把伍子胥给放了。
这是书中提到的一个故事,听起来有点假,不过还是可以说明问题的。
在这个故事中,伍子胥自身处于极不利的形式,但他巧妙的构造了一个囚徒困境,而且自己先做了决策。
本来斥候的最大利益是将伍子胥送给楚王,并且伍子胥不揭发他,而这是伍子胥的严格劣策略,也就是说伍子胥肯定不会采取这个策略的,而在伍子胥肯定揭发他这个前提下,斥候做出的最好选择就是放了伍子胥。
呵呵,是不是有点绕啊,不过把关系理顺了,还是觉得用博弈论来分析问题确实挺有意思的。
第三,也是囚徒困境最直接告诉我们的一个道理,在大多数情况下,背叛都是最优的选择。
也许你要说道德问题,当然,如果是朋友跟亲人,那就先忘了博弈吧,而如果我们身陷囚徒困境中,就应该分析形势,首先判断与对方有无再合作的可能,如果本次合作会为双方将来谋得更大利益,则选择合作;如果不是的话,而双方又无严格的相互约束的话那就要选择背叛,因为对方同样有背叛的倾向,不背叛自己的利益就会受到侵害。
Ø 酒吧博弈:混沌系统中的博弈这也是博弈论中的一个经典模型,而且很有意思,案例是这样的:假设有100个人很喜欢泡酒吧。
这些人在每个周末,都要决定是去酒吧活动还是待在家里休息。
酒吧的容量是有限的,也就是说座位是有限的。
如果去的人多了,去酒吧的人会感到不舒服。
此时,他们留在家中比去酒吧更舒服。
假定酒吧的容量是60人,如果某人预测去酒吧的人数超过60人,他的决定是不去,反之则去。
这100人如何做出去还是不去的决定呢?这个博弈的前提条件做了如下限制:每一个参与者面临的信息只是以前去酒吧的人数,因此,他们只能根据以前的历史数据,归纳出此次行动的策略,没有其它的信息可以参考,他们之间更没有信息交流。
酒吧问题所模拟的情况,非常接近于一个赌博者下注时面临的情景,比如股票选择、足球博彩。
这个博弈的每个参与者,都面临着这样一个困惑:如果许多人预测去的人数超过60,而决定不去,那么酒吧的人数会很少,这时候做出的这些预测就错了。
反过来,如果有很大一部分人预测去的人数少于60,他们因而去了酒吧,则去的人会很多,超过了60,此时他们的预测也错了。
因而一个做出正确预测的人应该是,他能知道其他人如何做出预测。
但是在这个问题中每个人预测时面临的信息来源都是一样的,即过去的历史,同时每个人无法知道别人如何做出预测,因此所谓正确的预测几乎不可能存在。
呵呵,如果知道怎么去预测,那了解博弈论的人都可以去买炒股了。
有位学者通过真实的人群以及计算机模拟两种实验得到了两个迥异的、有趣的结果。
在对真实人群的实验中,实验对象的预测呈有规律的波浪状形态,更多的博弈者是根据上一次其他人做出的选择而做出这一次的预测,这种预测是一个非线性的过程。
所谓这样一个非线性的过程是说,系统的未来情形对初始值有着强烈的敏感性,这就是人们常说的“蝴蝶效应”:在北京的一只蝴蝶动了一下翅膀,华盛顿就下了一场大暴雨。
通过计算机的模拟实验,得出了另一个结果:起初,去酒吧的人数没有一个固定的规律,然而,经过一段时间后,这个系统去与不去的人数之比接近于60:40,尽管每个人不会固定地属于去或不去的人群,但这个系统的这个比例是不变的。