基本概念(1)决策人:在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。
(2)对抗者:在博弈二人对局中行动滞后的那个人,与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。
他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。
(3)局中人(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。
只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。
(4)策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。
如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。
(5)得失(payoffs):一局博弈结局时的结果称为得失。
每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。
所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。
(6)次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。
(7)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。
在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。
所谓纳什均衡,它是一稳定的博弈结果。
纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。
也就是说,此时如果他改变策略他的支付将会降低。
在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。
所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。
这一结果对局中人B亦是如此。
这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a,b*)≤偶对(a*,b*)≥偶对(a*,b)。
对于非零和博弈也有如下定义:一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:对局中人A的偶对(a,b*)≤偶对(a*,b*);对局中人B的偶对(a*,b)≤偶对(a*,b*)。
有了上述定义,就立即得到纳什定理:任何具有有限纯策略的二人博弈至少有一个均衡偶。
这一均衡偶就称为纳什均衡点。
纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡研究的主要工具。
通俗地说,寻找均衡点的存在性等价于找到博弈的不动点。
纳什均衡点概念提供了一种非常重要的分析手段,使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。
但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而忽视了其他局中人改变策略的可能性,因此,在很多情况下,纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真可爱的纳什均衡点”。
塞尔顿(R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点,从而形成了两个均衡的精炼概念:子博弈完全均衡和颤抖的手完美均衡。
博弈类型博弈的分类根据不同的基准也有不同的分类。
一般认为,博弈主要可以分为合作博弈和非合作博弈。
合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。
从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。
完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。
不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。
目前经济学家们现在所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。
非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。
与上述四种博弈相对应的均衡概念为:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(subgame perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium),精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。
博弈论还有很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型,等等。
案例囚徒困境假设有两个小偷A和B联合犯事、私入民宅被警察抓住。
警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。
如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年.100元如何分你看见两个小孩在玩耍,出于好奇,你给他们100元,让他们猜拳,猜赢者决定怎么分这100元,而输者如果同意赢者的分配比例,那么他们将各有所得,如果不同意,那么这100元,你将收回。
狐狸与狼一天晚上,狐狸踱步来到了水井旁,低头俯身看到井底水面上月亮的影子,它认为那是一块大奶酪。
这只饿得发昏的狐狸跨进一只吊桶下到了井底把与之相连的另一只吊桶升到了井面。
下得井来,它才明白这“奶酪”是吃不得的,自己已铸成大错,处境十分不利,长期下去就只有等死了。
如果没有另一个饥饿的替死鬼来打这月亮的主意,以同样的方式,落得同样悲惨的下场,而把它从眼下窘迫的境地换出来,它怎能指望再活着回到地面上去呢?两天两夜过去了.没有一只动物光顾水井。
时间一分一秒地不断流逝,银色的上弦月出现了。
沮丧的狐狸正无计可施时,刚好一只口渴的狼途经此地,狐狸不禁喜上眉梢,它对狼打招呼道:“喂,伙计,我免费招待你一顿美餐,你看怎么样?”看到狼被吸引住了,狐狸于是指着井底的月亮对狼说:“你看到这个了吗?这可是块十分好吃的干酪,这是家畜森林之神福纳用奶牛伊娥的奶做出来的。
假如神王朱庇特病了,只要尝到这美味可口的食物都会胃口顿开。
我已吃掉了这奶酪的那一半,剩下这一半也够你吃一顿的了。
就请委屈你钻到我特意为你准备好的桶里下到井里来吧。
”狐狸尽量把故事编得天衣无缝,这只狼果然中了它的奸计。
狼下到井里,它的重量使狐狸升到了井口,这只被困两天的狐狸终于得救了。
《战国策》把对方陷入困境中春秋时楚国杰出的军事家伍子胥,性格十分刚强。
青少年时即好文习武勇而多谋。
伍子胥祖父伍举、父亲伍奢和兄长伍尚俱是楚国忠臣。
周景王二十三年(前522年)。
楚平王怀疑太子“外交诸侯,将人为乱”,遂迁怒于太子太傅伍奢,将伍奢和伍尚骗到郑都杀害,伍子晋只身逃往吴国。
在逃亡中,伍子胥在边境上被守关的斥候抓住了。
斥候对他说:“你是逃犯,必须将你抓去面见楚王!”伍子胥说:“楚王确实正在抓我。
但是你知道楚王为什么要抓我吗?是因为有人跟楚王说,我有一颗宝珠。
楚王一心想得到我的宝珠,可我的宝珠已经丢失了。
楚王不相信,以为我在欺骗他。
我没有办法了,只好逃跑。
现在你抓住了我,还要把我交给楚王,那我将在楚王面前说是你夺去了我的宝珠,并吞到肚子里去了。
楚王为了得到宝珠就一定会先把你杀掉,并且还会剖开你的肚子,把你的肠子一寸一寸地剪断来寻找宝珠。
这样我活不成,而你会死得更惨。
”斥候信以为真,非常恐惧,赶紧把伍子胥放了。
伍子胥终于逃出了楚国。
智猪博弈假设猪圈里有一头大猪、一头小猪。
猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。
性别战“有一对夫妻,丈夫喜欢看足球赛节目,妻子喜欢看肥皂剧节目,但是家里只有一台电视,于是就产生了争夺频道的矛盾。
假设双方都同意看足球赛,则丈夫可得到2单位效用,妻子得到一单位效用;如果都同意看肥皂剧,则丈夫可得到1单位效用,妻子得到2单位效用;如果双方意见不一致,结果只好大家都不看,各自只能得到0单位效用.斗鸡博弈设想两个人各自担着一担柴,从独木桥的两端走向中央,发现对面一个人,每个人都有两种战略:进-继续前进,或者退-退回原地。
(1)在甲选择-进的情况下,A.如果乙也选择-进,结果是两败俱伤,甲收益-3,乙收益-3。
B.如果乙选择-退,结果是甲过去了,乙退回原地,甲收益2,乙收益0。
(2)在甲选择-退回情况下,A.如果乙选择-进,结果是甲退回原地,乙过去了,甲收益0,乙收益2。
B.如果乙选择-退,结果是甲、乙都退回原地,甲收益0,乙收益0猜硬币甲乙两人玩猜硬币游戏。
甲出正反,乙猜正反。
若乙猜对,则甲给乙一元钱;否则,乙给甲一元钱。