四、名词解释(每小题3分,共15分)
参与人(player)
指的是博弈中选择行动以最大化自己效用(收益)的决策主体,参与人有时也称局中人,可以是个人,也可以是企业、国家等团体;
策略(strategy)
是参与人选择行动的规则,如“以牙还牙”是一种策略;
信息(information)
是指参与人在博弈中的知识,尤其是有关其他参与人的特征和行动的知识;支付(payoff)函数
是参与人从博弈中获得的效用水平,它是所有参与人策略或行动的函数,是每个参与人很关心的东西;
结果(outcome)
是指博弈分析者感兴趣的要素的集合,常用支付矩阵或收益矩阵来表示;均衡(equilibrium)
是所有参与人的最优策略或行动的组合。
静态博弈
指参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取什么样的行动;
动态博弈
指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
博弈
就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。
零和博弈:
也称“严格竞争博弈”。
博弈方之间利益始终对立,偏好通常不同
变和博弈:
零和博弈和常和博弈以外的所有博弈。
合作利益存在,博弈效率问题的重要性。
完全信息静态博弈
即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。
上策:
不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略
上策均衡:
一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果
严格下策:
不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略
纳什均衡:在博弈 中,如果由各个博弈方的各一个
策略组成的某个策略组合
中,任一博弈方 的策略,都是对其余博弈方策略的组合 的最佳对策,也即
对任意
都成立,则称 为 的一个纳什均衡
(或纳什均衡是指这样一种策略组合,这种策略组合由所有参与人的最优策略组成,即给定别人策略的情况下,没有任何单个参与人有积极性选择其他策略,从而没有任何参与人有积极性打破这种均衡。
)
完全信息博弈
混合策略:在博弈 中,博弈方 i 的策略空间
为 ,则博弈方 以概率分布 随机在其 k 个可选策略中选择的“策略”,称为一个“混合策略”,其中
对 都成立,且
重复博弈
指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。
阶段博弈
重复博弈中的每次博弈称为“阶段博弈”。
贴现因子
下一期的一单位支付在这一期的价值。
触发战略(Trigger Strategy )
首先试探合作,一旦发现对方不合作,则也用不合作相报复的战略。
子博弈精炼纳什均衡
32、简要评论博弈论在微观经济学运用中的优缺点。
答:博弈论是描述和研究行为者之间策略相互依存和相互作用的一种决策理论。
它被广泛应用于政治、外交、军事、经济等研究领域,但在微观经济学中的应用是最成功的。
博弈论的研究方法和特征与经济学结合得非常紧密。
它强调个人理性,即在给定的约束条件下追求效用最大化。
但博弈论又比传统的经济学更进一步,它研究的不是面临非人格化的价格参数下的决策问题,而是研究效用随各个主体的行为改变而改变的效用最大化问题。
除了国际贸易、金融、拍卖等经济领域,博弈论在企业理论特别是寡头竞争研究方法方面做了大量的有益工作。
20世纪80年代以来,博弈论开始出现在西方经济学的教科书中,都将其作为经济学研究的最新成果与前沿。
特别是产业组织理论方面的教材,几乎都是以博弈论为基础的。
博弈论反映了经济学的研究对象越来越个体化、微观化;反映了经济学越来越重视人与人之间关系与相互作用的研究,特别是协调人际的利益与冲突的最佳制度安排倾向;反映了经济学越来越重视信息,即接近现实的有关信息不完全对个人选择与制度安排及其影响的倾向。
总之,博弈论在经济学中的广泛应用,大大提高了经济学对现实的解释能力。
应该看到,博弈论在微观经济学运用中还存在许多疑难问题。
它无法提供唯一解,无法完整地探讨个人发展与社会发展之间的相互依存关系。
现有的博弈论结构可强有力地证明“合作比不合作好”这一命题,但无法解释清楚在现实中冲突与合作之间的复杂关系,认为个人组成的集团会采取合作行动以实现他们共同),(**n i s s )
,...,,(**1*1*n i i i s s s s +- i j i S s ∈),...,,,(),...,,,(**1*1***1**1*n i ij i i i n i i i i i s s s s s u s s s s s u +-+-≥ ),(**n i s s },;,{11n n u u S S G =},{1ik i i s s S =),(1ik i i p p p =k j ,,1 =10≤≤ij p 11=++ik i p p
的利益。
实际上,除非一个集团中的人数很少或者存在强制或其他某些特殊手段以使个人按照他们的共同利益行事,有理性的、寻求个人利益最大化的个人不会采取行动以实现共同的利益。
即使他们采取行动实现共同的利益之后都能获益,他们也仍然可能不会自愿地采取合作行动以实现共同利益的目标。
33、“囚徒困境”的内在根源是什么?举出现实中囚徒的困境的具体例子。
答八:内在根源是个体之间存在行为和利益相互制约的博弈结构中,个体理性与集体理性的矛盾。
27、举一个你在现实生活中遇到的囚犯两难困境的例子。
答:在校园的人行道交叉路口,无需红绿灯。
现在两人分别骑车从东西方向和南北方向通过路口。
若同时往前冲,必定相撞,各自支付为(-2,-2);若同时停下,都不能按时前进,支付为(0,0);若一人前进一人停下,支付为(2,0)或(0,2)。
相应的策略和支付矩阵如下表。