博弈论知识总结博弈概述:1、博弈概念:博弈:就是研究决策主体的行生直接相互作用的决策以及种决策的均衡。
博弈研究的假:1、决策主体是理性的,最大化自己的收益。
2、完全理性是共同知3、每个参与人被假定可以所境以及其他参与者的行形成正确的信念与期2、和博弈有关的量:博弈参与人:博弈中行以最大化自己受益的决策主体。
行:参与人的决策略:参与人的行,即事件与决策主体行之的映射,也是参与人行的。
信息:参与人在博弈中的知,尤其是其他决策主体的略、收益、型(不完全信息)等的信息。
完全信息:每个参与人其他参与人的支付函数有准确的了解;完美信息:在博弈程的任何点每个参与人都能察并之前各局中人所的行,否不完美信息。
不完全信息:参与人没有完全掌握其他参与人的特征、略空及支付函数等信息,即存在着有关其他参与人的不确定性因素。
支付:决策主体在博弈中的收益。
在博弈中支付是所有决策主所的行的函数。
从学的角度,博弈是决策主体之的相互作用,因此和个人决策存在着区:3、博弈与决策的区:1、微学的个人决策就是在定市价格、消者收入条件下,最大化自己效用,研究工具是无差异曲。
可表示:maxU(P,I),其中 P 市价格, I 消者可支配收入。
2、其他消者个人的合影响表示一个参数——市价格,所以在市价格既定下,消者效用只依于自己的收入和偏好,不用考其他消者的影响。
但是在博弈理个人效用函数依于其他决策者的和效用函数。
4、博弈的表示形式:略式博弈和展式博弈略式博弈:是博弈的一种范性描述,有亦称准式博弈。
略式博弈是一种假每个参与人一次行或略,并且参与人同行的决策模型,因此,从本上来略式博弈是一种静模型,一般适用于描述不需要考博弈程的完全信息静博弈。
1、参与人集合{ 1 , 2,...,n }:2、每位参与人非空的略集Sins i(s1,...,si,..., sn)上的效用函数Ui(s1,s2,⋯,sn).3、每位参与人定在略合i1展式博弈:是博弈的一种范性描述。
与略式博弈重博弈果的描述相比,展式博弈更注重参与人在博弈程中遇到决策序列构的分析。
包含要素:1 、参与人集合{ 1 , 2,...,n }类型完全信息静态博弈2 、参与人的行动顺序,即每个参与人在何时行动;3 、序列结构:每个参与人行动时面临的决策问题,包括参与人行动时可供选择的行动方案、所了解的信息;4 、参与人的支付函数。
比较:1、战略式博弈从本质上来讲是一种静态模型。
2、扩展式博弈从本质上来讲是一种动态模型。
5、博弈论分类:按决策主体的行为相互作用时,当事人能否达成一个具有约束力的协议可分为:1、合作博弈(强调团体理性、团体最优决策、效率)2、非合作博弈(强调个人理性,个人最优决策)按参与人行动先后顺序可分为:1、静态博弈:博弈中参与人同时行动,或者虽然不是同时行动,但是在行动前不知道其他参与人所选择的行动。
2、动态博弈:参与人的行动有先后顺序,后行动者获得先行动者的行动信息。
按参与人对信息的掌握程度可分为:1、完全信息:每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解,博弈开始时不存在不确定性因素。
2、不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。
按决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。
静态动态完全信息完全信息静态博弈完全信息动态博弈均衡:纳什均衡均衡:子博弈精炼纳什均衡不完全信息不完全信息静态博弈不完全信息动态博弈均衡:贝叶斯纳什均衡均衡:精炼贝叶斯纳什均衡6、根据所学这四种博弈的特点对这四种博弈做一个对比分析:信息和行动特点均衡均衡类型特别均衡求解方法学过的例子性质每个参与人对其纳什均纯战略纳占优战略纳箭头法Hotelling 价格竞多重性和存他所有参与人的衡什均衡什均衡划线法争在性特征、战略空间及(PNE)( DSE)库诺特价格竞争支付函数有精确重复剔除的不断剔除劣一般一个博弈中的了解,博弈开始占有均衡战略(弱劣存在参与者有多时不存在不确定(IFDE)战略的剔除个行动时可以先性因素,参与人同顺序会影响考虑能否剔除弱时行动或者不是均衡结果战略简化博弈同时行动但是后混合战略聚点均衡支付最大化社会福利博弈行动者不知道行纳什均衡法小偷-守卫博弈动者的行动信息。
(MNE)支付等值法战略和行动相同。
完全信在博弈开始之前子博弈息动态参与人之间的信精炼纳博弈息不存在不确定什均衡性,但是参与人行动存在先后顺序。
在完全信息动态博弈中,为了表示参与人之间的信息掌握关系,引入了信息及的概念。
不完全在博弈开始之前贝叶斯信息静参与人之间的信纳什均态博弈息存在不确定性,衡但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。
不确定是参与人的了性的不确定性子博弈精有限次重复与纳什均衡连锁店悖论炼纳什均博弈均衡的唯一性有衡关无限次重复与贴现因子囚徒困境(冷酷博弈均衡有关战略)(无名氏定无限期轮流讨价理)还价模型一般博弈逆向归纳法斯坦科尔伯格寡求解头竞争雇主与公会之间的竞争贝叶斯纳混合战略对原混合战性别战什均衡(不完全信略加入少许息情况下纯不确定性因战略均衡的素,求极限。
极限)一般贝叶斯Harsanyi 转机制设计均衡换1、均衡结果是原博弈的Nash 均衡;2、同时在每一个子博弈上构成Nash 均衡1、均衡存在性2、不确定性体现为类型的不确定性不完全信息动态博弈在博弈开始前参精炼贝信号传递分离均衡与人之间的信息叶斯纳博弈存在不确定性,同什均衡混同均衡时参与人行动存在先后顺序。
不完准分离均衡全信息动态博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的过程。
根据所得信信号传递博弈不完全信息息修正判断不完全信息重复动态博弈子概率,根据博弈与声誉博弈精炼纳收益最大化Milgrom-Roberts什均衡与海决策垄断限价模型萨尼不完全信息静态博弈贝叶斯均衡的结合。
二、四种博弈类型具体分述1、完全信息静态博弈1.1 完全信息静态博弈特点:每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解,博弈开始时不存在不确定性因素,参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。
战略和行动相同。
1.2完全信静态博弈相关概念:以新产品开发博弈举例说明:参与人:参与人 1 和 2。
参与人的集合卡表示:Γ={1,2,⋯n}.表示所有参与人的集合,在新品开博弈中:Γ={1,2}行:开、不开。
Ai 表示参与人行的集合。
新品开博弈中参与人的行集合A1=A2={a,b},其中 a 开, b 不开。
a={a1,a2⋯an}表示参与人的行合。
新品开博弈中:A={( a,a),(a,b),(b,a),(b,b)}略:参与人的行。
在博弈中的略可以定从集到行集的映射关系,即:Si:Xi— Ai。
用Si={si}表示参与人所有略的集合。
在n 人博弈中,用 S=(s1,s2,s3⋯,s n )表示 n 个参与人的略合,它表示博弈中每个参与人采取略 si 的一种博弈情形。
在完全信息静博弈中,由于不存在决策序上的差异,所有参与人在同一决策点即博弈开始的那一刻决策,因此,所有参与人面的决策情形都只有一种,所以,参与人的略集与行集相同。
支付:是指参与人在博弈中的所得。
一般情况下也是用效用函数来表示参与人在博弈中的所得。
因此,参与人的支付就可表示一种特定博弈情形下参与人得到的确定效用水平或期望效用水平。
支付一般用ui(1,2,⋯,n)表示参与人i 的支付 (效用水平 ),支付合 u=(u1,u2, ⋯un)表示参与人在特定博弈情形下所得到的支付,其中参与人i 的支付。
因此,参与人i=(i=1,2,⋯,n)的支付就可表示:ui=ui(s i ,s-i).信息:是参与人所具有的有关博弈的所有知,如有关其它参与人行或略的知、有关参与人支付的知等等。
在“新品开博弈”中,如果两个企都知道市需求,那么的博弈情形就是我前面所提到的完全信息假;如果两个企中至少有一个不知道市需求,那么的博弈情形就是我前面所提到的不完全信息假。
1.3略什均衡略:参与人在定信息下只一种特定(或确定性)的略混合略:混合略解了一个参与人其他参与人所采取的行的不确定性,它描述了参与人在定信息下以某种概率分布随机地不同的行或略。
略什均衡中包括:占有均衡、重复剔除劣略均衡、一般略什均衡等。
1、占均衡占略:参与人的最略 si * 与其他参与人的s-i无关。
无其他参与人什么略,参与人的最略是唯一的,的最略称之“占略”。
在 n 人博弈中,如果于所有的其他参与人的s-i,si * 都是参与人i 的最u i (s i* , s i ) u i (s i , s i )称 si *参与人的占略。
在 n 人博弈中,如果所有参与人都存在占略si * ,占略合si*=(s1 * si2*, ⋯, sn *)称占略均衡。
如果所有参与人都有占略存在,那么占略均衡就是唯一的所有理性参与人可以到的博弈果。
2、重复剔除劣略如果在一个博弈中,参与人不存在占略,但是参与人i 存在两个略,其中一u i ( s i, s i ) u i (s i , s i )个略叫另一个略的所得效用要大,理性的参与人不会略。
格劣略:u i ( s i , s i ) u i ( s i , s i )u ( s i , s i )u i ( s i , s i )弱劣 略 :若重复剔除 程一直可持 到只剩下唯一的 略 合, 略 合即 重复剔除的占 均衡,此 博弈是重复剔除 略可解。
要点:再重复剔除 程中,如果每次剔除的是 格劣 略,均衡 果与剔除 序无关;如果剔除的是弱劣 略,均衡 果可能与剔除 序有关。
3、一般 Nash 均衡Nash 均衡是完全信息静 博弈的解的概念,略是不可剔除的,即不存在任何一个 略 格 于在完全信息静 博弈中,Nash 均衡 略。
构成Nash 均衡的求解 什均衡的方法划 法、箭 法。
划 法 :1、考察参与人1 的最 略2、用上述方法找出参与人 2 的最 略3、找出最 略 合箭 法:1、 于每个 略 合, 是否有参与人会偏离 个 略 合2、 直至找出没有参与人会偏离的 略 合略均衡反映函数:各博弈方 的 策略 其他博弈方 策略的反 。
1.4 混合 略 什均衡混合 略:在博弈G { ; S 1 ,..., S n ;u 1,..., u n } 中, 任一参与人i , Si={S i1, ⋯ ,S i k }, 参与人i 的一个混合 略 定 在 略集Si 上的一个概率分布δi={ δ i 1, ⋯, δ ik}, 其中δ i j(j=1, ⋯ ,k )表示参与人 i 略 表示参与人 i 略i j的概率的概率,即δi jS足 0≦δ i j ≦ 1,其中概率之和 1。