当前位置:文档之家› 博弈论中的相关概念

博弈论中的相关概念

新古典经济学前提:理性选择——减少不确定;——经济系统效用最大化。

理性——新古典经济学与博弈论的纽带博弈论决策前提:理性的战略选择。

博弈论决策基础:最优反应,即带来最大收益的战略。

但是,在博弈论中最优反应不是理性的唯一表现,也不总是假定人是理性的。

新古典经济学决策的背景:理性的个体面临特定的制度环境(产权、货币、高度竞争的市场),在此基础上以获取利益最大化为目的。

隐含的基础:只需考虑自身情况和市场条件,而不考虑他人行为。

弊端:——限制了理论的使用范围,现实中竞争并不完全;——无法解决货币经济以外的决策难题。

博弈论的优势:——不仅考虑自身条件和市场环境,最重要的是还需考虑他人的行为。

游戏规则:两个选手,轮流取币;每次至少取一枚硬币;只能从一行中取任意数量的硬币,不许从两行中选取;取走最后一枚硬币的为胜者囚徒困境的启示:囚徒困境仅仅是二人博弈,多人博弈在现实中更多;如果囚犯可以交流,结果显著不同;如果多轮博弈,结果也有不同;导致困境结论的分析过程令人注目,但最后结论并非理性。

通常假设参与者将采取最优反应战略而理性行事,最大化利润、力争在游戏中获胜、达到主观收益最大化,或者惩罚最小化,皆属于理性行为。

最优反应战略是在其他参与者战略已知或可预测条件下,给某参与者带来最大化收益的战略。

博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应战略。

依据新古典经济学,我们把一个参与者的最优反应(best response)定义为,在其他参与者已经选定战略,或者可以预计到他们将选择何种战略时,能够给该参与者带来的最大收益的战略。

标准式——数字矩阵;扩展式——树形图不确定事件(contingency):相机战略(contingent strategy):仅在不确定事件发生时才会采取的战略信息集(information set):节点2包含了决策者掌握的所有信息,因此也称为信息集。

扩展式的优势:——展示了每一阶段掌握的信息;——展示了参与者掌握信息的不完全所有博弈问题均可用标准式描述,即绘制一个表格,边缘列出参与者的战略,里面列出参与者的收益;有些博弈的部分战略是相机战略,只有当对方已经采取了特定的行动时,这些战略才会生效。

相机战略和应急计划非常重要,尤其是当参与者能够通过其掌握的信息而获取优势时;如果一个参与者不知道对手已经做出或将要做出的决策,我们就把他所有可能的选择标在同一节点上,在树形图中,该节点会包括多条分支,由于它说明了决策者掌握的信息,我们将其称为一个信息集。

确切地说,信息集反映的是决策者不知道的信息,因为他不知道对手将如何决策;博弈的两种描述方法——扩展式和标准式可以相互替代。

占优战略占优战略均衡合作解非合作解社会两难博弈论的精髓:行为互动。

在经济学中,稳定、可预测的互动行为模式被称为均衡。

博弈论要做的就是探寻博弈回合的均衡模式。

占优战略(dominant strategy):无论对方采取何种战略,其都是最优反应的战略。

占优战略均衡:当每一位参与者都选择了各自的占优战略时,相应的博弈结果就是占优战略均衡。

劣战略(dominated strategy):如果无论对手选择哪种战略,一个战略的收益总高于另一个战略,第二个战略就被称为劣战略社会两难(social dilemma):是一种存在占优战略均衡的博弈,并且参与者采用这种均衡战略的收益比采用非均衡战略的收益要差。

合作解:因合作而提高收益。

非合作解:在没有可能达成有约束力的协议,以协调不同参与者的战略时,参与者们所选的战略及其收益就是一个博弈的非合作解。

例如占优战略。

占优战略的存在以及它与合作解相悖的事实是导致社会两难的根本原因。

占优战略均衡也是合作解。

这种合作的占优战略均衡并不是社会两难问题。

占优战略均衡与合作解之间不冲突。

但这是最好的结果吗?博弈分析的目标之一就是找到参与者之间稳定的、可预测的互动行为模式。

按照经济学家的说法,我们称之为均衡。

因为我们假设参与者都是理性的,所以,只有一个参与者选择的是针对对手战略的最优反应战略,其选择才是稳定的。

如果存在一个针对对手所有战略来说都是最有反应的战略,我们就称之为占优战略;如果博弈中的每个参与者都有占优优势,并且也实施其占优优势,我们就可以获得一个占优战略均衡;占优战略均衡是一个非合作均衡,每位参与者都独立行动,而不是一起协商战略选择,如果博弈中的参与者都能够保证自己履行协商后的战略,那么他们选择的战略就被称为合作均衡。

合作均衡和占优战略均衡有可能一样,也可能不一样;社会两难问题是一类重要的占优战略均衡博弈,代表就是囚徒困境。

社会两难问题都有一个共性:存在一个与合作均衡冲突的占优战略均衡;并非所有的博弈都存在占优战略均衡。

纳什均衡;协调博弈;谢林点。

纳什均衡(Nash equilibrium):是全部参与者所选战略的一个组合,在这个战略组合中,每个人的战略都是针对其他人战略的最优反应。

任何一方都不可能单方面变换战略而改善自己的境况。

由于纳什均衡战略的选择者也是没有协商的,因此也是非合作均衡。

收益占优均衡(payoff dominant equilibrium):均衡获得最大收益。

风险占优均衡(risk dominant equilibrium):均衡规避最大损失。

协调博弈(coordination game):只有协调彼此的战略选择,两个参与者才能得到最优的收益。

两点启示:——在特定情况下,惯例和传统能够提供多纳什均衡博弈的解;——协调博弈中的纳什均衡可以解释为什么习俗和惯例看似很随意,实际却很稳定,因为它们都是纳什均衡,能够自我强化。

没有谢林点。

二者收益并不均衡,一方必须接受收益低的现实。

如果双方都认为对方会选择追求其他女士,则又回到(0,0)的初始状态在一个没有占优战略均衡的博弈中,如果每一个参与者都采用了针对其他参与者所选战略的最优反应战略,那么参与者的战略选择仍然是确定、可预测且理性的,我们把这种情况称之为纳什均衡。

占优均衡战略是一种纳什均衡,但有些纳什均衡不是占优均衡。

纳什均衡是一种非合作均衡,与博弈的合作均衡可能相同,也可能不同。

纳什均衡是求解博弈问题的一个普遍适用的方法。

但也有缺点:——有些博弈的纳什均衡不是唯一解;如果有线索是决策者认为某个均衡更可能发生,则这个均衡被称为谢林点;——并不是所有博弈都存在纳什均衡。

零和博弈(zero-sum game):参与者收益之和为零的博弈;非常数和博弈(nonconstant-sum game):常数和博弈:最大最小收益(minimax payoff):最优战略是其最小收益中数值最大的收益所对应的战略。

最大最小解并非适合于所有双人零和博弈零和博弈尽管在博弈论发展史上具有重要的意义,但是过于简化,并不能完全适合于现实。

因此又不要引入非常数和博弈在非常数和博弈中,最大最小解与纳什均衡可能不完全一致。

两种博弈在博弈论发展中具有重要影响:——零和博弈:依赖最大最小法则或最小最大法则确定纳什均衡;——存在两个纳什均衡的2×2非常数和博弈。

联盟:拆台者;公共物品联盟(coalition):在博弈论中,把协调相互战略的参与者称为联盟。

当所有参与者联合起来时政治学上称为大联盟(grand coalition)。

单人联盟(single coalition):博弈论中将一个参与者单独行动视为自己与自己的联盟,可以称为单人联盟。

联盟结构(coalition structure):三人以上的非合作博弈形成联盟也有可能,但是缺少制约机制情况下,实现纳什均衡的联盟才能存在。

2.政治博弈中的“拆台者”3.有时第三方充当“拆台者”的角色。

4.拆台者(spoiler):是指自己不可能获胜却可以阻止其他人获胜的参与者5.股票投资建议6.当博弈中存在三个或更多的参与者时,对任一参与者来说,与大多数人合作总是比较好的选择。

7.两人作伴,三人拥挤”的博弈8.前面的博弈有三种类型:9.一是有人始终被排除在联盟之外;10.二是有人扮演拆台者的角色;11.三是第三人必须与大多数人保持一致。

12.现在有第四种情况,即“两人作伴,三人拥挤”的现象。

13.公共物品(public good):带有某种特性的某种商品或服务,政府提供类似服务要优于个人。

14.公共物品具有两个特征:15.——每个人都可以从中受益,特别是没有付费的人可以与付费的人同等享用该物品;16.——成本由提供服务的水平决定,而不取决于接受服务的消费者数量。

同等水平下,消费者数量的增加不会导致成本的升高,而且没有人能够通过减少公共物品对他人的服务以增加对自己的服务。

17.例如非商业用途的广播、免费的乡间公路、国防等。

18.三人博弈中,两人可以形成联盟以抵抗第三人;但非合作博弈中,联盟并非总是可行,只有符合纳什均衡的联盟才可能稳定。

19.三人博弈中还有“拆台者”现象。

20.三人博弈中,参与者会遵循服从大多数的原则。

概率;期望值;风险厌恶概率(probablity):衡量可能性的一种数字度量,取值范围为[0,1]。

期望值(expected value):所有可能收益的加权平均之和,权重为各种可能的对应概率。

例1:赌博中投出6得到10美元,投出其他数字什么也没有。

期望值=10×1/6﹢0×5/6=5/3自然的不确定性(natural uncertainty):是博弈的一方重要力量。

“自然”同“机遇”都是相当特殊的博弈参与者,与理性行为不同的是,自然界从不关心结果,而是随机地采取具有特定概率的战略。

创新产品未来面临的市场是“好”还是“不好”是未知的;未来条件的“好”与“不好”由自然随机决定,发生的概率各占50%;在某种意义上讲,数学期望是不确定收益的公平价值。

由于期望值带有风险,而人们常常希望规避风险,所以仅仅知道期望值是不够的。

风险厌恶(risk averse):如果某人选择具有相同期望值的无风险收益,而不是带有风险的收益时,我们就说他是风险厌恶的;风险偏好(risk loving):如果某人选择带有风险的收益,而不是具有相同期望值的无风险收益,我们就说他是风险偏好的;风险中立(risk neutral ):如果某人不考虑风险,只考虑期望值的大小,我们称之为风险中立期望效用效用(utility)将风险厌恶与其他类型的主观动机联系起来。

首先假定在博弈中,获胜方的主观收益可以用数字测量,即效用。

效用不一定等同于货币收益期望效用:消费者在不确定条件下的可能得到的各种结果的效用的加权平均数。

pU(W1)+(1-p)U(W2)期望值的效用:不同结果下的消费者所拥有的货币财富量的加权平均数的效用。

U[pW1+(1-p)W2]当无风险收益(虚线曲线)相比具有相同期望值的有风险收益(实线直线)具有更大的效用。

相关主题