当前位置:文档之家› 完全信息静态博弈.

完全信息静态博弈.


三:优超
1、优超概念 • 如果一个局中人在任何情况下从某种 策略中得到的支付均大于从另一种策略中 得到的支付,那么显然对他而言,前一种 策略优于后一种策略,这就是优超概念的 意义。 • (有严格优势策略和严格劣势策略、弱优 势策略)
三:优超
2、囚徒困境中的优超 在囚徒困境中,对局中人1而言,无论 局中人2采取何种策略,采用“坦白”策略 得到的支付都大于采用“不坦白”策略的 支付。对局中人1来讲,“坦白”策略优超 “不坦白”策略,或者说“不坦白”策略 被优超。从个人利益出发,显然被优超的 策略不应被局中人采用,因此可以利用优 超概念来简化博弈局势,从而获得博弈的 结果(解)。
三:优超
3、囚徒困境的结局 理性的人是不会采用对自己不利的严格劣势 策略的,所以在分析博弈的可能结局时,我们应 该把局中人的严格劣势策略剔除。这样我们就得 到囚徒困境的结局为:双方坦白,各得-6。因 此,我们在分析一个局中人的决策行为是,可以 首先把一个严格劣势策略从该局中人的策略中去 掉,然后在余下的策略范围中,试图再找出这个 局中人或者别的局中人的严格劣势策略,并将它 去掉。不断重复这一过程,直到对每个局中人而 言,再也找不出严格劣势策略为止。
• 在该矩阵中,括号内的第一个数字表示局中人1在对应 策略形成的结局中得到的支付,第二个数字表示局中人 2的相应支付。这种矩阵有时也被称为双支付矩阵,表 中常常省略局中人1和局中人2的标记。缺省的设定是, 局中人1选择行.局中人2选择列。如果有三个局中人, 则局中人3选择矩阵。 • 在不同的博弈论论著中,囚徒困境中的具体数值往往不 一样,情节上也略有差别,但所描述的原理都是一样的, 其中起关键作用的是数值的相对大小而不是数值的绝对 水平。 • 矩阵形式能够很清晰地表示只有两个局中人且每个局中 人可选策略数目不多的博弈局势,有时也用来表示3个 局中人策略有限的局势(列出若干个矩阵)。但它不能表 示局中人可选策略数目无限(或相当多)的情形,也很少 用于4个和更多局中人的情形。在不宜使用矩阵形式表 示的情况下,只能用语言描述或者使用数学公式进行描 述。


• • •
“完全信息”是指局中人对自己与其他局中 人的所有与博弈有关的事前信息(策略、空间、 支付函数等)有充分的了解。 “静态博弈”是指在博弈实际进行时,每个 局中人的策略选择同时进行而且仅进行一次。 这里的“同时”并不要求时间上的完全一致, 只要 每个局中人在选择策略时不知道其他局中人所 选择的策略即可。我们以下通过一个经典实例 来说明策略型博弈是如何描述博弈局势的。
二:囚徒困境
• 有两个人因为涉嫌一次犯罪而被捕,被警方分别 关在两个房间内审讯,他们面临的形势是:如果 两个人都坦白罪行,那么将各被判处6年有期徒 刑;如果一方坦白另一方不坦白,那么坦白者从 宽,判处1年徒刑,抗拒者从严,判处8年徒刑; 如果两个人均不坦白.则各被判处2年徒刑。
囚徒困境策略型博弈
一:策略型表述
三种基本要素构成了策略型博弈 • 1.局中人: • 2 .策略; • 3 .支付:
• 双人博弈:如果局中人只有两个。则称其为双人博弈

• 零和博弈:如果说所有局中人的支付之和在任何情况下均为零的 博弈 • 有限博弈:指博弈的局中人个数与每个局中人的策略数均是有限 的 •
完全信息与静态博弈的理解
完全信息静态博弈
• • • • 教学任务 1、策略型博弈的表达形式 2、如何进行策略型博弈 3、介绍其他策略型
第一节 策略型博弈
• 策略型博弈的定义 在博弈论中抽象出现实博弈中的最基本要 素构成的模型描述就是所谓的策略型,或称标准 型,用这种方式描述的博弈常常称为策略型博弈。 是整个博弈的基石,在此基础上进行博弈分析
严格劣势策略逐次消除法
局中人2
L T 局中人1 1 0 1 C 3 3 R 0






0 3






严格劣势策略逐次消除法
局中人2
L T 局中人1 M 0 1 2 0 0 1 1 C 3





严格劣势策略逐次消除法
局中人2
L T 局中人1 1 0 1 C 3





严格劣势策略逐次消除法
第二节 纳什均衡
• 一、纳什均衡的含义
一策略组合中,所有的参与者面临这 样的一种情况:当其他人不改变策略时, 他此时的策略是最好的。也就是说,此时 如果他改变策略,他的支付将会降低。在 纳什均衡点上,每一个理性的参与者都不 会有单独改变策略的冲动。
第二节
• 二、纳什均衡的意义
纳什均衡
1、它是关于博弈结局的一致性预测 如果所有局中人预测一个特定的纳什均衡会出现,那么之中均衡就会出现, 预测之间没有矛盾,不会因为有的局中人认为认为不符合自己的利益而失败。 只有纳什均衡才能使每个局中人均认可这种结局,而且他们均知道其他局中 人也认可这种结局。而非纳什均衡的结局并非一致性预测.如果局中人预测 会出现非纳什均衡,那么或者是局中人的预测相互不统一,或者是局中人在 估计别人的策略选择或极大化自己的支付时犯了错误。纳什均衡最重要的性 质是“自我强制性”,如果局中人就纳什均衡结局达成协议,那么不需要任 何外力的帮助,它自身就蕴含着保障实现的力量。 • 2、任何非纳什均衡的结局要成为协定都需要外在强制力量(道德、法律等)的 帮助,否则有的局中人将会有动机背叛协定。 • 3、纳什均衡的弱点 • 它并不能保证惟一性,存在多个纳什均衡时哪一个会在现实中出现是一 个难以解决的问题。另外,引入其他理性考虑后,有些纳什均衡并不那么合 理。
局中人2
C T 局中人1 1 3



弱优势策略

左 上 4 12 3 中 10 2 右 12


0 下
12
2 12
11
1 8
11
13



四:囚徒困境的结果及意义
• 1、对于囚徒困境,可以利用严格劣势策略逐次消除法 (迭代剔除被优超策略)的方法去求得结果。 • 2、囚徒困境反映了一个深刻的问题:个体理性与集体 理性之间的矛盾。个体理性选择的结果并非最优,不符 合集体理性的要求。囚徒陷入了理性的困境。 • 3、当每个人都为各自利益而努力的时候,市场经济体 制可以是资源配置得到最有效率的应用。然而类似囚徒 困境的博弈局势显示,每个人仅仅考虑自己利益要求时 的结果不一定是最优结局,存在使参与者利益都得到改 进的可能性却无法实现。 • 4、囚徒困境为我们理解人类理性提供了强有力的分析 工具。
相关主题