博弈论与领导干部决策思维
1. 囚徒困境
“囚徒困境”博弈是1950年图克(Tucker)提 出的。它非常简单,却反映了博弈的根本特征, 是阐释众多经济社会问题的经典范式。
警察抓住两个罪犯,分别关押,并与罪犯 讲清:如果一人坦白,一人抗拒,坦白者立即 释放,抗拒者判刑 8 年;若两人都坦白,按律 从轻各判 5 年。罪犯知道,他们若抗拒,警察 掌握的证据只能各判 1 年。最后的结果会怎样?
博弈论,是研究决策主体的行为发 生直接相互作用时候的决策以及这种决 策的均衡问题。
博弈论研究的对象是理性的参与者 如何选择策略或如何作出行动的决定, 使自己的目标最大化。
2. 构成一个博弈的基本要素
博弈的七要素
参与人、行动、信息、战略、支付பைடு நூலகம்数、 结果、均衡。
参与人是博弈中选择行动以最大化自己效用的决 策主体(可以是个人、团体等);
俗含意不过是弈棋、赌胜,但由于它是带 有文言性质的词,因而显得学术味浓一些, 既能反映这门学科的特点和实质,又给人 一种高深莫测的感觉。
博弈的简明定义:博弈即一些个人 或其他组织,面对一定的环境条件,在 一定的规则下,同时或先后,一次或多 次,从各自允许选择的行为或策略中进 行选择并加以实施,各自取得相应结果 的过程。
将上述两个角度的划分结合起来,共有四 种不同类型的博弈,即:完全信息静态博弈, 完全信息动态博弈,不完全信息静态博弈,不 完全信息动态博弈。
博弈的分类表
行动顺序 信息
完全信息
静态
完全信息 静态博弈
不完全信息 不完全信息 静态博弈
动态
完全信息 动态博弈
不完全信息 动态博弈
二、博弈论中的经典分析及启示
从这个角度,博弈可以分为静态博弈和动态 博弈。
静态博弈指的是博弈参与人同时行动,或虽 非同时但后行动者不知道前行动者采取了什么 具体行动。
动态博弈指的是参与人的行动有先后顺序, 且后行动者能观察到先行动者所选择的行动。
(2) 参与人的信息
从这个角度,博弈可以分为完全信息博弈 和不完全信息博弈。完全信息指的是每一个参 与人对所有其他参与人(对手)的特征、战略空 间及支付函数有准确的知识;否则,就是不完 全信息。
博弈论与领导干部决策 思维
张泰城
引言
20世纪90年代至2003年,诺贝尔经 济学奖三次(1994,1996,2001)授予 了与博弈论相关的研究领域,总共有八 位经济学家获奖,是获奖人数最多的领 域(排在第二位的是金融)。
博弈论研究的最大特点
一般决策研究(数学表达): Y = f ( x1, x2, …, xn )
行动是参与人的决策变量;
战略是参与人选择行动的规则,它告诉参与人在 什么时候选择什么行动;
信息指的是参与人在博弈中的知识,特别是有关 其他参与人(对手)的特征和行动的知识;
支付函数是参与人从博弈中获得的效用水平,是 每个参与人真正关心的东西;
结果是指博弈分析者感兴趣的要素的集合; 均衡是所有参与人的最优战略或行动的组合。
有限博弈、无限博弈;
得益情况
零和博弈、常和博弈、变和博弈;
博弈过程
静态博弈、动态博弈、重复博弈;
信息结构
完全信息博弈(静、动态)、不完全 信息博弈(静、动态) ,完美信息动 态博弈、不完美信息动态博弈;
博弈方的理性 和行为逻辑
完全理性博弈、有限理性博弈; 合作博弈、非合作博弈。
常见的博弈分类 :
(1) 参与人行动的先后顺序
博弈论的决策研究(数学表达): Y = f ( x1, x2 ,…, xn , z ) (z为他人行为)
特点:决策者目标函数的自变量中包含他人行为。
严格地讲,博弈论是一种方法,应用范
围不仅包括经济学,政治学、军事、外交、 国际关系、公共选择,还有犯罪学,都涉及 到博弈论。实际上,不少人把博弈论看成是 数学的一个分支。纳什1951年的奠基性文章 就是发表在数学杂志上。夏普里1953年的文 章本身也是一篇数学手稿。
一、博弈论基础知识
1. 博弈论的基本概念
“博弈论”译自英文“Game Theory”。 直译:“游戏理论”。
游戏有下列特征:
(1)都有规则。 (2)都有结果(赢、输、平),结果能折算成数值。 (3)都有策略或者说计谋,选择不同的策略或计谋
往往带来不同的结果。 (4)策略和利益有相互依存性,即每一个游戏者所
假如博弈中的所有参与人事先达成一项协 议,这个协议是否可以自动实施? 若当事人都 会自觉遵守这个协议,这个协议就构成纳什均 衡:没有人有积极性偏离协议。换句话说,如 果一个协议不构成纳什均衡,它就不可能自动 实施,因为至少有一个参与人会违背这个协议。
大 路 扑空,逃脱
捉住曹操,被捉
(2)扩展形式(博弈树)
诸葛亮
弃城
守城
司马懿
攻城
退兵
进攻
司马懿 退兵 进攻
退兵 守城
诸葛亮 弃城 守城
弃城
胜利
和 擒住 孔明
和
被擒
被擒 逃脱
逃脱
(3)联盟形式(特殊函数形式)
4. 博弈的类别
博弈分类可依不同的判据进行:
博弈人数
单人博弈、两人博弈、多人博弈;
策略的数量
坦白
甲
抗拒
乙
坦白
抗拒
-5,-5
0,-8
-8,0
-1,-1
博弈(完全信息)分析方法:上策 均衡,严格下策反复消去法,画线法, 箭头法等。
坦白
甲
抗拒
乙
坦白
抗拒
-5,-5
0,-8
-8,0
-1,-1
此博弈的“均衡”为(坦白,坦白) 该均衡就是大名鼎鼎的“纳什均衡”
纳什均衡:在对方策略确定的情况下,每 个参与者的策略都是最好的,没有人愿意先改 变自己的策略。
得结果的好坏,不仅取决于自身的策略选择, 也取决于其他参加者的策略选择。
策略本身常常没有绝对的好坏之分,只有相对于 他方策略的相对好坏。
博弈论也称为“对策论”。其实并不
是很恰当。因为“对策”在实际中常被用 来表示具体的针对性反应方案,或站在某 个决策方的立场上找针对其他方的对策。 博弈论所研究的决策问题却是有开始、有 次序、有结果的整个过程。 “博弈”的通
博弈的三要素
1) 博弈的参加者 2) 博弈方各自可选择的全部策略
或行动的集合 3) 博弈方的得益
3. 博弈的表述形式
(1) 标准形式(策略形式)
司马懿
攻城
退兵
诸
守城 被擒,中计(主观) 逃脱,和
胜利(客观)
葛
亮
弃城 被擒,胜利
逃脱,和
曹操
华容道
大路
诸 华容道 捉住曹操,被捉 扑空,逃脱 葛 亮