当前位置:文档之家› 博弈论及其在决策中的应用..

博弈论及其在决策中的应用..


B1
B2
A1
A2
底下的为顶点
厂商Ⅰ
进入市场有先后顺序时的决策树
13
在以上例子中,可以看到




博弈的所有参与者称为局中人(player),当然至 少有两个 ;并且利益完全一致的多个参与者应 视为一个局中人。如打桥牌中的相对而坐的两个 人算作一个局中人。 每一局中人都有一套可供选择的方案或办法对付 对方,这样的一套备选方案称为策略或战略 (strategy); 局中人各自选定某一策略之后就会形成某种局势 (situation),其中两个局中人各有所得,称为 支付或得益(payment)或支付函数(payoff function),它依赖于局势 。 若列出的是矩阵形式则称为支付矩阵 。


某地区有Ⅰ、Ⅱ两个厂商生产同一类产品, 为了占领市场,各自制定了自己的产销计 划,假设两个局中人各有两种产出水平, 记为(A1,A2)和(B1,B2). 如果厂商Ⅰ率先进入市场,并选择一种产 出水平,然后厂商Ⅱ再进入市场,并选择 相应的产出水平,这一市场竞争过程可用 “对策树”描述如下:
12
上面的为终 点 (3,2) B1 厂商Ⅱ (2,4) (6,3) (4,6) B2 厂商Ⅱ
4

特别是在1994年10月份,瑞典皇家科学院宣布该 年度的诺贝尔经济学奖授予美国普林斯顿大学数 学教授约翰· 纳什(J. Nash)、加州大学教授
约翰· 哈萨尼(J. Harsanyi) 和德国波恩大 学教授瑞哈德· 泽尔滕(Reinhard· Selten) 三人,以表彰他们把博弈论应用到现代经 济分析所做的贡献,使得博弈论在世界范 围内影响更大。
2

1944年,冯· 诺依曼(Von· Neumann)与摩 根斯坦(Morgenstern)合著发表了《对策 论与经济行为》一书,开创了对策论的系 统化、公理化的研究。
3
博弈在经济决策中的应用


到了20世纪80年代,博弈论已经受到 世界各国经济与管理学家的重视,并 认为是经济理论分析和决策的核心方 法,列为西方经济学有关专业学生的 一门必修课程。 在此期间,博弈论的思想、概念和方 法在经济学和管理学杂志上大量涌现, 在世界范围内兴起一股学习和研究博 弈论的热潮。

例1:儿时的游戏:“石头、剪子、布”。规则 为每人从中确定一种出法,出法确定后,就决定 了一个“局势”,并确定每个人的输赢。 游戏规则规定:获胜者得1分,输者得 -1分,出 现平手时各得0分,则可以把各种可能的局势和 得分情况表示为如下一个矩阵:
甲 石头 剪子 布 乙 石头 剪子 布
(0,0)(1,-1)(-1,1) (-1,1)(0,0)(1,-1) (1,-1)(-1,1)(0,0)
1 1 0 1 0 1 1 1 0
10
例2:囚徒困境问题

支付矩阵为
坦 白
囚徒B
坦白
抵赖
囚徒A
抵 赖
(8,8) (0,10) (10, 0) (1,1)
11

此例中两人得益之和不等于0,称为二人非零和 博弈。
例3 :两厂商生产产量的博弈问题
5


1994年、2001年和 2005年诺贝尔经济学奖 都颁发给了在博弈论方面做出了突出贡献 的数学家和经济学家,更加显示了博弈论 在经济学研究和应用中的地位。 发展至今,博弈论已经成功应用于经济、 管理、军事、政治等诸多领域,已经成为 经济研究和决策的重要工具。
6
本章简明介绍博弈论的基本概念、 基本方法及其在决策中的应用
第6章 博弈论及其在决策中的 应用
内容概览 §6.1 博弈论的基本概念 §6.2 零和博弈(矩阵博弈) §6.3 二人非零和博弈 §6.4 博弈论在经济决策中的应用
1
博弈论(Game Theory) ,又称对策论,策略 运筹学等,是研究竞争策略运筹的科学, 或者说是研究具有竞争、冲突等问题的科 学,其应用始终与经济决策有密切的联系, 在市场竞争中大有用武之地。 我国早在古代时期的《孙子兵法》就闪烁着 对策论的思想光辉。田忌与齐王赛马的故 事就是一个经典的博弈故事。
16
博弈模型的表示



一般形式:G={I,S,P} 其中,I表示居中人的集合; S为策略集合; P表示支付函数。
若某个策略S*=(S1*,S2*,…,Sn*)∈S,使 得满足某种均衡性质和条件,则称该策略S*为S 的均衡点(或均衡解),对应的支付为均衡支付 P(S*)



博弈现象普遍存在于军事、政治、经济、 管理、科技等竞争活动中。虽然,博弈来 源于竞争,但并非所有竞争都构成博弈。 例如,小孩之间玩投掷一颗筛子的竞赛, 谁掷出的点数多则为获胜者,这不是博弈, 但如果玩石头、手绢等游戏就构成博弈。 所以要构成一个博弈问题,必须具备一定 条件
7
§6.1


博弈论的基本概念
14
博弈模型的三个要素

局中人(参与人,player)
策略(战略, strategy) 支付函数(得益, 赢得, payment)


15
所以,构成博弈有三个要素:
1.局中人或参与人(player):有权决定选择何种策略的参 加者。 根据局中人的多少,分为两人对策和多人对策 2. 策略(Strategy)和策略集:在每局对策中,参加对策的局中 人都有可供实际选择的完整的行动方案,成为策略集合。 其中,一种方案成为一个策略。如,{石头,剪子,布} 就是一个策略集。 根据策略集中元素个数多少,可分为有限对策与无限对策 3.支付函数(Payment): 又称为赢得函数,是指每一局对策结 束之后,对其中一个局中人来说,其得到的成果(也许 是物质或现金之类的收入或支出),统称为得益。常常 以某一函数统一表示。
8
在这个例子中,有玩者、策略及其策略集合、 以及损益函数(支付函数)
1.局中人或参与人(player):两个小孩
2. 策略(Strategy)和策略集:{石头,剪子,布}
3.支付函数(Payment): 得到的分数。 一般双方会形成一个得益矩阵
9
而且,在此问题中


同一局势下,两个局 中人的得益之和等于 0,这样的博弈模型 称为二人零和博弈。 对于这类特殊的二人 零和博弈,其得益矩 阵可简化为只写出第 一个局中人(或参与 人)的得益即可,在 上例中,支付矩阵可 简化写为:
相关主题