当前位置:文档之家› 第五讲 博弈论与决策策略

第五讲 博弈论与决策策略

企业2 企业 无新产品 企 业 1 无新产品 有新产品 有新产品 企业1 企业 最小 3 2
1. 2.
4,4 , 6,3 ,
3
3,6 , 2,2 ,
2
企业2 企业 最小
同步决策
支配策略 最大最小策略 纳什均衡 纳什均衡
1 2 3
纳什均衡(1) 纳什均衡( 均衡
下面博弈中,厂商A没有支配策略。因为A 下面博弈中,厂商A没有支配策略。因为A的最佳决策取决 的选择: 选择做广告时, 应当选择做广告;然而, 于B的选择:当B选择做广告时,A应当选择做广告;然而, 选择不做广告时, 应当选择不做广告。 当B选择不做广告时,A应当选择不做广告。假定两个厂商 需要同时决策, 应当如何决策? 需要同时决策,A应当如何决策? 解答这一问题, 需要把自己放在B的位置, 解答这一问题,A需要把自己放在B的位置,并在此基础上 考虑自己的选择。支付矩阵表明B有一个支配策略:不论A 考虑自己的选择。支付矩阵表明B有一个支配策略:不论A 选择如何, 选择做广告时利益较大,因而A可以判断B 选择如何,B选择做广告时利益较大,因而A可以判断B会 选择做广告。而在B做广告时, 应当选择做广告。因而, 选择做广告。而在B做广告时,A应当选择做广告。因而, 均衡结局是双方都做广告。 均衡结局是双方都做广告。
支配策略的推广: 支配策略的推广:智猪博弈
猪圈中有一头大猪,一头小猪, 猪圈中有一头大猪,一头小猪,它们各有 一个按钮,控制猪食供应; 一个按钮,控制猪食供应;每按一下按钮 就会有十个单位饲料, 就会有十个单位饲料,但要付出两个单位 成本,其支付矩阵如下: 5,1 , 9,-1 , 等待 4,4 , 0,0 ,
同步决策
支配策略 最大最小策略 纳什均衡 纳什均衡
1 2 3
支配策略: 支配策略:支付矩阵
可以用支付矩阵(Payoff Matrix,又称得益矩阵, 可以用支付矩阵( Matrix,又称得益矩阵, 收益矩阵等)来描述一个博弈结构。 收益矩阵等)来描述一个博弈结构。下面简单的支付 矩阵中,有两个参与者厂商A和厂商B 矩阵中,有两个参与者厂商A和厂商B;它们各自可以 选择两种策略(它们可以表示生产或不生产某种商品, 选择两种策略(它们可以表示生产或不生产某种商品, 提高或不提高价格,做不做广告的选择等); );数字表 提高或不提高价格,做不做广告的选择等);数字表 示双方在不同策略选择组合下各自得到的支付,较大 示双方在不同策略选择组合下各自得到的支付, 数字代表较大利益或效用。 数字代表较大利益或效用。
厂商B 做广告 做广告 10,5 6,8 不做广告 15,0 20,2
厂商A
不做广告
纳什均衡( 纳什均衡(2)
上述均衡结果被称作纳什均衡 Equilibrium): (The Nash Equilibrium):假设 个人参与博弈, 有n个人参与博弈,给定其他人策 略条件下, 略条件下,每个人选择自己的最 优策略( 优策略(个人最优策略可能依赖 于也可能不依赖于其他人的策 ),所有参与人选择的策略组 略),所有参与人选择的策略组 合便是纳什均衡。 合便是纳什均衡。在纳什均衡状 态下, 态下,只要其它参与者不变换策 略选择, 略选择,任何单个参与者不可能 单方面通过变换策略来提高他的 所获支付。 所获支付。
厂商B 价格不变 厂商A 价格不变 涨价 10,10 -20,30 涨价 100,-30 140,35
这一博弈中每个参与者都存 在 一 个 支 配 策 略 ( Dominant Strategy, Strategy, 又称占优或超优策 即不管对手采用什么策略, 略),即不管对手采用什么策略, A、B 厂商都将保持价格不变作 为最优策略。 因此, 为最优策略 。 因此 , 可以肯定 地说, 地说 , 这一博弈结果是价格不 变。
博弈理论的发展与代表人物
1944年,J·冯·诺依曼、O·摩根斯坦恩在《博弈 1944年 冯 诺依曼、 摩根斯坦恩在 诺依曼 摩根斯坦恩 理论与经济行为》首先提出一些博弈论的概念。 理论与经济行为》首先提出一些博弈论的概念。 纳什和图克等人奠定了非合作博 50年代 年代, 纳什和图克 50年代,J·纳什和图克等人奠定了非合作博 弈论的基础。 弈论的基础。 60年代 年代, ·泽尔腾在纳什均衡引进动态分析, 泽尔腾在纳什均衡引进动态分析 60年代,R·泽尔腾在纳什均衡引进动态分析, 海萨尼引进不完全信息的研究 引进不完全信息的研究。 海萨尼引进不完全信息的研究。 1994年 纳什、 1994年,纳什、泽尔腾和海萨尼获得诺贝尔 经济学奖。 经济学奖。
博弈的种类
合作博弈与非合作博弈
厂商之间的经济博弈可 以是合作的, 以是合作的,也可以是非合 作的。 作的。区别在于是否存在一 有约束力的协议。如果有, 个有约束力的协议。如果有, 就是合作博弈;如果没有, 就是合作博弈;如果没有, 就是非合作博弈。 就是非合作博弈。前者强调 团体理性,即效率、 团体理性,即效率、公平和 公正;后者强调个人理性 个人理性和 公正;后者强调个人理性和 个人最优决策。 个人最优决策。
由此可见,小猪的最优选择是“等待”, 由此可见,小猪的最优选择是“等待” 大猪的最优选择是“ 大猪的最优选择是“按”。
•在竞争性市场中存在着不同规 在竞争性市场中存在着不同规 模的企业, 进行研究开发, 为 模的企业 , 进行研究开发 , 新产品做广告, 对大企业是值 新产品做广告 , 得的, 对小企业则得不偿失。 得的 , 对小企业则得不偿失 。 因而, 常见的情形是, 因而 , 常见的情形是 , 小企业 把精力花在模仿上, 把精力花在模仿上 , 或等待大 企业用广告打开市场后出售产 品。
夏普公司 六个地区 七个地区
六个地区 施乐公司 七个地区
40
70
35
55
30
60
45
45
连续排除最差策略
当厂商存在多种策略时, 当厂商存在多种策略时 , 可通过 连续排除最差策略方式简化决策, 连续排除最差策略方式简化决策 , 即通过重复排除最差的结果, 即通过重复排除最差的结果 , 直 到没有最差的策略,做出选择。 到没有最差的策略,做出选择。
•一个所谓 Game 至少需要三个要素 : 一个所谓Game 至少需要三个要素: 一个所谓 Game至少需要三个要素 博弈或游戏参加者。 ( 1 ) 博弈或游戏参加者 。 博奕论 分析假定参与者都是机智而理性的。 分析假定参与者都是机智而理性的。 行动或策略空间。 ( 2 ) 行动或策略空间 。 博奕参与 者必须知道他自己及其对手伙伴的 策略选择范围, 策略选择范围,并了解各种策略之 间的因果关系。 间的因果关系 。 ( 3 ) 有可评价优 劣高下的决策行为结果。 劣高下的决策行为结果。博弈论用 数字表示这类结果, 数字表示这类结果,并称之为支付 Payoff). (Payoff).上述三部分描述了一个 博弈的规则或结构。 博弈的规则或结构。
动 态
完 全 信 息 动 态 均 衡 ;子 博弈精炼纳什均衡
不完全信息静态均衡; 不完全信息动态均衡; 贝叶斯纳什均衡 精炼贝叶斯纳什均衡
静态博弈:博弈中参与人同时选择行动,或虽非同时但后行动 静态博弈 博弈中参与人同时选择行动, 博弈中参与人同时选择行动 者并不知道前行动者采取什么行动; 者并不知道前行动者采取什么行动; 动态博弈:参与人的行动有先后顺序 参与人的行动有先后顺序, 动态博弈 参与人的行动有先后顺序,且后行动者能够观察到 先行动者所选择的行动。 先行动者所选择的行动。 完全信息指的是每一个参与人对所有其他参与人 对手) 指的是每一个参与人对所有其他参与人( 完全信息指的是每一个参与人对所有其他参与人(对手)的特 战略空间及支付函数有准确的知识,否则就是不完全信息 不完全信息。 征、战略空间及支付函数有准确的知识,否则就是不完全信息
零和博弈与非零和博弈
在零和博弈中, 在零和博弈中,一方之 所得即为另一方之所失; 所得即为另一方之所失; 在非零和博弈中, 在非零和博弈中,双 方的得失取决于各自选择 采取的行动。 采取的行动。
博弈的种类
博弈的分类与对应的均衡概念
行动顺序/ 信息状况
完全信息 不完全信息
静 态
完全信息静态博弈; 纳什均衡
同步决策
支配策略 最大最小策略 纳什均衡 纳什均衡
1 2 3
最大最小策略
依照风险—厌恶假定, 依照风险 厌恶假定,不论对手采用何种策 厌恶假定 略,决策者采用确保在可能的最坏结果中得 到最好结果的策略,称谓“最大最小策略” 到最好结果的策略,称谓“最大最小策略”。 最大最小策略步骤: 最大最小策略步骤: 选择每种策略中最差的结果(最小值); 选择每种策略中最差的结果(最小值); 在最小值中选取最大值。 在最小值中选取最大值。
简单的结论
在管理决策中, 在管理决策中,首先应该寻找 是否存在支配策略 支配策略; 是否存在支配策略;如果有支 配策略,则应选择支配策略。 配策略,则应选择支配策略。 如果不存在支配策略, 如果不存在支配策略,则寻找 最差策略, 最差策略,并通过不断排除最 差策略, 差策略,找到可能得到的最好 的策略。 的策略。
施乐与夏普是两家提供复印机维修服务的公司, 施乐与夏普是两家提供复印机维修服务的公司,现在 它们需要决定是否停止在第七个地区的服务? 它们需要决定是否停止在第七个地区的服务? 从施乐公司看,它不存在支配策略;但从夏普公司看, 从施乐公司看,它不存在支配策略;但从夏普公司看, 它存在一个支配策略,即停止第七个地区的服务, 它存在一个支配策略,即停止第七个地区的服务,可 以使其利润上升。 以使其利润上升。P201
本讲内容
博弈论基本概念 同步决策 顺序决策
重复决策
什么是同步决策
在寡头垄断市场, 在寡头垄断市场,当管理者在无法 知道竞争对手的决策情况下, 知道竞争对手的决策情况下,要做 同步决策。 出自己的决策,则称为同步决策 出自己的决策,则称为同步决策。 同步决策不在于强调决策者与竞争 对手的决策在时间上同时做出, 时间上同时做出 对手的决策在时间上同时做出,只 是表明, 是表明,在管理者做出自己的决策 时不知道竞争对手的决策。 时不知道竞争对手的决策。
相关主题