当前位置：文档之家› 第五讲博弈论与决策策略

第五讲博弈论与决策策略

企业2 企业无新产品企业 1 无新产品有新产品有新产品企业1 企业最小 3 2
1. 2.
4，4 ， 6，3 ，
3
3，6 ， 2，2 ，
2
企业2 企业最小
同步决策
支配策略最大最小策略纳什均衡纳什均衡
1 2 3
纳什均衡（1）纳什均衡（均衡
下面博弈中，厂商A没有支配策略。因为A 下面博弈中，厂商A没有支配策略。因为A的最佳决策取决的选择：选择做广告时，应当选择做广告；然而，于B的选择：当B选择做广告时，A应当选择做广告；然而，选择不做广告时，应当选择不做广告。当B选择不做广告时，A应当选择不做广告。假定两个厂商需要同时决策，应当如何决策？需要同时决策，A应当如何决策？解答这一问题，需要把自己放在B的位置，解答这一问题，A需要把自己放在B的位置，并在此基础上考虑自己的选择。支付矩阵表明B有一个支配策略：不论A 考虑自己的选择。支付矩阵表明B有一个支配策略：不论A 选择如何，选择做广告时利益较大，因而A可以判断B 选择如何，B选择做广告时利益较大，因而A可以判断B会选择做广告。而在B做广告时，应当选择做广告。因而，选择做广告。而在B做广告时，A应当选择做广告。因而，均衡结局是双方都做广告。均衡结局是双方都做广告。
支配策略的推广：支配策略的推广：智猪博弈
猪圈中有一头大猪，一头小猪，猪圈中有一头大猪，一头小猪，它们各有一个按钮，控制猪食供应；一个按钮，控制猪食供应；每按一下按钮就会有十个单位饲料，就会有十个单位饲料，但要付出两个单位成本，其支付矩阵如下： 5，1 ， 9，-1 ，等待 4，4 ， 0，0 ，
同步决策
支配策略最大最小策略纳什均衡纳什均衡
1 2 3
支配策略：支配策略：支付矩阵
可以用支付矩阵（Payoff Matrix，又称得益矩阵，可以用支付矩阵（ Matrix，又称得益矩阵，收益矩阵等）来描述一个博弈结构。收益矩阵等）来描述一个博弈结构。下面简单的支付矩阵中，有两个参与者厂商A和厂商B 矩阵中，有两个参与者厂商A和厂商B；它们各自可以选择两种策略（它们可以表示生产或不生产某种商品，选择两种策略（它们可以表示生产或不生产某种商品，提高或不提高价格，做不做广告的选择等）；）；数字表提高或不提高价格，做不做广告的选择等）；数字表示双方在不同策略选择组合下各自得到的支付，较大示双方在不同策略选择组合下各自得到的支付，数字代表较大利益或效用。数字代表较大利益或效用。
厂商B 做广告做广告 10，5 6，8 不做广告 15，0 20，2
厂商A
不做广告
纳什均衡（纳什均衡（2）
上述均衡结果被称作纳什均衡 Equilibrium)： (The Nash Equilibrium)：假设个人参与博弈，有n个人参与博弈，给定其他人策略条件下，略条件下，每个人选择自己的最优策略（优策略（个人最优策略可能依赖于也可能不依赖于其他人的策），所有参与人选择的策略组略），所有参与人选择的策略组合便是纳什均衡。合便是纳什均衡。在纳什均衡状态下，态下，只要其它参与者不变换策略选择，略选择，任何单个参与者不可能单方面通过变换策略来提高他的所获支付。所获支付。
厂商B 价格不变厂商A 价格不变涨价 10，10 -20，30 涨价 100，-30 140，35
这一博弈中每个参与者都存在一个支配策略（ Dominant Strategy， Strategy，又称占优或超优策即不管对手采用什么策略，略)，即不管对手采用什么策略， A、B 厂商都将保持价格不变作为最优策略。因此，为最优策略。因此，可以肯定地说，地说，这一博弈结果是价格不变。
博弈理论的发展与代表人物
1944年，J·冯·诺依曼、O·摩根斯坦恩在《博弈 1944年冯诺依曼、摩根斯坦恩在诺依曼摩根斯坦恩理论与经济行为》首先提出一些博弈论的概念。理论与经济行为》首先提出一些博弈论的概念。纳什和图克等人奠定了非合作博 50年代年代，纳什和图克 50年代，J·纳什和图克等人奠定了非合作博弈论的基础。弈论的基础。 60年代年代， ·泽尔腾在纳什均衡引进动态分析，泽尔腾在纳什均衡引进动态分析 60年代，R·泽尔腾在纳什均衡引进动态分析，海萨尼引进不完全信息的研究引进不完全信息的研究。海萨尼引进不完全信息的研究。 1994年纳什、 1994年，纳什、泽尔腾和海萨尼获得诺贝尔经济学奖。经济学奖。
博弈的种类
合作博弈与非合作博弈
厂商之间的经济博弈可以是合作的，以是合作的，也可以是非合作的。作的。区别在于是否存在一有约束力的协议。如果有，个有约束力的协议。如果有，就是合作博弈；如果没有，就是合作博弈；如果没有，就是非合作博弈。就是非合作博弈。前者强调团体理性，即效率、团体理性，即效率、公平和公正；后者强调个人理性个人理性和公正；后者强调个人理性和个人最优决策。个人最优决策。
由此可见，小猪的最优选择是“等待”，由此可见，小猪的最优选择是“等待” 大猪的最优选择是“ 大猪的最优选择是“按”。
•在竞争性市场中存在着不同规在竞争性市场中存在着不同规模的企业，进行研究开发，为模的企业，进行研究开发，新产品做广告，对大企业是值新产品做广告，得的，对小企业则得不偿失。得的，对小企业则得不偿失。因而，常见的情形是，因而，常见的情形是，小企业把精力花在模仿上，把精力花在模仿上，或等待大企业用广告打开市场后出售产品。
夏普公司六个地区七个地区
六个地区施乐公司七个地区
40
70
35
55
30
60
45
45
连续排除最差策略
当厂商存在多种策略时，当厂商存在多种策略时，可通过连续排除最差策略方式简化决策，连续排除最差策略方式简化决策，即通过重复排除最差的结果，即通过重复排除最差的结果，直到没有最差的策略，做出选择。到没有最差的策略，做出选择。
•一个所谓 Game 至少需要三个要素：一个所谓Game 至少需要三个要素：一个所谓 Game至少需要三个要素博弈或游戏参加者。（ 1 ）博弈或游戏参加者。博奕论分析假定参与者都是机智而理性的。分析假定参与者都是机智而理性的。行动或策略空间。（ 2 ）行动或策略空间。博奕参与者必须知道他自己及其对手伙伴的策略选择范围，策略选择范围，并了解各种策略之间的因果关系。间的因果关系。（ 3 ）有可评价优劣高下的决策行为结果。劣高下的决策行为结果。博弈论用数字表示这类结果，数字表示这类结果，并称之为支付 Payoff). （Payoff).上述三部分描述了一个博弈的规则或结构。博弈的规则或结构。
动态
完全信息动态均衡 ;子博弈精炼纳什均衡
不完全信息静态均衡; 不完全信息动态均衡; 贝叶斯纳什均衡精炼贝叶斯纳什均衡
静态博弈：博弈中参与人同时选择行动，或虽非同时但后行动静态博弈博弈中参与人同时选择行动，博弈中参与人同时选择行动者并不知道前行动者采取什么行动；者并不知道前行动者采取什么行动；动态博弈：参与人的行动有先后顺序参与人的行动有先后顺序, 动态博弈参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。先行动者所选择的行动。完全信息指的是每一个参与人对所有其他参与人对手）指的是每一个参与人对所有其他参与人（完全信息指的是每一个参与人对所有其他参与人（对手）的特战略空间及支付函数有准确的知识，否则就是不完全信息不完全信息。征、战略空间及支付函数有准确的知识，否则就是不完全信息
零和博弈与非零和博弈
在零和博弈中，在零和博弈中，一方之所得即为另一方之所失；所得即为另一方之所失；在非零和博弈中，在非零和博弈中，双方的得失取决于各自选择采取的行动。采取的行动。
博弈的种类
博弈的分类与对应的均衡概念
行动顺序/ 信息状况
完全信息不完全信息
静态
完全信息静态博弈; 纳什均衡
同步决策
支配策略最大最小策略纳什均衡纳什均衡
1 2 3
最大最小策略
依照风险—厌恶假定，依照风险厌恶假定，不论对手采用何种策厌恶假定略，决策者采用确保在可能的最坏结果中得到最好结果的策略，称谓“最大最小策略” 到最好结果的策略，称谓“最大最小策略”。最大最小策略步骤：最大最小策略步骤：选择每种策略中最差的结果（最小值）；选择每种策略中最差的结果（最小值）；在最小值中选取最大值。在最小值中选取最大值。
简单的结论
在管理决策中，在管理决策中，首先应该寻找是否存在支配策略支配策略；是否存在支配策略；如果有支配策略，则应选择支配策略。配策略，则应选择支配策略。如果不存在支配策略，如果不存在支配策略，则寻找最差策略，最差策略，并通过不断排除最差策略，差策略，找到可能得到的最好的策略。的策略。
施乐与夏普是两家提供复印机维修服务的公司，施乐与夏普是两家提供复印机维修服务的公司，现在它们需要决定是否停止在第七个地区的服务？它们需要决定是否停止在第七个地区的服务？从施乐公司看，它不存在支配策略；但从夏普公司看，从施乐公司看，它不存在支配策略；但从夏普公司看，它存在一个支配策略，即停止第七个地区的服务，它存在一个支配策略，即停止第七个地区的服务，可以使其利润上升。以使其利润上升。P201
本讲内容
博弈论基本概念同步决策顺序决策
重复决策
什么是同步决策
在寡头垄断市场，在寡头垄断市场，当管理者在无法知道竞争对手的决策情况下，知道竞争对手的决策情况下，要做同步决策。出自己的决策，则称为同步决策出自己的决策，则称为同步决策。同步决策不在于强调决策者与竞争对手的决策在时间上同时做出，时间上同时做出对手的决策在时间上同时做出，只是表明，是表明，在管理者做出自己的决策时不知道竞争对手的决策。时不知道竞争对手的决策。

e商务文档

第五讲博弈论与决策策略

相关文档推荐：

e商务文档

第五讲 博弈论与决策策略

相关文档推荐：

第五讲博弈论与决策策略