当前位置：文档之家› 互动博弈论——博弈论平话 2

互动博弈论——博弈论平话 2

假设市场份额一定，由于策略措施不同，通过预测，两企业市场占有分析变动情况如上表所示。
12
求解方法之一：最小最大法——安全第一法
乙企业战略 1 甲企战略 1 2 3 10 12 6 12 2 -1 10 8 10 3 3 -5 5 5 -1 -5 5 5
最小值
最大值
13
设有一矩阵对策，求均衡局势（对策）
30
在一个博弈里,如果所有参与人都有占优策略
存在，那么占优策略均衡是可以预测到的唯一的均衡，因为没有一个理性的参与人会选择劣策略。
31
完全信息静态博弈
例1：囚徒困境 (prisoner’s dilemma)
囚徒2
坦白 -5，-5 -8，0 抵赖 0，-8 -1，-1
囚徒1

坦白抵赖
思考求解方法的差异：
当解不唯一时，解之间的关系有两个性质： 1）无差别性； 2）可交换性。
此时，局中人可以不依赖于其他人的纯策略，而选择构成解的最优策略。
17
作业1：求解下列矩阵对策
9 6 2 5 3 9 3 5 4 6 2 6 1 4 3 2 3 4 8 0 6 7 3 8 2 1 5 4 8 8 0 4 2 1 2 4
A
18
案例：
乙企业战略 1 甲企战略
最大值
最小值
乙企业战略 1 2 -1 10 8 10 3 3 -5 11 11
最小值
2 -1 10 8 10
3 3 -5 5 5 -1 -5 5 5 甲企战略 1 2 3
1 2 3
10 12 6 12
10 12 6 12
-1 -5 6 无鞍点
最大值
23
求解矩阵对策的其他方法
——2×2对策的公式法 ——2×m或n×2对策的图解法 ——迭代法 ——线性规划法（基本方法）
总思路：首先判断是否存在鞍点，当鞍点不存在时，利用优超原则与方法将原对策的赢得矩阵尽量简化，然后再利用其他方法进行求解。
24
作业2：
利用优超法求解下列矩阵对策
A
3 5 7 4 6
4 0 3 6 0
0 2 9 8 8
3 0 5 9 5 9 7 6 8 3
25
解：用优超法化简
A
3 5 7 4 6
2 0 3 6 0
0 2 9 8 8
X 1-X
3 0 5 9 5 9 7 6 8 3
A
7 3 4 6
y
1-y
26
E
X
1-x
7 4
3 6
y 1-y y 1-y
E
7x+4(1-x)
解得X3*=1/3，X4*=2/3 y1*=1/2，y2*=1/2 则原对策矩阵的一个解是： X*=（0，0，1/3，2/3，0） y*=（1/2，1/2，0，0，0）期望赢得值为5
22
思考：混合战略的现实意义？
齐王与田纪赛马博弈的混合均衡
齐王的赢得矩阵：
3 1 1 3 A 1 -1 -1 1 1 1 1 1
6-3x-2y+6xy
令 E x 3 6 y 0 则得到 y 1 / 2
3 6 y
E y
2 6 x
令
E y
2 6 x 0 则得到 x 1 / 3
A
3 5 7 4 6
2 0 3 6 0
0 2 9 8 8
3 0 5 9 5 9 7 5.5 8 3
5
策略式表达又称为标准式表达，在这种表达中，所有参人同时选择自己的策略，所有参与人选择的策略一起决定每个参与人的得益。值得强调的是，这里参与人同时选择的是 “策略”,而不是“行动”。在静态博弈中,由于参与人只选择一次,所以策略就等同于行动。而在动态博弈中，策略是参与人在各个阶段的行动的全面计划。
原因：局中人乙选择了策略2，使局中人甲得到了更多的赢得（8-（-1）（11-6）=4），所以对乙来说，策略2不是最优策略。此时，双方的策略是局中人甲与乙策略集中的一个概率分布，即混和策略（纯策略是混合策略的特例）。混合策略的采用是使双方得到的期望效用相同。
19
称G*={S1*，S2*,E}为对策G的混合扩充。E（x，y）=xTAy，此时的博弈均衡局势是使
8
3
博弈的得益矩阵表示
一个博弈被称为有限博弈，如果：
第一，参与人的个数是有限的；
第二，每个参人可选择的策略个数是有限的。
有限博弈的策略式表达及其求解可以用得益矩阵直观地给出。
9
第二讲完全信息静态博弈
序一二基本概念简介两人有限零和对策问题的解法两人有限变和对策问题的解法
10
一两人有限零和对策问题的求解
局中人II的策略
e
f
g a b c d
A
6 3 9 -3
1 -8 2 4 -1 -10 0 6
局中人 I 的策略
14
矩阵对策的均衡局势（f,b）
局中人II的策略
e
f
g a b c d
A
6 3 9 -3
1 -8 2 4 -1 -10 0 6
局中人 I 的策略
15
规律：如有
max min a ij min max a ij a i
最小最大法（安全第一法）与优超法在有限非零和博弈中的适用性？
32
对比：鞍点不存在时，求解两人有限零和对策问题的方法之二—优超法
A
3 5 7 4 6
2 0 3 6 0
0 2 9 8 8
3 0 5 9 5 9 7 5.5 8 3
A
7 3 4 6
33
无占优策略均衡的经典博弈模型
智猪博弈
按
大猪按等待
3x+6(1-x)
E [7x+4(1-x)]y + [3x+6(1-x)]（1-y） E
E x
6-3x-2y+6xy
令 E x
E y
3 6 y
3 6 y 0 则得到 y 1 / 2
E y
2 6 x
令
2 6 x 0 则得到 x 1 / 3
A
3 5 7 4 6
2 0 3 6 0
0 2 9 8 8
3 5 5 7 8
0 9 9 6 3
解得X3*=1/3，X4*=2/3 y1*=1/2，y2*=1/2
则原对策矩阵的一个解是： X*=（0，0，1/3，2/3，0） y*=（1/2，1/2，0，0，0）期望赢得值为5
27
二两人有限变和对策问题的求解
1 2
11
案例：
乙企业战略 1 甲企战略 1 2 3 10 12 6 2 -1 10 8 3 3 -5 5
甲乙企业生产同一种电子产品，两企业均线通过改进管理获取更多的市场销售份额。其中：
甲企业中的战略1代表降低产品价格；2 提高产品质量；3 推出新产品乙企业中的战略1代表增加广告费用；2 增加位球王点；3 改进产品性能。
求解方法： 1 占优策略均衡； 2 严格劣策略的重复剔除；
对比：
两人有限零和对策问题的求解方法
3 纳什均衡（基本方法）；
4 箭头法。
1）安全第一方法 2）优超法 3）2×2对策的公式法 4）2×m或n×2对策的图解法 5）迭代法 6）线性规划法（基本方法）
几个经典模型：
囚徒困境
坦白
囚徒1 坦白 -5，-5 -8，0
小猪
等待
1 1 3 1 -1 1
1 1 1 3 1 -1
1 -1 1 1 3 1
-1 1 1 1 1 3
A没有鞍点，只有最优混合策略： X*=（1/6，1/6，1/6，1/6，1/6，1/6） y*=（1/6，1/6， 1/6，1/6，1/6，1/6）对策的值（对齐王而言）：1
意义：当矩阵对策不存在鞍点时，竞争双方在开局前均应对自己的策略加以保密，否则不保密的一方要吃亏。
0，-8 -1，-1
大猪
按等待
5，-1 9，-1
抵赖
性别战
足球男足球芭蕾 2，1 0，0
女芭蕾
斗鸡博弈
进 0，0 1，2 A 进退 -3，-3
B 退 2，0
0，2
0，0
29
纳什均衡
1、占优策略均衡。一般来说，由于每个参与人的得益是博弈中所有参与人的策略的函数，因此每个参与人的最优策略选择依赖于所有其他参与人的策略选择。但在一些特殊的博弈中，一个参与人的最优策略可能可以不依赖于其他参与人的策略选择，就是说，不论其他参与人选择什么策略，他的最优策略是唯一的，这样的最优策略被称为“占优策略”。如果一个博弈中，某个参与人有占优策略，那么该参与人的其他可选择策略就被称为“劣策略”。
互动决策论---博弈论平话马小琪
黑龙江大学信息管理学院
1
博弈分析前要明确的几个问题
1 博弈视角？
（局中人还是局外人）
2 如何进行博弈分析？
（除了确定博弈要素之外还需要博弈分析方法）
3 博弈分析的难点？（对现实的贴近描述→分析的框架的作用） 4 均衡的现实含义？
（均衡与均衡结果的差异）
5 博弈分析是否能够完全预测博弈结果？
进不进 (0,400) 在位者在位者 (0,300) 打击打击 (40,50) (30,80) (-10,100) (-10,0) 7
[1-P] 进
策（战）略式的表述：
1 、博弈的参与人集合： i∈Γ ， Γ=(1,2,…， n)； 2、每个参与人的战略空间：Si i ＝ 1,2,3,…,n； 3、每个参与人的得益函数：ui(s1, …， si…，sn)，i＝1,2,3, …，n。用G＝｛S1，…，Sn；u1, …，un｝代表战略式表述博弈。

e商务文档

互动博弈论——博弈论平话 2

相关文档推荐：