当前位置:文档之家› 互动博弈论——博弈论平话 2

互动博弈论——博弈论平话 2


假设市场份额一定,由于策略措施不同,通过预测,两企业市场占有分 析变动情况如上表所示。
12
求解方法之一:最小最大法——安全第一法
乙企业战略 1 甲企 战略 1 2 3 10 12 6 12 2 -1 10 8 10 3 3 -5 5 5 -1 -5 5 5
最小值
最大值
13
设有一矩阵对策,求均衡局势(对策)
30
在一个博弈里,如果所有参与人都有占优策略
存在,那么占优策略均衡是可以预测到的唯一的均衡, 因为没有一个理性的参与人会选择劣策略。
31
完全信息静态博弈
例1:囚徒困境 (prisoner’s dilemma)
囚徒2
坦白 -5,-5 -8,0 抵赖 0,-8 -1,-1
囚徒1

坦白 抵赖
思考求解方法的差异:
当解不唯一时,解之间的关系有两个性质: 1)无差别性; 2)可交换性。
此时,局中人可以不依赖于其他人的纯策略,而 选择构成解的最优策略。
17
作业1:求解下列矩阵对策
9 6 2 5 3 9 3 5 4 6 2 6 1 4 3 2 3 4 8 0 6 7 3 8 2 1 5 4 8 8 0 4 2 1 2 4
A
18
案例:
乙企业战略 1 甲 企 战 略
最大 值
最小值
乙企业战略 1 2 -1 10 8 10 3 3 -5 11 11
最小值
2 -1 10 8 10
3 3 -5 5 5 -1 -5 5 5 甲企 战略 1 2 3
1 2 3
10 12 6 12
10 12 6 12
-1 -5 6 无鞍点
最大 值
23
求解矩阵对策的其他方法
——2×2对策的公式法 ——2×m或n×2对策的图解法 ——迭代法 ——线性规划法(基本方法)
总思路: 首先判断是否存在鞍点,当鞍点不存在时,利用优超原则 与方法将原对策的赢得矩阵尽量简化,然后再利用其他方法进 行求解。
24
作业2:
利用优超法求解下列矩阵对策
A
3 5 7 4 6
4 0 3 6 0
0 2 9 8 8
3 0 5 9 5 9 7 6 8 3
25
解:用优超法化简
A
3 5 7 4 6
2 0 3 6 0
0 2 9 8 8
X 1-X
3 0 5 9 5 9 7 6 8 3
A
7 3 4 6
y
1-y
26
E
X
1-x
7 4
3 6
y 1-y y 1-y
E
7x+4(1-x)
解得X3*=1/3,X4*=2/3 y1*=1/2,y2*=1/2 则原对策矩阵的一个解是: X*=(0,0,1/3,2/3,0) y*=(1/2,1/2,0,0,0) 期望赢得值为5
22
思考:混合战略的现实意义?
齐王与田纪赛马博弈的混合均衡
齐王的赢得矩阵:
3 1 1 3 A 1 -1 -1 1 1 1 1 1
6-3x-2y+6xy
令 E x 3 6 y 0 则得到 y 1 / 2
3 6 y
E y
2 6 x

E y
2 6 x 0 则得到 x 1 / 3
A
3 5 7 4 6
2 0 3 6 0
0 2 9 8 8
3 0 5 9 5 9 7 5.5 8 3
5
策略式表达又称为标准式表达,在这种表 达中,所有参人同时选择自己的策略,所有参 与人选择的策略一起决定每个参与人的得益。 值得强调的是,这里参与人同时选择的是 “策略”,而不是“行动”。 在静态博弈中,由于参与人只选择一次,所 以策略就等同于行动。而在动态博弈中,策略 是参与人在各个阶段的行动的全面计划。
原因:局中人乙选择了策略2,使局中人甲得到了更多的赢得(8-(-1)(11-6)=4),所以对乙来说,策略2不是最优策略。 此时,双方的策略是局中人甲与乙策略集中的一个概率分布,即混和策略 (纯策略是混合策略的特例)。混合策略的采用是使双方得到的期望效用相同。
19
称G*={S1*,S2*,E}为对策G的混合扩充。E(x,y)=xTAy,此时的 博弈均衡局势是使
8
3
博弈的得益矩阵表示
一个博弈被称为有限博弈,如果:
第一,参与人的个数是有限的;
第二,每个参人可选择的策略个数是有限的。
有限博弈的策略式表达及其求解可以用得益矩阵直观地给出。
9
第二讲 完全信息静态博弈
序 一 二 基本概念简介 两人有限零和对策问题的解法 两人有限变和对策问题的解法
10
一 两人有限零和对策问题的求解
局中人II的策略
e
f
g a b c d
A
6 3 9 -3
1 -8 2 4 -1 -10 0 6
局 中 人 I 的 策 略
14
矩阵对策的均衡局势(f,b)
局中人II的策略
e
f
g a b c d
A
6 3 9 -3
1 -8 2 4 -1 -10 0 6
局 中 人 I 的 策 略
15
规律:如有
max min a ij min max a ij a i
最小最大法(安全第一法)与优超法在有限非零和博弈中的适用性?
32
对比:鞍点不存在时,求解两人有限零和对策问 题的方法之二—优超法
A
3 5 7 4 6
2 0 3 6 0
0 2 9 8 8
3 0 5 9 5 9 7 5.5 8 3
A
7 3 4 6
33
无占优策略均衡 的经典博弈模型
智猪博弈

大 猪 按 等待
3x+6(1-x)
E [7x+4(1-x)]y + [3x+6(1-x)](1-y) E
E x
6-3x-2y+6xy
令 E x
E y
3 6 y
3 6 y 0 则得到 y 1 / 2
E y
2 6 x

2 6 x 0 则得到 x 1 / 3
A
3 5 7 4 6
2 0 3 6 0
0 2 9 8 8
3 5 5 7 8
0 9 9 6 3
解得X3*=1/3,X4*=2/3 y1*=1/2,y2*=1/2
则原对策矩阵的一个解是: X*=(0,0,1/3,2/3,0) y*=(1/2,1/2,0,0,0) 期望赢得值为5
27
二 两人有限变和对策问题的求解
1 2
11
案例:
乙企业战略 1 甲企 战略 1 2 3 10 12 6 2 -1 10 8 3 3 -5 5
甲乙企业生产同一种电子产品,两企业均线通过改进管理获取更多的市 场销售份额。其中:
甲企业中的战略1代表降低产品价格;2 提高产品质量;3 推出新产品 乙企业中的战略1代表增加广告费用;2 增加位球王点;3 改进产品性能。
求解方法: 1 占优策略均衡; 2 严格劣策略的重复剔除;
对比:
两人有限零和对策问题的求解方法
3 纳什均衡(基本方法);
4 箭头法。
1)安全第一方法 2)优超法 3)2×2对策的公式法 4)2×m或n×2对策的图解法 5)迭代法 6)线性规划法(基本方法)
几个经典模型:
囚徒困境
坦白
囚徒1 坦白 -5,-5 -8,0
小猪
等待
1 1 3 1 -1 1
1 1 1 3 1 -1
1 -1 1 1 3 1
-1 1 1 1 1 3
A没有鞍点,只有最优混合策略: X*=(1/6,1/6,1/6,1/6,1/6,1/6) y*=(1/6,1/6, 1/6,1/6,1/6,1/6) 对策的值(对齐王而言):1
意义:当矩阵对策不存在鞍点时,竞争双方在开局前 均应对自己的策略加以保密,否则不保密的一方要吃亏。
0,-8 -1,-1
大 猪
按 等待
5,-1 9,-1
抵赖
性别战
足球 男 足球 芭蕾 2,1 0,0
女 芭蕾
斗鸡博弈
进 0,0 1,2 A 进 退 -3,-3
B 退 2,0
0,2
0,0
29
纳什均衡
1、占优策略均衡。一般来说,由于每个参 与人的得益是博弈中所有参与人的策略的函数, 因此每个参与人的最优策略选择依赖于所有其他 参与人的策略选择。但在一些特殊的博弈中,一 个参与人的最优策略可能可以不依赖于其他参与 人的策略选择,就是说,不论其他参与人选择什 么策略,他的最优策略是 唯一的,这样的最优 策略被称为“占优策略”。 如果一个博弈中,某个参与人有占优策略, 那么该参与人的其他可选择策略就被称为“劣策 略”。
互动决策论---博弈论平话 马小琪
黑龙江大学信息管理学院
1
博弈分析前要明确的几个问题
1 博弈视角?
(局中人还是局外人)
2 如何进行博弈分析?
(除了确定博弈要素之外还需要博弈分析方法)
3 博弈分析的难点? (对现实的贴近描述→分析的框架的作用) 4 均衡的现实含义?
(均衡与均衡结果的差异)
5 博弈分析是否能够完全预测博弈结果?
进 不进 (0,400) 在位者 在位者 (0,300) 打击 打击 (40,50) (30,80) (-10,100) (-10,0) 7
[1-P] 进
策(战)略式的表述:
1 、 博 弈 的 参 与 人 集 合 : i∈Γ , Γ=(1,2,…, n); 2、每个参与人的战略空间:Si i = 1,2,3,…,n; 3、每个参与人的得益函数:ui(s1, …, si…,sn),i=1,2,3, …,n。 用G={S1,…,Sn;u1, …,un}代表战 略式表述博弈。
相关主题