当前位置:
文档之家› 最新博弈论公开课1~5节笔记
最新博弈论公开课1~5节笔记
存在的问题:外部性 博弈论学习笔记(一)四个入门结论
题目一
情景一: 在不被你对手看到的情况下,选择 α 或者 β,我们会按以下方式给出你们的成绩:
如果你选择 α 而你对手选 β,那么你得分+3 而你的对手得分-1 如果你们都选 α,那么你门的得分都+0 如果你选择 β 而你对手选 α,那么你得分-1 而你的对手得分+3 如果你们都选 β,那么你们的得分都+1
表达:s’i 严格劣于 si,Ui(si,s-i)>Ui(s’i,s-i) for all “s-i”.
文字表述:如果 si 总是更好的选择,即总能给参与人 i 带来更高的收益,而无论其他参与人 怎么选。
例:防线布置问题
入侵者打算入侵一个国家,有两条路,必须通过其一才能进入,你是这个国家的防御者, 要决定在哪个路口布置防线,只能防守二者之一。一条路崎岖(途中会损失一个营的兵力), 另一条路平坦,如果入侵者遇到了你布置的防线,不管哪条路都要再损失一个营的兵力。
Yale students are evil.
第二节:学会换位思考 博弈的要素有哪些?
要素 参与人 players
表述法(Notation) i,j
The Number game You all
策略 strategies
si(参与人 i 的某个策略)
13
Si(表示策略集合 Strategy alternatives) 1,2,3……100
S(表示某一次博弈)——一个策略组合(a strategy profile profile)
每个参与者对应一个策略组合(或是电 子表格的一个样本)
s-i(表示除了 i 外其他参与人的策略)
收益 payoffs
Ui(1,2……N)——所有参与人的策略决定 简写:Ui(s)
Payoffs=5dollars-mistakens 0dollars (otherwise)
αβ
α 0,0 +3,-1
β -1,3 +1,+1
这种情况下不管我的对手选择什么,我选 α 得到的结果总是最优的。
情景二: 在不被你对手看到的情况下,选择 α 或者 β,我们会按以下方式给出你们的成绩:
如果你选择 α 而你对手选 β,那么你得分-1 而你的对手得分-3 如果你们都选 α,那么你门的得分都+0 如果你选择 β 而你对手选 α,那么你得分-3 而你的对手得分-1 如果你们都选 β,那么你门的得分都+1
第四节:足球比赛与商业合作之最佳对策 伐点球问题:
Goalerlr源自ShooterL4,-4
9,-9
M
6,-6
6,-6
R
9,-9
4,-4
U1(L,l)=4——射进的概率为 40% 结论:无论如何千万不要从中路射门。
不要选择任何信念下都非最佳对策的策略。 我们忽略了什么?
…… Definition3(最佳对策): (1)Player i’s strategy si is a best response(BR) to the strategy s-i of the players
例:
II
I
L
T
5,-1
C
R
11,3
0,0
B
6,4
0,2
2,0
Players:I and ii Strategy alternatives: S1={T,B} S2={L,C,R} Payoffs: Ui(T,C)=11 Uii(T,C)=3 博弈分析: 不管 i 怎么选,中间总是优于右边(center strictly dominates right),得出结论,参与者 ii 不应 该选右。
αβ α 0,0 -1,-3 β -3,-1 +1,+1
这种情况下,当对手选 α,我选 α 较优;当对手选 β,我选 β 较优。-- 协和谬误(Coordination problem)
Test does 2 dominate 1? vs 1: U1(1,1)=50% < U1(2,1)=90% vs 2: U1(1,2)=10% < U1(2,2)=50% vs 3: U1(1,3)=15% < U1(2,3)=20% vs 4: U1(1,4)=20% < U1(2,4)=25% …… 结论:立场 2 严格优于立场 1
结论:入侵者不会采取“弱劣势策略”崎岖之路是弱劣势策略,应在平坦之路设防。
Definition2(弱劣势策略):Player I’s strategy “s’i” is weakly dominated by her strategy “si” if player i’s payoff from choosing “si” against “s-i” is always as big as or equal to payoff from choosing “s’i” against “s-i” for all things that anyone else could do.(参与者的策略 s’i 弱劣于其 他策略 si 当且仅当在对手选 s-i 的情况下,参与人 i 选择 si 的收益等于对手选 s-i 下她选 s’i 的收益。而且在任何情况下此条件均成立)
入侵者
e
h
防守者
E
1,1
1,1
H
0,2
2,0
入侵者收益为攻入国家时还剩多少兵力,防守者的收益为入侵者损失多少兵力。
分析:如果入侵者走 eazy pass,你应防守 eazy pass(优于 hard pass);
如果入侵者走 hard pass,你应防守 hard pass(优于 eazy pass)
Definition1:Player I’s strategy “s’i” ,is strictly dominated by player i’s strategy “si” ,if “Ui” from choosing “s-i”, is strictly bigger than UI(si) when other people choose “s’i”,forall”s-i”.(参与者 i 的策略 s’i,严格劣于参与者 i 的另一个策略 si,在其他参与者选择 s-i 时,此情况下选 s’i 的收 益 UI(s’i),对所有的 s-i 均成立。)
2.并非人人都在投票,有人不投票也是一种策略 3.实际上有多位候选人,不只有两个 4.候选人未必能坚定他的立场,也就是说选民未必相信你的立场 5.其他(党内初选,多维度问题) 『最佳对策』:Best response
2
l
r
1
u
5,1
0,2
m
1,3
4,1
d
4,2
2,3
选上是对手选左时的最佳对策 选中是对手选右时的最佳对策 上中下三个策略中对手选左或选右的可能性都为 1/2 Choosing upper:expacted payoff of U is (1/2,1/2)=1/2*5+1/2*0=2.5 Choosing middle: expacted payoff of M is (1/2,1/2)=1/2*1+1/2*4=2.5 Choosing down:expacted payoff of D is (1/2,1/2)=1/2*4+1/2*2=3 模型解法: 画坐标图,假设选左概率为 X,选右概率为(1-X),解出各自区域的概率面积,联立方程, X=1/3.
表达:s’i 弱劣于其他策略 si,Ui(si,s-i) >=Ui(s’i,s-i)
第三节:迭代剔除和中位选民定理 『迭代剔除』: 例:政治模型案例 假设有两个候选人,他们为了选举必须确定自己的政治立场,他们要从一系列政治主张中选 择一个政治立场。一共有 10 个立场, 1,2,3,4,5,6,7,8,9,10 最靠近左边的(1)代表左翼分子的立场,最靠近右边的(10)代表右翼分子的立场,现假 设每一个立场都会得到 10%的选票,选民们会投票给离他们最近的候选人,出现平局时选 票会分摊,收益为:候选者希望尽可能最大化获得的选票。 分析:1 为严格劣势策略,因为 2 优于 1,意味着选择立场 2 会比立场 1 获得更多选票,无 论另一个候选人如何选择。
Ui(si,s-i)>=Ui(si’,s-i) for all si’ vssi 参与人 i 的策略 si,是一个最佳对策 BR,是对手的策略 s-i 的最佳对策,如果参与人 i 在对 手的策略 s-i 下,选 si 的收益弱优于其他策略 si’,这对于参与人 i 的所有 si’都适用。 OR Si’ slove max Ui(si,s-i) (2) Player i’s strategy si is a best response(BR) to the strategy s-i of the players Eui(si,p)>=Eui(si’,s-i) for all si’ vssi 例:Eui(L,p)=p(l)*Ui(L,l)+p(r)*Ui(L,r) 合伙人博弈: 有两个实体共同完成一个协作项目,这两家公司平分利润,即各自持有 50%股份,每个股 东都要选择为公司投入多少精力,S=[0,4](连续的),假设这个企业的利润是已知的,计算 方式为:4*[s1+s2+b*s1*s2],0<=b<=1/4, 参与人 1 的收益 U1(s1,s2)=1/2*4*[s1+s2+b*s1*s2]-s1^2, 参与人 2 的收益 U2(s1,s2)=1/2*4*[s1+s2+b*s1*s2]-s2^2, 求参与人 1 的最佳策略。 分析:Max(s1) 2(s1+s2+b*s1*s2)-s1^2 一阶求导:2*(1+b*s2)-2*s1=0 二阶求导:s1=1+b*s2 =BR1(s2) S1 是参与人 1 的最佳对策 同理,s2=1+b*s1=BR2(s1) S2 是参与人 2 的最佳对策 由 S1=S2 得 S1=S2=1/(1-B)