当前位置：文档之家› 最新博弈论公开课1~5节笔记

最新博弈论公开课1~5节笔记

存在的问题：外部性博弈论学习笔记（一）四个入门结论
题目一
情景一：在不被你对手看到的情况下，选择 α 或者 β，我们会按以下方式给出你们的成绩：
如果你选择 α 而你对手选 β，那么你得分+3 而你的对手得分-1 如果你们都选 α，那么你门的得分都+0 如果你选择 β 而你对手选 α，那么你得分-1 而你的对手得分+3 如果你们都选 β，那么你们的得分都+1
表达：s’i 严格劣于 si，Ui(si,s-i)>Ui(s’i,s-i) for all “s-i”.
文字表述：如果 si 总是更好的选择，即总能给参与人 i 带来更高的收益，而无论其他参与人怎么选。
例：防线布置问题
入侵者打算入侵一个国家，有两条路，必须通过其一才能进入，你是这个国家的防御者，要决定在哪个路口布置防线，只能防守二者之一。一条路崎岖（途中会损失一个营的兵力），另一条路平坦，如果入侵者遇到了你布置的防线，不管哪条路都要再损失一个营的兵力。
Yale students are evil.
第二节：学会换位思考博弈的要素有哪些？
要素参与人 players
表述法（Notation） i,j
The Number game You all
策略 strategies
si(参与人 i 的某个策略)
13
Si(表示策略集合 Strategy alternatives) 1,2,3……100
S(表示某一次博弈)——一个策略组合（a strategy profile profile）
每个参与者对应一个策略组合（或是电子表格的一个样本）
s-i(表示除了 i 外其他参与人的策略)
收益 payoffs
Ui(1,2……N)——所有参与人的策略决定简写：Ui(s)
Payoffs=5dollars-mistakens 0dollars (otherwise)
αβ
α 0,0 +3,-1
β -1,3 +1,+1
这种情况下不管我的对手选择什么，我选 α 得到的结果总是最优的。
情景二：在不被你对手看到的情况下，选择 α 或者 β，我们会按以下方式给出你们的成绩：
如果你选择 α 而你对手选 β，那么你得分-1 而你的对手得分-3 如果你们都选 α，那么你门的得分都+0 如果你选择 β 而你对手选 α，那么你得分-3 而你的对手得分-1 如果你们都选 β，那么你门的得分都+1
第四节：足球比赛与商业合作之最佳对策伐点球问题：
Goalerlr源自ShooterL4,-4
9,-9
M
6,-6
6,-6
R
9,-9
4,-4
U1(L,l)=4——射进的概率为 40% 结论：无论如何千万不要从中路射门。
不要选择任何信念下都非最佳对策的策略。我们忽略了什么？
…… Definition3（最佳对策）： (1)Player i’s strategy si is a best response(BR) to the strategy s-i of the players
例：
II
I
L
T
5,-1
C
R
11,3
0,0
B
6,4
0,2
2,0
Players:I and ii Strategy alternatives: S1={T,B} S2={L,C,R} Payoffs: Ui(T,C)=11 Uii(T,C)=3 博弈分析：不管 i 怎么选，中间总是优于右边(center strictly dominates right)，得出结论，参与者 ii 不应该选右。
αβ α 0,0 -1，-3 β -3,-1 +1,+1
这种情况下，当对手选 α，我选 α 较优；当对手选 β，我选 β 较优。-- 协和谬误(Coordination problem)
Test does 2 dominate 1? vs 1: U1(1,1)=50% < U1(2,1)=90% vs 2: U1(1,2)=10% < U1(2,2)=50% vs 3: U1(1,3)=15% < U1(2,3)=20% vs 4: U1(1,4)=20% < U1(2,4)=25% …… 结论：立场 2 严格优于立场 1
结论：入侵者不会采取“弱劣势策略”崎岖之路是弱劣势策略，应在平坦之路设防。
Definition2（弱劣势策略）：Player I’s strategy “s’i” is weakly dominated by her strategy “si” if player i’s payoff from choosing “si” against “s-i” is always as big as or equal to payoff from choosing “s’i” against “s-i” for all things that anyone else could do.（参与者的策略 s’i 弱劣于其他策略 si 当且仅当在对手选 s-i 的情况下，参与人 i 选择 si 的收益等于对手选 s-i 下她选 s’i 的收益。而且在任何情况下此条件均成立）
入侵者
e
h
防守者
E
1,1
1,1
H
0,2
2,0
入侵者收益为攻入国家时还剩多少兵力，防守者的收益为入侵者损失多少兵力。
分析：如果入侵者走 eazy pass，你应防守 eazy pass（优于 hard pass）；
如果入侵者走 hard pass，你应防守 hard pass（优于 eazy pass）
Definition1：Player I’s strategy “s’i” ,is strictly dominated by player i’s strategy “si” ,if “Ui” from choosing “s-i”, is strictly bigger than UI(si) when other people choose “s’i”,forall”s-i”.（参与者 i 的策略 s’i,严格劣于参与者 i 的另一个策略 si,在其他参与者选择 s-i 时，此情况下选 s’i 的收益 UI(s’i),对所有的 s-i 均成立。）
2.并非人人都在投票，有人不投票也是一种策略 3.实际上有多位候选人，不只有两个 4.候选人未必能坚定他的立场，也就是说选民未必相信你的立场 5.其他（党内初选，多维度问题）『最佳对策』：Best response
2
l
r
1
u
5,1
0,2
m
1,3
4,1
d
4,2
2,3
选上是对手选左时的最佳对策选中是对手选右时的最佳对策上中下三个策略中对手选左或选右的可能性都为 1/2 Choosing upper:expacted payoff of U is (1/2,1/2)=1/2*5+1/2*0=2.5 Choosing middle: expacted payoff of M is (1/2,1/2)=1/2*1+1/2*4=2.5 Choosing down:expacted payoff of D is (1/2,1/2)=1/2*4+1/2*2=3 模型解法：画坐标图，假设选左概率为 X，选右概率为（1-X），解出各自区域的概率面积，联立方程， X=1/3.
表达：s’i 弱劣于其他策略 si，Ui(si,s-i) >=Ui(s’i,s-i)
第三节：迭代剔除和中位选民定理『迭代剔除』：例：政治模型案例假设有两个候选人，他们为了选举必须确定自己的政治立场，他们要从一系列政治主张中选择一个政治立场。一共有 10 个立场， 1，2，3，4，5，6，7，8，9，10 最靠近左边的（1）代表左翼分子的立场，最靠近右边的（10）代表右翼分子的立场，现假设每一个立场都会得到 10%的选票，选民们会投票给离他们最近的候选人，出现平局时选票会分摊，收益为：候选者希望尽可能最大化获得的选票。分析：1 为严格劣势策略，因为 2 优于 1，意味着选择立场 2 会比立场 1 获得更多选票，无论另一个候选人如何选择。
Ui(si,s-i)>=Ui(si’,s-i) for all si’ vssi 参与人 i 的策略 si,是一个最佳对策 BR，是对手的策略 s-i 的最佳对策，如果参与人 i 在对手的策略 s-i 下,选 si 的收益弱优于其他策略 si’，这对于参与人 i 的所有 si’都适用。 OR Si’ slove max Ui(si,s-i) (2) Player i’s strategy si is a best response(BR) to the strategy s-i of the players Eui(si,p)>=Eui(si’,s-i) for all si’ vssi 例：Eui(L,p)=p(l)*Ui(L,l)+p(r)*Ui(L,r) 合伙人博弈：有两个实体共同完成一个协作项目，这两家公司平分利润，即各自持有 50%股份，每个股东都要选择为公司投入多少精力，S=[0,4]（连续的），假设这个企业的利润是已知的，计算方式为：4*[s1+s2+b*s1*s2],0<=b<=1/4, 参与人 1 的收益 U1(s1,s2)=1/2*4*[s1+s2+b*s1*s2]-s1^2, 参与人 2 的收益 U2(s1,s2)=1/2*4*[s1+s2+b*s1*s2]-s2^2, 求参与人 1 的最佳策略。分析：Max(s1) 2(s1+s2+b*s1*s2)-s1^2 一阶求导：2*(1+b*s2)-2*s1=0 二阶求导：s1=1+b*s2 =BR1(s2) S1 是参与人 1 的最佳对策同理，s2=1+b*s1=BR2(s1) S2 是参与人 2 的最佳对策由 S1=S2 得 S1=S2=1/(1-B)

e商务文档

最新博弈论公开课1~5节笔记

相关文档推荐：