零和博弈概述
若John的期望支付相等?
p-(1-p) = -p+(1-p)→ p*=0.5 若p<0.5 John翻黑牌→预期Candy翻红牌 若p>0.5 John翻红牌→预期Candy翻黑牌
第二节 零和博弈的研究方法
二、扩展的最小最大方法 (二)John的思想与行动 2.John的行动 p=0.5,1-p=0.5,避免被Candy利用
得益矩阵
第一节 基本概念
一、二人零和博弈 1.案例 小鸭 石头 剪刀 布 石头 0,0 1,-1 -1,1 蟹 剪刀 -1,1 0,0 1,-1 1,-1 -1,1 0,0 布
第一节
基本概念
一、二人零和博弈 2.定义 博弈的两个参与人在每局博弈中的得 失之和总是为零 参与人的利益冲突,对抗程度高
第二节 零和博弈的研究方法
一、最小最大方法 (二)甲(行参与人)的思想与行动 2.甲的行动:追求自身利益最大 从每行min值中寻找max值→ 从最小中寻找最大,maximin→ 结果:选“中”行, maximin=3
第二节 零和博弈的研究方法
一、最小最大方法 乙猜: 若选“左” :甲选“中”行,max=6 (三)乙(列参与人)的思想与行动 若选“中” :甲选“下”行,max=5 1.乙的思想 若选“右” :甲选“中”行,max=3 对手甲(行参与人)的选择使乙获得 最小支付——挖墙脚,利益对抗 潜台词:使甲获得最大支付
用最小最大方法寻找纳什均衡
甲的支付单矩阵 乙 不可行! 原因: 石头 剪刀 Maximin≠minimax 其他方法? 0 1 石头 -1 0 甲 剪刀 1 -1 布
布
-1 1 0
第二节 零和博弈的研究方法
二、扩展的最小最大方法 (一)案例:翻牌游戏——John的支付单 矩阵 p-混合:John以p的概率 翻红牌,以(1-p)的概 Candy 率翻黑牌 红牌 黑牌 红牌 p John 1 -1 黑牌(1-p) -1 1 p-混合 p-(1-p) -p+(1-p)
第二节 零和博弈的研究方法
一、最小最大方法 (三)乙(列参与人)的思想与行动 2.乙的行动:追求自身利益最大 从每列max值中寻找min值(甲的min 值,对乙有利)→ 从最大中寻找最小,minimax→ 结果:“右”列, minimax =3
第二节 零和博弈的研究方法
一、最小最大方法 (四)纳什均衡 Maximin=minimax=3 Maximin值与minimax值形成的策略 组合:(中,右)
第二节 零和博弈的研究方法
一、最小最大方法 (一)案例:抽象博弈——甲的支付 单矩阵 乙 左 中 右 5 3 2 上 6 4 3 甲 中 1 5 0 下
第二节 零和博弈的研究方法
一、最小最大方法 甲猜: 若选“上” :乙则选“右”列, (二)甲(行参与人)的思想与行动 min=2 1.甲的思想 若选“中” :乙则选“右”列, min=3 若选“下” :乙则选“右”列, 对手乙(列参与人)的选择使甲获得 min=0 最小支付——挖墙脚,利益对抗
零 猜硬币者 反面
特征:每局双 方得失之和等 于零;无纯策 略纳什均衡
抛硬币者 正面 反面
1,-1
-1,1
-1,1
1,-1
齐威王田忌赛马
齐 威 王
上中下 上中下 上中下 上中下 上中下 上中下
上 中 下 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1
我活
你死
第一节
基本概念
一、二人零和博弈 3.引申:二人常和博弈 (1)案例:兄妹分遗产 兄 篡改遗嘱 不篡改 篡改遗嘱 50,50 100,0 妹 0,100 30,70 不篡改
第一节
基本概念
一、二人零和博弈 3.引申:二人常和博弈 (2)定义 博弈的两个参与人在每局博弈中的得 失之和为某一个常数
第一节
基本概念
四、零和博弈的表示方法:单矩阵 1.猜硬币者的支付单矩阵 抛硬币者 正面 反面 正面 1 -1 猜硬币者 -1 1 反面
第一节
基本概念
四、零和博弈的表示方法:单矩阵 2.抛硬币者的支付单矩阵 抛硬币者 正面 反面 正面 -1 1 猜硬币者 1 -1 反面
第二节 零和博弈的研究方法
二、扩展的最小最大方法 (二)John的思想与行动 1.John的思想:Candy总是选择使John获 取最小支付的策略 (1)“红”行: Candy选“黑”列, min=-1 (2)“黑”行: Candy选“红”列, min=-1 (3)p-混合行:Candy选“黑”列与选 “红”列使John的期望支付相等
( x1 x2 xn ) nX n
X X 0
第一节
基本概念
二、零和博弈与常和博弈的转换 2.常和博弈转换为零和博弈 G→G’ G’:G的归零博弈
第一节
基本概念
三、概念对应 1.零和博弈 对应常和博弈,高利益对抗程度 2.非零和博弈 对应变和博弈,参与人之间存在共 同利益
上 中 下 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1
田 上 中 下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
忌
上 中 下 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
上 中 下 -1,1 1,-1 1,-1 1,-1 3,-3 1,-1
上 中 下 1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
50,50 100,0
0,100
30,70
第一节
基本概念
二、零和博弈与常和博弈的转换 1.偏零因子 G——n人常和博弈 X——每局的支付总和,常数 X=x1+x1+…+xn X/n——常和博弈的支付的偏零因子
第一节
基本概念
二、零和博弈与常和博弈的转换 2.常和博弈转换为零和博弈
X X X ( x1 ) ( x2 ) ( xn ) n n n