当前位置:
文档之家› 博弈论的几个经典模型PPT课件
博弈论的几个经典模型PPT课件
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
• 海萨尼转换的具体方法
一个虚拟的参与人“自然”,自然首先决定参
与人的类型,赋予各参与人的类型向量 t,其
中t (t1, t2 , , tn ) ; 自然告知参与者自己的类型,却不告诉其他参
与者的类型;
参与者同时选择行动,每一参与者i 从可行集 Ai中
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
• 什么是海萨尼转换? 海萨尼提出了一种处理不完全信息博弈的方 法,即引入一个虚拟的局中人——“自然”。 自然首先行动,它决定每个局中人的特征。 每个局中人知道自己的特征,但不知道别的 局中人特征。这种方法将不完全信息静态博 弈变成一个两阶段动态博弈,第一个阶段是 自然N的行动选择,第二阶段是除N外的局中 人的静态博弈。这种转换被称为“海萨尼转 换”,这个转换把“不完全信息”转变成为 完全但不完美信息,从而可以用分析完全信 息博弈的方法进行分析。
也就是说,在智猪博弈中,大猪没有占优策略, 而小猪有占优策略,它的最佳选择就是耐心 等待大猪去按钮,才能获得最佳结果。
“小猪躺着大猪跑”的现象是由于故事中的游 戏规则所导致的。规则的核心指标是:每次落 下的事物数量和踏板与投食口之间的距离。
博弈论的几个经典模型
模型一、智猪博弈/完全信息静态博弈
如果改变一下核心指标,猪圈里还会出现同样 的“小猪躺着大猪跑”的景象吗?试试看。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
通过海萨尼转换,博弈开始时,所有参 与人有关“自然”的行动有一致的信念,即 都知道所有参与人类型的概率分布函数,此 即“海萨尼公理”。
• 理性不一定道德。
博弈论的几个经典模型
模型一、智猪博弈/完全信息静态博弈
猪圈里有两只猪,一只比较大,一只比
较小。猪圈狭长,猪食槽在一头,猪食按钮
在另一头,按一下会有10个单位的猪食落进
槽里。由于按钮和食槽距离较远,按按钮的
体力耗费相当于2个单位的食物。若大猪先到
槽边,大小猪吃到食物的收益比是9:1;同
模型二、囚徒困境/非合作博弈
有两个小偷A和B联合犯事、私入民宅被 警察抓住。警方将两人分别置于不同的两个 房间内进行审讯,对每一个犯罪嫌疑人,警 方给出的政策是:如果一个犯罪嫌疑人坦白 了罪行,交出了赃物,于是证据确凿,两人 都被判有罪。如果另一个犯罪嫌疑人也作了 坦白,则两人各被判刑8年;如果另一个犯罪 嫌人没有坦白而是抵赖,则以妨碍公务罪(因 已有证据表明其有罪)再加刑2年,而坦白者 有功被减刑8年,立即释放。如果两人都抵赖, 则警方因证据不足不能判两人的偷窃罪,但 可以私入民宅的罪名将两人各判入狱1年。
博弈论的几个经典模型
引言
博弈:game,即是人们遵循一定规则下的活 动,参与人的目的是“赢”。进行game的人 是很认真的,不同于汉语中游戏的概念。 博弈论/对策论:game theory 奥林匹克运动会:Olympic Games。
博弈论的几个经典模型
基本术语
• 博弈论研究的对象:是理性人或参与者如何 选择策略或如何作出行动的决定。
博弈论的几个经典模型
模型二、囚徒困境/非合作博弈
乙 甲
坦白
抵赖
坦白
(-8,-8) (-10,0)
抵赖
(0,-10) (-1,-1)
不难看出,“坦白”是任一犯罪嫌疑人的占 优战略,而(坦白,坦白)是一个占优战略 均衡。
博弈论的几个经典模型
模型二、囚徒困境/非合作博弈
该博弈刻划了两大难题: • 冲突情形下,参与人的目标是什么?是采用(作
选择行动方案 ; 各方得到收益 Ai (a1, a2, , ai ,ti ) 。
借助于第一步和第二步中虚构的参与者“自 然”的行动,我们可以把一个不完全信息的 博弈表述为一个不完美信息的博弈。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
• 海萨尼转换分析 海萨尼转换是处理不完全信息博弈的标准方 法。一般地,“自然”在博弈开始的时候选择 参与人的类型,参与人的某个类型包括表征 类型的各个特征如策略空间、信息集、得益 函数等,这些又称为该类型参与人所拥有的 个人信息。 不完全信息意味着博弈各方中至少有一个参 与人有多个类型。
改变方案一:减量方案。 改变方案二:增量方案。 改变方案三:减量加移位方案。
投食仅原来的一半分量,但同时将投食口移到 踏板附近。结果呢,小猪和大猪都在拼命地 抢着踩踏板。等待者不得食,而多劳者多得。 每次的收获刚好消费完。 对于游戏设计者,这是一个最好的方案。 成本不高,但收获最大。
博弈论的几个经典模型
时到槽边,收益比是7:3;小猪先到槽边,
收益比是6:4。
小猪
按
ቤተ መጻሕፍቲ ባይዱ
不按(等待)
大猪
按
(5,1)
(4,4)
不按(等待)
博弈论的几个经典模型
(9,-1)
(0,0)
模型一、智猪博弈/完全信息静态博弈
选择等待是小猪的占优策略。
大猪的最佳选择取决于小猪的行动,如果小猪 去按,大猪最好选择等待;如果小猪不去按, 则最佳选择是大猪亲自去按。
博弈论的几个经典模型
博弈论的几个经典模型
引言
博弈论又被称为对策论(Game Theory), 及研究互动决策的理论。 互 动 决 策 : 即 各 行 动 方 ( 即 局 内 人 [player] ) 的决策是相互影响的,每个人在决策的时候 必须将他人的决策纳入自己的决策考虑之中, 当然也需要把别人对于自己的考虑也要纳入 考虑之中……在如此迭代考虑情形进行决策, 选择最有利于自己的战略(strategy)。
为个人)他自己的最好策略,还是采用(作为集 体的一员)他们共同的最好策略?前者导致均衡 策略(坦白,坦白),支付为(-8,-8);后者的最 好策略是(抵赖,抵赖),支付为(-1,-1)。这里 反映了个体理性行为与集体理性行为之间的矛 盾、冲突。 • 此博弈只进行一次还是重复进行?如果博弈只 进行一次,参与人似乎只有坦白才是最好的策 略,因为没有理由相信对手会对你有信心,他 总认为你自己会坦白;因此,双方都采取坦白 策略。然而,若博弈进行多次,则结论将会发 生变化。