当前位置:文档之家› 第_7_章_进化博弈论简介汇总

第_7_章_进化博弈论简介汇总


双人双策略对称博弈均衡的一般条件
• 若(S, S)是均衡,a,b,c,d之间的关系? • 若(S, T)是均衡,…? • 若(T, S)是均衡,…? • 若(T, T)是均衡,…?
经常会用到“期望”的概念
• 一个随机的行为,会有多种(以两种 为例)可能的结果(r1, r2),分别对应一 个概率(p1, p2),p1+p2=1
• 但我们可有一个平行的概念--“进化稳 定策略”的概念
(下面我们先学习这个概念,然后看它和纳什 均衡的关系)
进化稳定策略
• 一个策略称为是进化稳定的,若当整个种群都采 取这个策略时,任何采用不同策略的小规模 “入侵”群体经过多代遗传后最终会消亡。
• 形式化定义
– 一种生物体的适应性是指它与一个随机遇到的生物体互 动得到的收益期望
• 则这个行为的结果期望就是
p1r1 + p2r2
• 概率常常用“比率”和“占比”来近似 • 混合策略的收益:在纯策略集合上按概
率分布选择的收益期望
进化博弈论:谁有更强的适应性
博弈与进化博弈若干概念的一种对比理解
• 博弈,纯策略
– 确定性策略,直接对应的收益
• 博弈,混合策略
均衡
– 概率性策略,期望收益
• 进化博弈,纯策略
– 对于个体:确定性策略,直接收益
– 对于群体(策略):适应性-其中个体与其他个体随机相
遇的收益期望
• 进化博弈,混合策略
稳定性
– 对于个体:概率性策略,期望收益
– 对于群体(策略):适应性-其中个体与其他个体随机相 遇的收益期望进化Βιβλιοθήκη 弈的由来• 进化论的主要观点
– 生物体的遗传基因在很大程度上决定了它的 外部特征(行为方式等),因而决定了它是 否能够适应给定的环境。
• 每只甲虫有两个策略:大和小,由其基因决定。
小的 甲虫1
大的
甲虫2
小的
大的
5, 5
1, 8
8, 1
3, 3

甲的
虫1 大

甲虫2
小的
大的
5, 5
1, 8
8, 1
3, 3
与经典的博弈比较
• 每只甲虫的策略都是由遗传基因硬性决定的
– “策略选择”的概念在此是缺失的
• 因此以策略选择为基础的纳什均衡思想在 此没有直接的对应
生物适应性与新陈代谢
• 对于大甲虫,维持新陈代谢实际上要比 较困难些
– 需要吃较多的食物才能维持较大的体态要求 ;即同样数量的食物,小甲虫从中可获得较 多的收益(适应性)。
• 直观结论是:大体态变异基因使适应性 减弱,经过多次繁衍后,它极可能被 淘汰。
• 然而事实真的是这样吗?
互动与生物适应性
• 当两只甲虫为食物争夺时,可能的结果有:
生物适应性与种群变异
• 例子:体态大小的博弈
– 考虑一种甲虫种群 – 假设每只甲虫对给定环境的适应能力取决于
• 它是否可以发现食物 • 能否有效地从食物中汲取营养
– 假设一个特定的突变基因出现并开始蔓延, 造成携带该突变基因的甲虫体型变大。
– 因此,在该甲虫种群中,便分成两种不同的 群体——小甲虫和大甲虫。
进化博弈论简介
(对应教材第7章)
回顾上一讲(博弈论基础)
• 博弈
– 参与者(player) – 策略(strategy) – 收益,回报(payoff)
• 收益矩阵-形象地描述一个博弈的结构 • 在博弈论的分析中(决定采取什么策略)
– 不是要考虑如何战胜对方,而是基于对对方的行为的预测,自 己如何收益最大(尽可能大)。双方都如此态度。
– 当争夺食物的两只甲虫大小相同时,它们会 平分同样的食物
– 当一只大甲虫和一只小甲虫争夺食物,则大 甲虫会得到大多数的食物
– 对于同样的食物量,大甲虫在适应性上得到 的益处要少,因为所得到的食物中有一部分 要转化用来维持它们消耗较高的新陈代谢
收益矩阵
• 每只甲虫从争夺一定量食物的互动中获得的生 物适应性(不是食物量),可认为是双人博弈 中的收益。
– 适应性较强的生物体往往会繁衍较多的后代 ,于是使得适应性强的基因的物种在总体中 的数量增加。
– 一个物种的成功进化取决于它其中的个体和 其他个体(同种或者不同种)的互动。
进化博弈的由来
• 1960s,从博弈论视角来解释生物进化论
– 由基因决定的生物特征及行为可类比作博弈 中的策略;
– 将生物的适应性(的提高)类比为它的收益。
• 纯策略、混合策略(在可选纯策略集合上的一 个概率分布)
均衡(纳什均衡)
• 均衡:互为最佳应对
• 纳什均衡定理:在考虑混合策略条件下 ,任何有限参与人、有限纯策略的博弈 都存在均衡
• 一般来讲,找到均衡是很困难的,但在 某些限定条件下可能有系统化方法
– 例如,双人双(纯)策略
1. 检查四个策略组合是否为纯策略均衡
• J. M. Smith和G. R. Price,提出“进化稳定 均衡”,标志着进化博弈的诞生。
– John M. Smith. On Evolu)on. Edinburgh Unive Press, 1972
– J. M. Smith and G. R. Price, The Logic of Conflict, Nature, 246, 15-‐18, 1973.
– 称“策略T在x程度上(以x水平)入侵策略S”,指的是 在总体中有x占比的生物体采用策略T,1-‐x占比采用策 略S;其中x是一个小于1的小正数。
– 若存在一个小正数y,当任何其他策略T以任何x<y水平 入侵策略S时,采用策略S的个体的适应性严格高于采取 策略T的个体,则称策略S是进化稳定的(evoluVonarily stable)。
若(1)为空, 则(2)一定有;
2. 利用无差异原理试求混合策略均衡 若(1)不空,
(2)也可能有
囚徒困境(协调)博弈的特征模式
• 双人双策略 • 对称 • 均衡出现在双方采用某一种相同的策略 • “最佳收益”不是均衡,因为参与人之一有
动机改变策略
鹰鸽博弈的特征模式
• 双人双策略 • 对称 • 均衡出现在双方采用不同的策略
考察小体态是否进化稳定策略
小的 甲虫1 大的
甲虫2 小的 (1-x)
5, 5 8, 1
大的 x
1, 8 3, 3
• 考虑一个小正数x,总体中有x占比的个体使用 策略“大体态” ,有1-‐x占比的个体使用策 略“小体态”。(甲虫们随机相遇争夺食物)
– 一只小甲虫的期望收益是 5(1-‐x)+1x = 5-‐4x – 一只大甲虫的期望收益是 8(1-‐x)+3x = 8-‐5x
相关主题