当前位置:文档之家› 纳什均衡解及其QPSO算法求解_于敏(1)

纳什均衡解及其QPSO算法求解_于敏(1)


衡。这时逐一检验的方法也行不通, 因为每个博弈方的混合策
略都是采用各纯策略的概率分布, 概率分布是可以连续变化
基金项目: 国家自然科学基金( the National Natural Science Foundation of China under Grant No.60474030) 。 作者简介: 于敏( 1980- ) , 女, 硕士研究生, 主要研究方向为进化计算、进化博弈; 须文波( 1946- ) , 男, 教授, 研究生博士生导师 , 主 要 研 究 方 向 为 进
化计算、人工智能、生物信息学; 孙俊( 1974- ) , 男, 讲师, 博士生, 主要研究方向为进化计算、生物信息学。
C于omp敏ute,r须E文ng波ine, e孙ring俊an:d纳A什pp均li衡cat解ion及s 其计算QP机SO工算程法与求应解用
2007, 43( 10) 49
的, 所以可能的混合策略数必然是无限的, 这时也必须有更有 效 的 求 纳 什 均 衡 的 方 法 。于 是 用 优 化 算 法 来 解 决 纳 什 均 衡 问 题 就成为了理想中的想法。
Abstr act: Nash equilibrium is one kind of game solution concept, may make the strict many forecasts to extremely widespread type game.Quantum- behaved particle swarm optimization is introduced and presented based on the analysis of particle swarm op- timization.In this paper, the nash equilibrium solution is discussed and given by using QPSO.According to the simulation testing and the comparision with several algorithm is verified and the global convergence property of the algorithm is proved. Key wor ds: quantum- behaved particle swarm optimization; nash equilibrium; stretching technique; repulsion technique; game
c1, c2: 权 重 因 子 ; rand( ) : 随 机 函 数 , 产 生[0, 1]的 随 机 数 ; w: 惯
性权重函数。
PS0 算 法 概 念 简 单 、容 易 实 现 、搜 索 速 度 快 、搜 索 范 围 大 ,
和其他优化算法相比, 它的优点突出。
2.2 具有量子行为的粒子群化粒子群; ( 2) 根据公式( 3) 计算 mbest 的值; ( 3) 求每个粒子适应度值, 比较求 pid; ( 4) 对于每个粒子比较 pid, 求得 pgd; ( 5) 更新 pgd; ( 6) 对 于 粒 子 的 每 一 维 , 根 据 公 式 ( 4) , 在 pid 和 pgd 之 间 取 得一个随机点; ( 7) 根据公式( 5) 获得一个新的位置; ( 8) 重复( 2) - ( 7) 直到条件不满足, 迭代结束。
i=1
Pi=(
1 M
i=1
Pi1,
1 M
i=1
Pi2, …,
1 M
Pid)
i=1
( 3)
pid="*Pid+( 1- ") *Pgd "=rand
( 4)
xid=pid±#*|mbestd- xid|*In(
1 u

u=rand
( 5)
这里的 mbest 是粒子群的中间位置 , pid 为 Pid 和 Pgd 之间的 随机点。" 和 $ 都是[0, 1]的随机数。% 为 QPSO 的收缩扩张系数。
随着博弈论和经济学应用范围地不断扩大, 纳什均衡的影 响也越来越大, 用纳什均衡来分析和解决经济、政治、法律等各 种领域的现象和内容, 已成为引人注目的主要学术潮流。粒子 群算法( PSO) 是由美国社会心理学家 James Kennedy 和电气工 程师 Russell Eberhart 在 1995 年共同提出的, 是继蚁 群 算 法 之 后有一种新的群体智能算法, 目前已成为进化算法的一个重要 分 支 。其 基 本 思 想 是 受 他 们 早 期 对 鸟 类 群 体 行 为 研 究 结 果 的 启 发, 并利用了生物学家 Frank Heppner 的生物群体模型。

第 k 次迭代粒子 i 飞行速度矢量的第 d 维分量; xid : 第 k 次 迭
代 粒 子 i 位 置 矢 量 的 第 d 维 分 量 ; pid: 粒 子 i 个 体 最 好 位 置
pbest 的 第 d 维 分 量 ; pgd: 群 体 最 好 位 置 gbest 的 第 d 维 分 量 ;
48 2007, 43( 10)
Computer Engineering and Applications 计算机工程与应用
纳什均衡解及其 QPSO 算法求解
于 敏, 须文波, 孙 俊 YU Min, XU Wen- bo, SUN Jun
江南大学 信息学院, 江苏 无锡 214122 School of Information Technology, Southern Yangtze University, Wuxi, Jiangsu 214122, China
个没有重量和体积的微粒, 并在搜索空间中以一定的速度飞
行 。该 飞 行 速 度 由 个 体 的 飞 行 经 验 和 群 体 的 飞 行 经 验 进 行 动 态
调整。粒子 i 在 N 维空间里的位置表 示 为 矢 量 xi=( x1, x2, … , xN) , 飞行速度表示为矢量 vi=( v1, v2, …, vN) 。每个粒子都有一个 由 目 标 函 数 决 定 的 适 应 值 ( fitness value) , 并 且 知 道 自 己 到 目
由 于 Frans Van den bergh 已 经 证 明 了 PSO 算 法 既 不 能
收敛于全局最优解, 甚至局部最优解。许多学者尝试用众多方
法来改进算法的收敛性能。2004 年 Sun 等在研究了 Clerc 等人
关于粒子收敛行为的研究成果后, 从量子力学的角度提出了一
种新的 PSO 算法模型[11]。这种模型是以 DELTA 势阱为基础, 认

i, si 是 ( 至 少 不 劣 于 ) 针 对 其 他 n- 1 个 参 与 者 所 选 战 略{s1 , … ,





si- 1 , si+1 , … , sn }的 最 优 反 应 战 略 , 则 称 战 略 组 合{s1 , … , sn }是 该
博弈的一个纳什均衡。即


**

Ui{s1 , …, si- 1 , si , si+1 , …, sn }≥Ui

* **

{s1 , …, si- 1 , si , si+1 , …, sn }对所有 Si 中的 si 都成立。
1.2 纳什均衡的解法
纳什均衡的定义本身并没有说明如何找博弈中的纳什均
衡的问题, 不管是纯策略纳什均衡还是混合策略纳什均衡。根
据纳什均衡的定义, 最多只能检验某个策略组合是否是纳什均
由 于 Frans Van den bergh 已 经 证 明 了 PSO 算 法 既 不 能 收敛与全局最优解, 甚至于局部最优解, 许多学者许多方法以 改进算法的收敛性能。2004 年 Sun 等在研究了 Clerc 等人关于 粒子收敛行为的研究成果后, 从量子力学的角度提出了一种新 的 PSO 算法模型.这种模型是以 DELTA 势阱为基础, 认为粒子 具有量子行为, 并根据这种模型提出了量子粒子群算法 ( Quantum- behaved Particle Swarm Optimization) , 其实验结果 证明 QPSO 收敛性能有了很大地改进。
1 纳什均衡
1.1 纳什均衡的定义
纳 什 均 衡 ( Nash Equilibrium) 是 博 弈 解 的 一 般 名 称 , 是 当
前博弈理论体系的核心概念。在 n 个参与者标准式博弈 G={S1,


…, Sn; u1, …, un}中, 如果战略组合{s1 , …, sn }满足对每一参与者
为粒子具有量子行为, 并根据这种模型提出了量子粒子群算法
( Quantum- behaved Particle Swarm Optimization) , 其实验结果
证明 QPSO 收敛性能有了很大地改进。
算法原理: 在具有量子行为的粒子群算法( QPSO) 中, 粒子
的主迭代公式是:




" " " " mbest= 1 M
衡。当一个博弈中的博弈方数量很少, 而且每个博弈方只有很
有限的策略时, 博弈中全部可能的纯策略组合数量也比较少,
这时可以根据纳什均衡的定义, 对所有纯策略组合进行逐一检
验。找出其中的纯策略纳什均衡。但很多博弈有多个博弈方, 或
者 各 个 博 弈 方 有 多 种 甚 至 有 无 限 多 种 可 选 策 略 。这 些 博 弈 中 可
YU Min, XU Wen- bo, SUN J un.Nash equilibr ia and quantum- behaved par ticle swar m optimization.Computer Engineer ing and Applications, 2007, 43( 10) : 48- 51.
相关主题