当前位置：文档之家› 纳什均衡解及其QPSO算法求解_于敏(1)

纳什均衡解及其QPSO算法求解_于敏(1)

衡。这时逐一检验的方法也行不通，因为每个博弈方的混合策
略都是采用各纯策略的概率分布，概率分布是可以连续变化
基金项目：国家自然科学基金（ｔｈｅＮａｔｉｏｎａｌＮａｔｕｒａｌＳｃｉｅｎｃｅＦｏｕｎｄａｔｉｏｎｏｆＣｈｉｎａｕｎｄｅｒＧｒａｎｔＮｏ．６０４７４０３０）。作者简介：于敏（１９８０－），女，硕士研究生，主要研究方向为进化计算、进化博弈；须文波（１９４６－），男，教授，研究生博士生导师，主要研究方向为进
化计算、人工智能、生物信息学；孙俊（１９７４－），男，讲师，博士生，主要研究方向为进化计算、生物信息学。
Ｃ于ｏｍｐ敏ｕｔｅ，ｒ须Ｅ文ｎｇ波ｉｎｅ，ｅ孙ｒｉｎｇ俊ａｎ：ｄ纳Ａ什ｐｐ均ｌｉ衡ｃａｔ解ｉｏｎ及ｓ其计算ＱＰ机ＳＯ工算程法与求应解用
２００７，４３（１０）４９
的，所以可能的混合策略数必然是无限的，这时也必须有更有效的求纳什均衡的方法。于是用优化算法来解决纳什均衡问题就成为了理想中的想法。
Ａｂｓｔｒａｃｔ：Ｎａｓｈｅｑｕｉｌｉｂｒｉｕｍｉｓｏｎｅｋｉｎｄｏｆｇａｍｅｓｏｌｕｔｉｏｎｃｏｎｃｅｐｔ，ｍａｙｍａｋｅｔｈｅｓｔｒｉｃｔｍａｎｙｆｏｒｅｃａｓｔｓｔｏｅｘｔｒｅｍｅｌｙｗｉｄｅｓｐｒｅａｄｔｙｐｅｇａｍｅ．Ｑｕａｎｔｕｍ－ｂｅｈａｖｅｄｐａｒｔｉｃｌｅｓｗａｒｍｏｐｔｉｍｉｚａｔｉｏｎｉｓｉｎｔｒｏｄｕｃｅｄａｎｄｐｒｅｓｅｎｔｅｄｂａｓｅｄｏｎｔｈｅａｎａｌｙｓｉｓｏｆｐａｒｔｉｃｌｅｓｗａｒｍｏｐ－ｔｉｍｉｚａｔｉｏｎ．Ｉｎｔｈｉｓｐａｐｅｒ，ｔｈｅｎａｓｈｅｑｕｉｌｉｂｒｉｕｍｓｏｌｕｔｉｏｎｉｓｄｉｓｃｕｓｓｅｄａｎｄｇｉｖｅｎｂｙｕｓｉｎｇＱＰＳＯ．Ａｃｃｏｒｄｉｎｇｔｏｔｈｅｓｉｍｕｌａｔｉｏｎｔｅｓｔｉｎｇａｎｄｔｈｅｃｏｍｐａｒｉｓｉｏｎｗｉｔｈｓｅｖｅｒａｌａｌｇｏｒｉｔｈｍｉｓｖｅｒｉｆｉｅｄａｎｄｔｈｅｇｌｏｂａｌｃｏｎｖｅｒｇｅｎｃｅｐｒｏｐｅｒｔｙｏｆｔｈｅａｌｇｏｒｉｔｈｍｉｓｐｒｏｖｅｄ．Ｋｅｙｗｏｒｄｓ：ｑｕａｎｔｕｍ－ｂｅｈａｖｅｄｐａｒｔｉｃｌｅｓｗａｒｍｏｐｔｉｍｉｚａｔｉｏｎ；ｎａｓｈｅｑｕｉｌｉｂｒｉｕｍ；ｓｔｒｅｔｃｈｉｎｇｔｅｃｈｎｉｑｕｅ；ｒｅｐｕｌｓｉｏｎｔｅｃｈｎｉｑｕｅ；ｇａｍｅ
ｃ１，ｃ２：权重因子；ｒａｎｄ（）：随机函数，产生［０，１］的随机数；ｗ：惯
性权重函数。
ＰＳ０算法概念简单、容易实现、搜索速度快、搜索范围大，
和其他优化算法相比，它的优点突出。
２．２具有量子行为的粒子群化粒子群；（２）根据公式（３）计算ｍｂｅｓｔ的值；（３）求每个粒子适应度值，比较求ｐｉｄ；（４）对于每个粒子比较ｐｉｄ，求得ｐｇｄ；（５）更新ｐｇｄ；（６）对于粒子的每一维，根据公式（４），在ｐｉｄ和ｐｇｄ之间取得一个随机点；（７）根据公式（５）获得一个新的位置；（８）重复（２）－（７）直到条件不满足，迭代结束。
ｉ＝１
Ｐｉ＝（
１Ｍ
ｉ＝１
Ｐｉ１，
１Ｍ
ｉ＝１
Ｐｉ２， …，
１Ｍ
Ｐｉｄ）
ｉ＝１
（３）
ｐｉｄ＝"＊Ｐｉｄ＋（１－ "）＊Ｐｇｄ "＝ｒａｎｄ
（４）
ｘｉｄ＝ｐｉｄ±#＊｜ｍｂｅｓｔｄ－ｘｉｄ｜＊Ｉｎ（
１ｕ
）
ｕ＝ｒａｎｄ
（５）
这里的ｍｂｅｓｔ是粒子群的中间位置，ｐｉｄ为Ｐｉｄ和Ｐｇｄ之间的随机点。" 和 $ 都是［０，１］的随机数。% 为ＱＰＳＯ的收缩扩张系数。
随着博弈论和经济学应用范围地不断扩大，纳什均衡的影响也越来越大，用纳什均衡来分析和解决经济、政治、法律等各种领域的现象和内容，已成为引人注目的主要学术潮流。粒子群算法（ＰＳＯ）是由美国社会心理学家ＪａｍｅｓＫｅｎｎｅｄｙ和电气工程师ＲｕｓｓｅｌｌＥｂｅｒｈａｒｔ在１９９５年共同提出的，是继蚁群算法之后有一种新的群体智能算法，目前已成为进化算法的一个重要分支。其基本思想是受他们早期对鸟类群体行为研究结果的启发，并利用了生物学家ＦｒａｎｋＨｅｐｐｎｅｒ的生物群体模型。
ｋ
第ｋ次迭代粒子ｉ飞行速度矢量的第ｄ维分量；ｘｉｄ：第ｋ次迭
代粒子ｉ位置矢量的第ｄ维分量；ｐｉｄ：粒子ｉ个体最好位置
ｐｂｅｓｔ的第ｄ维分量；ｐｇｄ：群体最好位置ｇｂｅｓｔ的第ｄ维分量；
４８２００７，４３（１０）
ＣｏｍｐｕｔｅｒＥｎｇｉｎｅｅｒｉｎｇａｎｄＡｐｐｌｉｃａｔｉｏｎｓ计算机工程与应用
纳什均衡解及其ＱＰＳＯ算法求解
于敏，须文波，孙俊ＹＵＭｉｎ，ＸＵＷｅｎ－ｂｏ，ＳＵＮＪｕｎ
江南大学信息学院，江苏无锡２１４１２２ＳｃｈｏｏｌｏｆＩｎｆｏｒｍａｔｉｏｎＴｅｃｈｎｏｌｏｇｙ，ＳｏｕｔｈｅｒｎＹａｎｇｔｚｅＵｎｉｖｅｒｓｉｔｙ，Ｗｕｘｉ，Ｊｉａｎｇｓｕ２１４１２２，Ｃｈｉｎａ
个没有重量和体积的微粒，并在搜索空间中以一定的速度飞
行。该飞行速度由个体的飞行经验和群体的飞行经验进行动态
调整。粒子ｉ在Ｎ维空间里的位置表示为矢量ｘｉ＝（ｘ１，ｘ２， … ，ｘＮ），飞行速度表示为矢量ｖｉ＝（ｖ１，ｖ２， …，ｖＮ）。每个粒子都有一个由目标函数决定的适应值（ｆｉｔｎｅｓｓｖａｌｕｅ），并且知道自己到目
由于ＦｒａｎｓＶａｎｄｅｎｂｅｒｇｈ已经证明了ＰＳＯ算法既不能
收敛于全局最优解，甚至局部最优解。许多学者尝试用众多方
法来改进算法的收敛性能。２００４年Ｓｕｎ等在研究了Ｃｌｅｒｃ等人
关于粒子收敛行为的研究成果后，从量子力学的角度提出了一
种新的ＰＳＯ算法模型［１１］。这种模型是以ＤＥＬＴＡ势阱为基础，认
＊
ｉ，ｓｉ是（至少不劣于）针对其他ｎ－１个参与者所选战略｛ｓ１， … ，
＊
＊
＊
＊
＊
ｓｉ－１，ｓｉ＋１， … ，ｓｎ｝的最优反应战略，则称战略组合｛ｓ１， … ，ｓｎ｝是该
博弈的一个纳什均衡。即
＊
＊
＊＊
＊
Ｕｉ｛ｓ１， …，ｓｉ－１，ｓｉ，ｓｉ＋１， …，ｓｎ｝≥Ｕｉ
＊
＊＊＊
＊
｛ｓ１， …，ｓｉ－１，ｓｉ，ｓｉ＋１， …，ｓｎ｝对所有Ｓｉ中的ｓｉ都成立。
１．２纳什均衡的解法
纳什均衡的定义本身并没有说明如何找博弈中的纳什均
衡的问题，不管是纯策略纳什均衡还是混合策略纳什均衡。根
据纳什均衡的定义，最多只能检验某个策略组合是否是纳什均
由于ＦｒａｎｓＶａｎｄｅｎｂｅｒｇｈ已经证明了ＰＳＯ算法既不能收敛与全局最优解，甚至于局部最优解，许多学者许多方法以改进算法的收敛性能。２００４年Ｓｕｎ等在研究了Ｃｌｅｒｃ等人关于粒子收敛行为的研究成果后，从量子力学的角度提出了一种新的ＰＳＯ算法模型．这种模型是以ＤＥＬＴＡ势阱为基础，认为粒子具有量子行为，并根据这种模型提出了量子粒子群算法（Ｑｕａｎｔｕｍ－ｂｅｈａｖｅｄＰａｒｔｉｃｌｅＳｗａｒｍＯｐｔｉｍｉｚａｔｉｏｎ），其实验结果证明ＱＰＳＯ收敛性能有了很大地改进。
１纳什均衡
１．１纳什均衡的定义
纳什均衡（ＮａｓｈＥｑｕｉｌｉｂｒｉｕｍ）是博弈解的一般名称，是当
前博弈理论体系的核心概念。在ｎ个参与者标准式博弈Ｇ＝｛Ｓ１，
＊
＊
…，Ｓｎ；ｕ１， …，ｕｎ｝中，如果战略组合｛ｓ１， …，ｓｎ｝满足对每一参与者
为粒子具有量子行为，并根据这种模型提出了量子粒子群算法
（Ｑｕａｎｔｕｍ－ｂｅｈａｖｅｄＰａｒｔｉｃｌｅＳｗａｒｍＯｐｔｉｍｉｚａｔｉｏｎ），其实验结果
证明ＱＰＳＯ收敛性能有了很大地改进。
算法原理：在具有量子行为的粒子群算法（ＱＰＳＯ）中，粒子
的主迭代公式是：
Ｍ
Ｍ
Ｍ
Ｍ
" " " " ｍｂｅｓｔ＝１Ｍ
衡。当一个博弈中的博弈方数量很少，而且每个博弈方只有很
有限的策略时，博弈中全部可能的纯策略组合数量也比较少，
这时可以根据纳什均衡的定义，对所有纯策略组合进行逐一检
验。找出其中的纯策略纳什均衡。但很多博弈有多个博弈方，或
者各个博弈方有多种甚至有无限多种可选策略。这些博弈中可
ＹＵＭｉｎ，ＸＵＷｅｎ－ｂｏ，ＳＵＮＪｕｎ．Ｎａｓｈｅｑｕｉｌｉｂｒｉａａｎｄｑｕａｎｔｕｍ－ｂｅｈａｖｅｄｐａｒｔｉｃｌｅｓｗａｒｍｏｐｔｉｍｉｚａｔｉｏｎ．ＣｏｍｐｕｔｅｒＥｎｇｉｎｅｅｒｉｎｇａｎｄＡｐｐｌｉｃａｔｉｏｎｓ，２００７，４３（１０）：４８－５１．

e商务文档

纳什均衡解及其QPSO算法求解_于敏(1)

相关文档推荐：