144 传感器与微系统(Transducer and Microsystem Technologies) 2011年第30卷第1O期
自动机制设计中一种改进的混沌蚁群算法
陈旭,蔚承建,吉 军,罗 杰
(南京工业大学电子与信息工程学院,江苏南京210009)
摘要:针对自动机制设计计算复杂度会随具体问题规模的增大而呈指数增长等问题,提出了一种改进 的混沌蚁群算法。在机制设计基础上,依据激励兼容和个人理性约束,分析了自动机制设计中的占优策略 机制模型和贝叶斯一纳什均衡机制模型,并将改进的算法用于实现这2种机制模型。结果表明:该算法在 公共货物配置问题上取得了较好的效果。 关键词:机制设计;混沌蚁群算法;占优策略;纳什均衡;货物配置 中图分类号:TP301.6 文献标识码:A 文章编号:1000-9787(2011)10-0144-04
▲ ‘ 1 ’ ・- ・ l -・’ ● An imDroven ChaotiC ant SWarm al ̄oritnm in
autOmatecI mec11anlSm desit ̄n - 』 1 ’ ● l ●
CHEN Xu,WEI Cheng-jian,JI Jun,LUO Jie (SchooI of Electronics and Information Engineering,Nanjing University of Technology,Nanjing 210009,China)
Abstract:Aiming at the problems of computational complexity’S exponential growth with the size’s increment of the specific problems in automated mechanism design,an improved chaotic ant SWal3Tl algorithm is presented. Based on mechanism design,according to constraints of incentive compatibility and individual rationality,models are analyzed for the dominant strategy mechanism and Bayesian—Nash equilibrium mechanism in automated mechanism design,and both of the mechanism models aye achieved using the improved algorithm.It is demonstrated that the improved algorithm has achieved good effect on public goods distribution problems. Key words:mechanism design;chaotic ant swarm algorithm;dominant strategy;Nash equilibrium;goods distil— bll on
0引 言 机制设计属于博弈论和微观经济学的一个分支领域, 它研究的是在多个代理为了自身利益而不报告真实信息的
情况下,设计出一种规则对各代理的偏好进行整合,以求达
到某种最优的结果。机制设计有时也被叫做博弈论的反问
题。博弈论是指某个个体或者组织在某种确定规则的前提 下,根据所掌握的信息进行策略选择并加以实施,从而各自
取得相应结果或收益的过程;机制设计则是根据某种结果
去设计规则。然而,机制设计却是一个复杂的问题…,因
为代理可能为了自己的利益报告不真实的信息。对于确定
性的机制,机制设计问题也是一个NP完全问题,例如:在
占优策略下的机制实施和贝叶斯一纳什实施。
20世纪7O年代,美国经济学家Hurwicz L提出了机制 设计理论 J,他把机制定义为一种信息交换系统,参与者
在这种体制中相互发送信息或发送到信息中心。这种理论
收稿日期:2011 1—11 基金项目:南京市留学基金资助项目(ZBW302001) 框架最初用于解决服务和公共货物的分配等问题。Hur—
wicz L在研究初期主要是集中在机制设计过程的计算成本
和信息等方面,没有考虑激励问题。Marshak和Radner
后来提出的团队理论在一定程度上补充了这方面的不足。
随着网络技术的快速发展,机制设计的理论得到了很大的 发展,同时其应用也更加广泛。以色列耶路撒冷希伯来大
学的Nisan N和Ronen A基于机制设计的理论首先提出了
算法机制设计的基本框架技术和一系列关于近似机制问题
的定理 ,并把这种算法机制应用于算法问题、负载平衡, 特别是最短路径问题。斯坦福大学的Samuel I 等针对以
f 没有考虑信息不确定的情况,提出了基于算法和博弈论
方法的随机机制设计,对这种机制的实施给出了正式的证
明。进一步美国杜克大学的Giuseppe L等人讨论了带有奈
特不确定性的机制设计问题 ,研究了机制设计中激励兼
容的2个方面(最大激励兼容和最优激励兼容),得出在一 第1O期 陈旭,等:自动机制设计中一种改进的混沌蚁群算法 145
般的公平信任条件下,最优激励兼容和事后激励兼容等价。
传统的机制设计是通过手工完成的,机制设计者根据
经验假设某个具体问题存在一个满意的规则,然后试图证
明这种机制的存在性。但手工设计机制通常都较为繁琐,
也加重了设计者的负担。Conitzer和Sandholm T提出了自
动机制设计 (automated mechanism design,AMD)的方法,
利用这种方法计算机自动地为具体的问题实例产生机制,
并且应用范围不局限于以往手工机制设计可以完成的问题
类型。此外,对于代理个数一定的情况下,文献[6]把机制
设计问题转化为线性规划加以解决。但是,线性规划的复
杂度是随代理个数的增加而呈指数的增长,不利于求解较
大规模的机制设计问题。根据混沌蚁群算法 能够处理较
为困难和较大规模的优化问题及具有较好的全局搜索能力
的特性,本文在其基础上改进了混沌蚁群算法,并将其应用
于公共货物配置问题,取得了较好的效果。
1自动机制设计
1.1 自动机制设计的一般形式 针对传统的手工机制设计,Conitzer和Sandholm T提出
了自动机制设计,为某种特定的场景和目的而自动设计出
机制 ,其基本内容包括以下几个部分:1)一个关于结果的
有限集合0,0={O -.,O }。2)针对具体的问题而设计机
制的代理数集合A。3)对于每一个代理。,又包含3个方
面:a.代理类型的有限集合 ,T={t 一,t };b.对每一个
,a A,存在一个概率分布 。(类型相互关联时,对于
TI X X…X ,存在一个联合分布 );c.代理的效用值
函数U。: XO— 。4)一个机制设计者期望能最大化的目
标函数z。
1.2机制类型及其计算问题 自动机制设计是针对具体的问题设计机制,而不是针
对一类问题,本文根据公共货物配置问题进行一些形式的
调整。假设问题类型是独立分布,则参与者类型的概率分
布定义为:P: {0,1},其中,∑P(t)=1,设计者的目标
函数定义为z: XO—R,参与者的均衡效用函数为 :T X
D一尺;其中,m为参与者数, ,k≤m。在自动机制设计
过程中,有2种可能性:贝叶斯一纳什激励兼容(Bayes Nash
incentive compatibility,BNIC)和占优策略激励兼容(domi—
nant strategy incentive compatibility,DSIC)。在BNIC情况 下,每个参与者报告他的真实类型以最大化其期望收益,而
在DSIC情况下,报告真实信息可以达到占优策略均衡。有
关定义如下 J:
定义1:一个机制 属于贝叶斯一纳什激励兼容,如果
对于每个0∈A,且t。∈T,有不等式E…[∑‰(t。,0)] M(t …o)]≥E…[∑ (f。,o) ( ,f…0)]Yt 。∈T
成立;一个机制 属于占优策略激励兼容,如果对于每个
。∈A,£ ∈ ,有不等式∑Ita( 。,。)M(t ,£一。,0)≥
∑ ( ,o) ( 。,f一。,0)V 。∈ ,£一。∈ 成立。此外,
设计者在进行机制设计时,除了需要考虑激励兼容约束,还 需考虑个人理性(individual rationality,IR),个人理性可以
分为先验个人理性(CX interim individual rationality,EIIR)和
事后个人理性(ex post individual rationality,EPIR)。基于前
者,参与者可以在联合类型分布情形下获得其期望收益,而
后者可以保证实现任何参与者的机制类型。 定义2:一个机制 带有先验个人理性(EIIR),如果对
于每个n∈A且t。∈ ,有不等式E…[∑Ua( 。,。)M(t。,
t一。,0)]t>0成立。一个机制 带有事后个人理性(EPIR), 如果对于每个a E A,t。∈T,且t一。∈ ~,有不等式
∑ (f ) ( 一t ,o)≥0成立。
1.3 自动机制设计的2种数学模型 由以上的定义,依据BNIC和EIIR进行的机制设计命
名为贝叶斯一纳什机制设计(Bayes Nash mechanism design, BNMD),运用DSIC和EPIR的机制设计命名为占优策略机 制设计(dominant strategy mechanism design,DSMD)。 贝叶斯一纳什机制设计数学模型如下
(f,0 c,0)P(c)j ( )
s.t.IR:∑∑u(t ) ( …。)P( 一 )≥0,V。∈
A,t。∈T,
Ic:∑∑“(£。,。)[ (£ …。)一M(t …o)] 0E【 t一Ⅱ P(t一 )≥O,Va∈A,t。∈T,t ∈T,
∑M(t,o)=l Vt;M(t,o)i>0 Vt∈ ,0∈O.
其中,最后一个约束条件保证了产生的机制是基于类
型向量的一种结果集的有效分布。占优策略机制设计的数
学模型为
z(f,o) (f,0)P(t), (2)
s.I.t IR:∑“( 。,o) (f ,t…0)≥0VaeA,t一。∈
,t ∈T,
Ic:∑“(£ ,。)[M(£。,t…。)一M(t’ ,t…。)]>10,
Va∈A,t一。∈Tm一 ,t ,t 。∈T,
∑M(t,。)=1 Yt∈ ,M(t,。)≥V ∈ ,。∈0.
由上面的模型可知是带有许多约束的线性规划,如果
参与者的数目一定,可以求解。但是如果规模很大,
线性规