第40卷第5期四川大学学报(工程科学版)V o l.40N o.5 2008年9月J O U R N A LO FS I C H U A NU N I V E R S I T Y(E N G I N E E R I N GS C I E N C EE D I T I O N)S e p t.2008文章编号:1009-3087(2008)05-0022-05水资源评价的投影寻踪动态聚类模型王顺久(中国气象局成都高原气象研究所,四川成都610072)摘 要:以投影寻踪理论为基础,利用动态聚类方法构建投影指标,建立了水资源评价的投影寻踪动态聚类模型。
该模型是投影寻踪与动态聚类的有机结合,完全依据数据样本特征进行水资源评价,整个过程毋需人为给定参数,客观性强,操作简便。
实例分析表明,利用投影寻踪动态聚类模型进行水资源评价有效、可行,是水资源评价的一种新方法。
关键词:水资源评价;指标体系;投影寻踪;动态聚类;投影指标中图分类号:T V213文献标识码:AA p p l i c a t i o n o f P r o j e c t i o n P u r s u i t D y n a m i c C l u s t e r M o d e l i nWa t e r R e s o u r c e s A s s e s s m e n tW A N GS h u n-j i u(I n s t i t u t eo f P l a t e a u M e t e o r o l o g y,C h i n a M e t e o r o l o g i c a l A d m i n i s t r a t i o n,C h e n g d u610071,C h i n a)A b s t r a c t:Ap r o j e c t i o n p u r s u i t d y n a m i c c l u s t e r m o d e l i s d e v e l o p e d,a n d i t i s u s e d i n w a t e r r e s o u r c e s a s s e s s m e n t f o r t h e f i r s t t i m e.T h e p r o j e c t i o n p u r s u i t d y n a m i c c l u s t e r m o d e l c o m b i n e s p r o j e c t i o n p u r s u i t p r i n c i p l e w i t h d y n a m i c c l u s-t e r m e t h o d.F i r s t l y,m u l t i f a c t o r a s s e s s m e n t p r o b l e mc a n b e c o n v e r t e d i n t o s i n g l e-f a c t o r(p r o j e c t e d c h a r a c t e r i s t i c v a l-u e)a s s e s s m e n t p r o b l e m a c c o r d i n g t o l i n e a r p r o j e c t i o n.S e c o n d l y,a n e wp r o j e c t i o ni n d e x o nt h e b a s i s o f d y n a m i c c l u s t e r r u l e i s c o n s t r u c t e d,w h i c h a v o i d s t h e p r o b l e mo f p a r a m e t e r c a l i b r a t i o n i n t h e a s s e s s m e n t p r o c e s s s u c c e s s f u l-l y.I n p r o j e c t i o n p u r s u i t d y n a m i c c l u s t e r m o d e l,t h e a s s e s s m e n t r e s u l t s o b t a i n e d f r o m t h e c h a r a c t e r i s t i c s o f d a t a s e t a r e m o r e o b j e c t i v e a n d l e s s s u b j e c t i v e.F i n a l l y,a c a s e s t u d y o f w a t e r r e s o u r c e s a s s e s s m e n t i s c o n d u c t e d.Ac o m p a r i-s o n o f t h e w a t e r r e s o u r c e s a s s e s s m e n t f o r r i v e r b a s i n s a l o n g t h e c o a s t o f L i a o n i n g P r o v i n c e s h o w s t h a t t h er e s u l t s f r o m t h e p r o j e c t i o n p u r s u i t d y n a m i c c l u s t e r m o d e l a r e r e a s o n a b l e a n d e f f e c t i v e.T h e p r o j e c t i o n p u r s u i t d y n a m i c c l u s-t e r m o d e l i s a n e wm e t h o d f o r w a t e r r e s o u r c e s a s s e s s m e n t a n d a l s o a n e wa p p r o a c h t o m u l t i-f a c t o r a s s e s s m e n t.K e y w o r d s:w a t e r r e s o u r c e s a s s e s s m e n t;i n d i c a t o r s y s t e m;p r o j e c t i o n p u r s u i t;d y n a m i c c l u s t e r;p r o j e c t i o n i n d e x 水资源评价是多因素影响下的复杂非线性分收稿日期:2007-09-06基金项目:中国气象局成都高原气象研究所科研资助项目(B R O P200701,P M P2006005,L P M2005014);四川省气象局重点科研项目(2006-2);中国气象局气候变化专项基金(C C S F2007-23)作者简介:王顺久(1970-),男,副研究员.研究方向:水文水资源.类问题[1],解决这类问题的常用方法主要包括专家打分法、层次分析法、灰色关联分析、模糊评判、人工神经网络以及物元分析法等等[2]。
比如,田锡堂建立了水资源评价的灰色聚类模型[3],郑成德利用模糊综合评判法开展了流域水资源评价[4],杨建强等建立了水资源评价的自组织神经网络模型[2],王志良等将模糊聚类分析用于水资源评价研究中[5],陈守煜等在工程模糊集理论的基础上,提出了水资源DOI:10.15961/j.jsuese.2008.05.017评价的模糊聚类神经网络方法[1]。
然而,神经网络模型是有监督网络,它的训练需要相当数量的样本数据,而且易陷入局部极小点[1],同时网络结构也需要经验确定,模糊聚类法在刻划分类指标空间到类型空间的非线性映射关系上存在一定困难[6]。
另一方面,灰色关联分析、模糊评判以及物元分析等在水资源评价过程中都需根据经验确定评价指标权重,评价结果具有一定的人为任意性。
因此,有必要深入研究更能客观地进行水资源评价的新方法。
投影寻踪是将高维数据向低维空间投影,并通过分析低维空间的投影特性来研究高维数据的特征,它是处理多因素复杂问题的一种统计方法[7]。
依据投影寻踪思想建立的投影寻踪聚类模型已在多因素评价、聚类、优选等方面得到了广泛应用[8-17],充分体现了投影寻踪在高维数据分析中的优势。
然而,在投影寻踪聚类模型中的唯一参数———密度窗宽的取值还主要是依靠经验或试算来确定[7,15],缺乏理论依据,不便于实际推广应用。
针对上述问题,在投影寻踪理论的基础上引入动态聚类思想,依据动态聚类方法[18]构建新的投影指标,进而建立投影寻踪动态聚类模型[19]。
作者将投影寻踪动态聚类模型应用于多因素综合评价分析中,并以水资源评价为例详细阐述了应用该模型进行多因素综合评价的具体操作过程。
应用研究表明,投影寻踪动态聚类模型充分发挥了投影寻踪技术处理高维数据能力的优势,同时由于动态聚类思想的引入,在整过评价过程不存在参数的人为确定,因此评价结果客观明确且操作简便,为水资源评价提供了一种新方法。
1 投影寻踪动态聚类模型投影寻踪动态聚类模型的构建包括两部分内容,首先利用投影降维技术将高维数据投影到低维空间(1-3维),然后利用动态聚类方法对投影到低维空间的投影特征值进行聚类分析。
1.1 数据无量纲化为了消除量纲效应,建模前对各指标数据进行无量纲化处理,文中选用的无量纲化公式如下:对于正向指标,x i j=x0i j-x0j m i nx0j m a x-x0j m i n(1)对于负向指标,x i j=x0j m a x-x0i jx0j m a x-x0j m i n(2)其中,x0i j为第i(i=1,2,…,n)个样本第j(j=1,2,…,m)个指标的初始数值,x0j m a x和x0j m i n分别为第j个指标的样本最大值和最小值。
1.2 线性投影投影的实质就是从不同角度观察数据特性,以寻找能够最大程度地反映数据特征和最能充分挖掘数据信息的最佳观察角度即最优投影方向。
设a为m维单位投影方向向量,其分量为a1,a2,…,a m,则x i j的线性投影特征值可用式(3)描述,即:z i=∑mj=1a j x i j,i=1,…,n(3)1.3 投影指标投影指标是高维数据向低维空间投影所遵循的规则,也是寻找最优投影方向的依据。