投影寻踪方法在边坡稳定性评价中的应用Applicationofprojectionpursuitmethodtoassessmentofslopestability
汪明武,金菊良(合肥工业大学土木建筑工程学院,安徽合肥 230009)
摘 要:探讨了基于实码加速遗传算法的边坡稳定性投影寻踪评价模型,并给出了相应算法和流程,实例表明应用投影寻踪方法来评价边坡稳定性是有效可行的,且取得了理想的结果。关键词:投影寻踪;遗传算法;边坡稳定性;神经网络;综合评价中图分类号:TU457 文献标识码:A 文章编号:1000-4548(2002)05-0619-03作者简介:汪明武(1972-),男,安徽歙县人。2000年于南京大学获博士学位,副教授,现主要从事城市环境岩土工程、工程物探和计算机应用的教学和科研工作。WANGMing-wu,JINJu-liang(SchoolofCivilEngineering,HefeiUniversityofTechnology,Hefei230009,China)Abstract:Themodelofassessmentofslopestabilityusingprojectionpursuit(PP)methodfoundedonrealcodingbasedacceleratinggeneticalgo-rithm(RAGA)isinvestigatedinthispaper.Thealgorithmandtheflowchartarealsoproposed.ThepracticalexamplehasshownthatthePPmethodisfeasibleandeffectivetoassesstheslopestability.Keywords:projectionpursuit;geneticalgorithm;slopestability;neuralnetwork;comprehensiveevaluation
1 引 言X人类活动对地质环境的影响,常诱发各种地质灾害,其中边坡失稳是最主要的一种灾害类型,边坡问题已成为全球性三大地质灾害源(边坡、地震和火山)之一。边坡失稳不仅产生重大经济损失,且多涉及生命财产,故边坡稳定性评价是边坡工程的重要核心内容之一,具有重要的社会和经济意义。边坡是由漫长的地质作用造成的,地质环境的复杂性和影响边坡稳定性因素(如斜坡的外形、岩性、构造、水、地震和人为因素等)的不确定性,使边坡稳定性问题表现为多因素、多层次和多阶段的复杂动态非线性系统,故边坡稳定性评价是一项复杂的综合评价过程。人们尝试应用模糊综合评价、灰色聚类分析等数学方法进行综合评价,但是这些方法都忽略了评价指标的作用有些是相互依赖或相互关联的。用传统的统计学方法、力学计算法、可靠性分析方法等不能深刻揭示边坡灾害演化的非线性行为,因此传统力学计算方法难以精确解决问题。基于概率理论的可靠性分析方法的实质仍是用泰勒级数展开并忽略高阶项,以得到简单的解析关系[1~4]。基于人工神经网络的评价方法则受知识获取/瓶颈0问题限制,对于边坡工程这样复杂的巨系统,其知识获取将更是一件不容易的事,所以应用神经网络评价边坡稳定性有一定的适用范围和局限性[5,6]。传统的多元分析方法是建立在总体服从某种分布(如正态分布)假定基础上,是采用/假定)模拟)检
验0的证实性数据分析法(confirmatorydataanalysis,简称CDA),但实际边坡问题中有许多数据并不满足正态分布,需要用稳健的或非参数的方法去解决。传统的CDA方法对于高维非正态、非线性数据分析很难收到好的效果。20世纪70年代后期,国际统计界发展了一类处理和分析高维数据的新兴统计方法)))投影寻踪(projec-tionpursuit,简称PP)方法,它采用/审视数据)模拟)预测0探索性数据分析(exploratorydataanalysis,简称EDA)的新途径,适宜于非线性、非正态分布数据的处理,并能避免/维数祸根0,在许多领域获得了应用[7~12]。影响与控制边坡稳定因素的数据大多具有高维和非线性特征,基于EDA的PP技术适宜分析和处理这类问题。本文将基于遗传算法的PP方法应用于边坡稳定性的评价预测,并将预测结果与神经网络方法预测结果相比较。
2 投影寻踪基本原理投影寻踪的基本思想是利用计算机技术,把高维数据通过某种组合,投影到低维(1~3维)子空间上,并通过极小化某个投影指标,寻找出能反映原高维数据结构或特征的投影,在低维空间上对数据结构进行分析,以达到研究和分析高维数据的目的[7~12]。
X基金项目:安徽省自然科学基金资助项目(01045409;01045102);安徽省优秀青年科技基金资助项目;合肥工业大学博士专项基金资助项目 收稿日期:2002-01-07
第24卷 第5期岩 土 工 程 学 报Vol.24 No.5
2002年 9月ChineseJournalofGeotechnicalEngineeringSept., 2002 投影寻踪方法能在一定程度上解决多指标样本评价等非线性问题,但当研究对象过于复杂时,多元数据具有复杂的拓扑结构,很难找到最优投影方向,故PP方法成功应用的关键在于投影指标函数的优化,为了增强方法的实际应用能力,避免复杂计算和编程,本文应用基于实数编码加速遗传算法(realcodingbasedacceler-atinggeneticalgorithm,简称RAGA)来优化投影方向。3 基于实码加速遗传算法的边坡稳定性投影寻踪综合评价模型基于实码加速遗传算法的边坡稳定性投影寻踪综合评价主要步骤如下:¹数据输入及归一化处理;º构造边坡稳定性投影指标函数;»基于实码加速遗传算法优化投影方向;¼计算基于最佳投影方向的评价样本投影值及综合评价(见图1)。可见该模型的关键在于边坡稳定性评价的投影指标函数构造和投影方向的优化。图1 基于RAGA的边坡稳定性投影寻踪综合评价流程图Fig.1 FlowchartshowingthePPmethodbasedonRAGAforassessmentofslopestability边坡稳定性PP评价方法就是把n个具有p维的评价样本X(XiIXp)综合成投影方向A的一维投影值Z来综合分析样本的稳定性,为确保局部投影点尽量密集和整体上投影点团尽可能散开的目标,边坡稳定性综合评价的投影指标函数Q(A)可构造如下: Q(A)=S(A)D(A)(1) S(A)=Eni=1z(i)-E(A)n-10.5(2) D(A)=Eni=1Enj=1(R-rij)I(R-rij)(3) z(i)=Epj=1A(j)x(i,j)(4)式中 S(A),D(A)分别为A投影方向的投影值z(i)的数据散布特征和低维数据点的局部密度;E(A)为A投影方向投影值的均值;R为估计局部密度的宽度指标,由数据特征确定;I为单位阶跃函数,当R\rij时,I取值1,否则为0;rij为距离,rij=&z(i)-z(j)&;x(i,j)为第i个样本第j个评价指标的归一化处理后数值。不同投影方向反映不同数据结构特征。笔者利用遗传算法来寻找最大可能反映边坡稳定性特征的最佳投影方向。RAGA是一种通用的全局优化方法,基于RAGA优化投影方向的基本思想是:在单位超球面中随机抽取若干个初始投影方向,计算其投影指标,按选大原则,进行多次遗传算法操作,最后确定最大指标对应的解为最优投影方向[13,14]。当确定了目标函数及优化参数的值域后,就可以实施遗传算法的优化策略。基于实数编码的加速遗传算法优化投影方向的算法步骤如下:¹在p维空间中按照种群规模随机选取m组[0~1]区间的随机数bi(i=1,2,,,p)作为优化编码,每一组编码对应一个投影方向;º令单位长度向量Ai=-1+2bi(i=1,,,p),计算投影指标Q(A);»按有利于投影指标增大的原则,通过选配、杂交和变异操作,取得3组共3m个解,从中选出m个投影指标大的编码后,回到第º步,开始下一个优选循环;¼根据高维数据结构的复杂性决定初始投影方向的个数以及寻优的循环次数,也可根据主观目的用试错法确定优化次数。
4 应用实例应用上述评价模型对文献[2]中典型崩滑体进行分析,样本集共12个,评价指标选用了高差(1)、坡角(2)、洪水位与滑坡剪出口高程关系(3)、滑体面积(4)、滑体透水性(5)、暴雨强度(6)、变形破坏迹象(7)、物质结构(8)、活动面产状变化情况(9)、滑带强度(10)、剪出口产状(11)、人类活动情况(12)、岩石层位组成(13)、岩层倾角(14)等14个评价指标,见表1。将样本集代入式(1)~(4)计算出投影指标函数后,用RAGA优化投影方向,得优化后的最大投影指标函数值为1.241,最佳投影方向A=0.336,0.535,0.193,0.389,0.153,0.291,0.716,0.338,0.502,0.667,0.733,0.666,0.144和0.215。把最佳投影方向代入式(4)即可求得样本投影值,结果见表1和图2。
图2 边坡稳定性评价样本的投影值散布图Fig.2 ResultsofslopestabilitybasedonthePPmethod
620岩 土 工 程 学 报 2002年 表1 样本评价指标值及投影值Table1 ValuesofindexofPP
序号名称评价指标1234567891011121314投影值1黄腊石Ñ0.320.790.830.821.000.760.900.901.001.000.501.000.880.102.5702新滩1.000.900.130.470.871.001.000.800.770.801.000.700.800.102.5833天宝0.170.861.000.740.801.000.770.700.830.801.001.000.300.802.5624宝塔0.520.750.630.140.861.000.830.600.470.651.000.700.350.551.9495云阳西城0.330.870.690.441.000.801.000.900.530.850.630.700.360.492.1796黄腊石Ò0.240.860.200.920.770.700.630.100.931.000.500.700.880.101.9347流来观0.480.900.720.590.670.200.700.500.571.000.850.600.880.101.9708白衣庵0.380.800.660.450.600.300.900.700.450.250.650.300.700.901.4439向家湾1.000.800.960.410.470.300.430.300.870.500.800.300.500.201.45110百换坪0.440.450.690.100.400.300.570.200.500.800.400.300.870.500.87811范家坪0.480.560.660.140.470.200.570.200.570.700.280.300.300.700.83612旧县坪0.330.490.670.270.570.800.430.100.470.400.200.200.270.300.445 从表1和图2可知,样本按投影值(崩滑体的不稳定水平)从大到小依次为序号2(新滩)、1(黄腊石Ñ)、3(天宝)、5(云阳西城)、7(流来观)、4(宝塔)、6(黄腊石Ò)、9(向家湾)、8(白衣庵)、10(白换坪)、11(范家坪)、12(旧县坪)。从实例可看出,投影值大于2.5者为稳态A级,2.0~2.5之间者为稳态B级,1.5~2.0之间者为稳态C级,1.0~1.5之间者为稳态D级,小于1.0者为稳态E级。则样本1、2、3可评为稳态A级,样本5可评为稳态B级,样本4、6、7可评为稳态C级,样本8、9可评为稳态D级,A、B、C、D级可归类为不稳定状态,样本10、11、12可评为稳定状态E级。评价结果与神经网络方法结果基本吻合,稳态分级标准及神经网络预报结果详见见文献[2]。可见所建模型是可行的,且所建模型评价结果是用一维变量来反映多维变量包含的信息和能直接显示稳定状态程度,比神经网络更具适用性。另外,最佳投影方向A值也表明评价指标11,7,10,12,2,9,4,8,1,6,14,5,13和3对评价结果的影响程度依次降低。5 结 语探讨了引入实码加速遗传算法来优化一维投影方向的投影寻踪新方法,并建立了基于投影寻踪新算法的边坡稳定性评价模型,通过实例应用表明投影寻踪方法应用于边坡稳定性这样数据有限、没有原型、复杂而且具有不确定性问题的综合分析和评价是可行的,克服了常规投影寻踪方法计算量大、编程难的缺点,比常规投影寻踪方法更简单和实用。从拟合和预测精度以及参数个数三个方面看,比神经网络评价模型具有一定的优势,避免了估计模型参数的样本个数因变量的增加而明显不足的困难,能较充分地挖掘实测样本信息,并可根据研究系统的复杂性灵活调整模型的结构,实现精度较高的预测。参考文献:[1]罗国煜,陈新民,等.城市环境岩土工程[M].南京:南京大学出版社,2000.[2]崔政权,李 宁.边坡工程)))理论与实践最新发展[M].北京:中国水利水电出版社,1999.[3]孙玉科,等.边坡岩体稳定性分析[M].北京:科学出版社,1988.[4]祝玉学.边坡可靠性分析[M].北京:冶金工业出版社,1993.[5]陈新民,罗国煜.基于经验的边坡稳定性灰色系统分析与评价[J].岩土工程学报,1999,21(5):638-641.[6]夏元友,李新平,朱瑞赓.基于神经网络的边坡稳定性工程地质评价方法[J].岩土力学,1996,17(3):27-33.[7]FiredmanJH,TurkeyJW.Aprojectionpursuitalgorithmforexploratorydataanalysis[J].IEEETransonComputer,1974,23(9):881-890.[8]李祚泳.投影寻踪技术及其应用进展[J].自然杂志,1997,19(4):224-227.[9]成 平,李国英.投影寻踪)))一类新兴的统计方法[J].应用概率统计,1986,2(3):8-12.[10]郑祖国.投影寻踪自回归模型及其在新疆春旱期降水量长期预测中的应用[J].八一农学院学报,1993,16(2):1-7.[11]金菊良,魏一鸣,等.农业生产力综合评价的投影寻踪模型[J].农业系统科学与综合研究,2001,17(4):241-243.[12]李祚泳,邓新民,辛文清.旱涝趋势的投影寻踪预测模型[J].自然灾害学报,1997,6(4):68-73.[13]金菊良,丁 晶.遗传算法及其在水科学中的应用[M].成都:四川大学出版社,2000.[14]张欣莉,丁 晶,金菊良.基于遗传算法的参数投影寻踪回归及其在洪水预报中的应用[J].水利学报,2000,(6):45-48.