基于模糊聚类和支持向量机的损伤识别方法Ξ冉志红1,李 乔2(1.云南大学城市建设与管理学院,云南昆明650091;2.西南交通大学土木工程学院,四川成都610031)摘要:将结构分区域进行分步损伤识别是目前解决复杂结构损伤识别问题的有效途径,对结构进行适当的区域划分后,就可以先找出损伤发生的可能区域,然后减小搜索范围,进行损伤的定位和损伤程度的识别。
用频率和坐标模态保证准则这两种基本的动力指标,采用模糊聚类的方法划分出相似区域,然后用统计模式识别中的支持向量机进行分类。
通过数值算例表明,损伤识别三步法能够在存在观测噪声的条件下对结构损伤进行定位。
关键词:桥梁工程;损伤识别;模糊聚类;支持向量机中图分类号:U448127文献标识码:A文章编号:100424523(2007)0620618205引 言随着交通流量的迅速增大,现有桥梁在超负荷交通流量情况下产生老化和损坏,使其成为交通的瓶颈[1]。
因此,对在役桥梁的评估、养护和维修,对旧桥、危桥进行加固后重新使用已成为当前摆在交通和工程结构工作者面前的迫切问题。
而结构损伤识别是进行结构可靠性评价的基础性工作,因此,损伤识别成为目前国内外研究的热点问题。
损伤识别领域有两大研究方向:一是通过反演的方法,即建立系统与输入、输出的映射关系,按果索因,这类方法的优点是概念清晰,物理意义明确,但实际求解过程中的强非线性、非适定性导致其求解异常困难;另一个研究方向是模式识别[2],其基本思想是建立每一种损伤情况下结构响应的变化,然后按实际测量结果进行模式匹配,找出最接近的那一组模式从而确定结构的损伤情况。
由于土木工程结构的损伤模式比机械结构繁杂得多,因此模式识别方法一开始没有受到足够的重视。
而近年来在模式识别方面又有了新的认识,一方面人们针对具体结构进行危险性分析,将损伤的可能模式进行大量的缩减;另一方是面对模式识别方法本身的深入研究,认为模式识别不仅具有高抗噪能力、强非线性能力、处理数据不完备的能力等诸多优点,而且可以进行自组织、自适应、无反馈式的学习,促使模式识别方法在损伤识别中的应用迅速发展起来。
对于大型复杂结构,直接识别结构的损伤非常困难,许多学者采用多步法进行损伤识别[3,4]。
本文针对连续梁桥结构,提出用模糊聚类进行损伤区域的划分,用支持向量机进行分类的损伤识别三步法。
传统多步法的损伤区域划分都是针对结构的具体形式,按受力特点、空间关系、构件形式等对区域进行划分,这种分区方式带有设计者的主观意志,往往使识别结果的可靠性不高。
本文采用模糊聚类计算各模式的“相近”程度,从而有依据地进行区域的划分,可以大大提高损伤识别的精度。
近年来,人们将支持向量机用于结构的损伤识别,取得了较好的效果[5,6]。
但已有的研究都是直接用支持向量机对结构进行损伤识别,本文利用支持向量机良好的分类性能,对损伤区域和损伤单元进行分步识别。
本文用模式识别的方式研究连续梁桥损伤识别,以频率和坐标模态保证准则为特征向量,构建了基于模糊聚类和支持向量机的损伤识别三步法。
最后以一个三跨连续梁作为研究对象,数值计算表明,本文所提出的三步法损伤识别策略具有良好的抗噪性能。
1 特征向量的选取结构的损伤(主要是指刚度的退化)会引起结构模态参数的变化,比如频率的降低,振型的改变。
本文选取频率和坐标模态保证准则(COM A C)这两种指标作为损伤的输入变量。
频率可以直接测量得到,只是在输入时采用相对变化率[7,8]第20卷第6期2007年12月振 动 工 程 学 报Jou rnal of V ib rati on EngineeringV o l.20N o.6D ec.2007Ξ收稿日期:2006211215;修订日期:2007204227识别、手写体识别、机械故障诊断等得到了成功的应用。
支持向量机实质上是线性判别函数的进一步发展,它同时也是当前有限模式样本集得到的最优化方法。
首先考察两类问题,设(x i ,y i )(i =1,2,∂)为模式样本的数据对,其中x i ∈R (q ),y i ∈{-1,1}。
若(x i ,y i )为线性可分,则所有训练数据都可以在精度Ε下无误差地用如下线性回归函数拟合y =w x +b (8) 其中权重系数w ={w 1,w 2,…,w q };b 为常数。
引入松弛因子Νi ,Ν′i ,按风险最小化理论可建立如下优化问题m in 12‖w ‖2+C ∑∂i =1(Νi +Ν′i )(9a )s .t y i [w x i -b ]≥1(9b )Νi ,Ν′i ≥0(9c )式中 C 为惩罚因子,用于控制模型复杂度和逼近误差的折中。
通过式(9)的对偶形式可以求它的最优解,对偶形式可以根据目标函数和约束条件建立L a 2grange 函数为L =12‖w ‖2+C ∑∂i =1(Νi +Ν′i )-∑∂i =1Αi y i[w xi-b ]-1-∑∂i =1(Γi Νi+Γ′i Ν′i )(10)式中 Αi ,Γi 为待定系数,用L agrange 乘子法可以得到式(7)的表达式f (x )=sgn∑∂i =1Αiyi(x i x )+b(11)其中Αi 按下述优化问题求解m in12∑∂i =1∑∂i =1y iy j Αi Αj(x ixj)-∑∂j =1Αjs .t∑∂i =1y i Αi =0;0≤Αi ≤C(12) 选取Α的一个元素Αj ,则b 按下式计算b =y j -∑∂i =1y i Αi(xix j )(13) (xy )为作向量的内积,只要满足M ercer 条件,就可以定义一个内积的计算式K (x ,y )。
常用的内积形式有多项式形式、核函数形式、S 形函数等[12]。
上述是支持向量机处理两类问题的计算过程,对于多类问题,可以将其分成多个两类问题解决。
设有Σ个子区域,则首先将第一个子区域与剩余其它子区域并列,计算待识别模式是否在第一个子区域,如果不在,则依次进行搜索,直到找到具体的损伤区域为止。
笔者针对损伤识别问题编制了相应的基于M A TLAB 的SVM 工具箱。
4 损伤识别三步法策略多步法的基本思路一般是将损伤分为损伤位置和损伤程度,首先找出损伤的位置,然后缩小识别变量,进行损伤程度的识别。
本文将损伤位置再分为区域级和单元级,首先对相似单元利用模糊聚类进行分组,利用支持向量机识别损伤的区域,然后在可能的损伤区域内识别损伤的具体单元,最后就可以用内插的方法得到损伤的程度。
下面给出连续梁桥损伤识别三步法的具体步骤:(1)设模糊聚类后得到Σ个子区域8i (i =1,2,…,Σ),按公式(1),(2)计算出(m -1)p 个基本模式x i (i =1,2,…,(m -1)p ),反复利用SVM 按下列步骤进行待检模式x 0(指损伤结构频率和坐标模态保证准则的实际测量结果)的判别。
(a )第k =1步,设基本模式向量集为7={x i }(i =1,2,…,(m -1)p );(b )建立数据对(x i ,y i ),其中x i ∈7,当x i ∈8k 时,y i =1;x i |8k 时,y i =-1;(c )用SVM 判断x 0是否属于8k ,若x 0属于8k ,则转(2),若不属于8k ,则转下一步;(d )k ←k +1,转(b )。
(2)设第(1)步判断出x 0∈8Α(其中Α为判断出的损伤区域编号),在8Α范围同上述步骤一样逐个单元进行搜索,得到x 0对应的损伤单元E Β(其中Β为判断出的损伤单元号)。
(3)针对E Β的p 个损伤模式x Βi ,定义D is i =1∑m +nj =1[(xΒi)j -(x 0)j ]2(i =1,2,…,p )。
则损伤程度可按∑p i =1(D am i ×D is i ) ∑pi =1D is i 进行估计,其中D am i 为第E Β单元第i 种损伤模式的损伤程度。
5 数值算例本文以某连续梁桥进行数值仿真计算,该桥为40+40+40m 三跨连续梁桥。
其结构参数为E I =21302×1011N ・m 2,A =81216m 2,Θ=217×103kg ・m-3。
单元长度均取为4m ,单元编号从左至右1~30,节点编号从左至右1~31。
假设总共测量得到前10阶模态。
26振 动 工 程 学 报第20卷首先计算出基本模式(每个单元的损伤程度取5%,10%,15%,…,50%),用模糊聚类的方法(取Κ=016~017)将30个单元划分为7个区域(见表1)。
表1 模糊聚类后的区域划分区域编号单元号13,6,8,23,25,2821,2,14,17,29,3034,7,24,27410,11,20,2155,9,22,26613,15,16,18712,19本文采用核函数型内积进行计算:K (x ,y )=exp (-‖x -y ‖2Ρ2) 利用支持向量机进行损伤识别首先需要确定四个参数:惩罚因子C ;松弛因子Νi ,Ν′i ;内积方差Ρ。
通过试算,发现C 和Ρ的值对识别结果影响较大,本文最终选取C =18,Νi ,Ν′i =0105,Ρ=0114。
按前述三步法进行损伤识别,其检验样本取每个单元的损伤程度为715%,1215%,1715%,…,5215%。
对于没有噪声的情况下,300个待检模式都能够被识别出其所在的区域,对于损伤的单元定位,仅有4个模式误判,误判率为113%。
图1是几个单元各种不同损伤程度的识别结果,从图中可以看出,本文所提出的损伤程度估算公式在没有噪声的情况下具有较好的计算结果。
图1 损伤识别结果表2是不分区、直接硬分区(按每一跨进行分区)、模糊聚类分区三种分区域方法的损伤定位的误判率。
从表中可以看出,模糊聚类分区好于硬分区,硬分区又好于不分区,从而证实了多步法在损伤识别中的优越性。
本文所提出的模糊聚类分区法主要是能够将特征上相似的单元组合在一起,以供第二步在小的区域内进行识别时再进行区分,从而提高了识别的精度。
表2 不同分区方法的比较分区方法区域误判率 %单元误判率 %模糊聚类分区0113硬分区2517不分区—1116下面来研究本文所提出的三步识别法的抗噪性能。
在测量数据上添加高斯白噪声,每个待检模式抽样产生100个样本,共30000个待检模式。
图2是各个损伤区域的误判率,图3,4是各个单元的误判率,从图中可以看出,第一个损伤区域的误判率较大,支座附近的单元受噪声干扰较大。
除支座附近几个少数的单元外,其余的误判率都低于表2中的另外两种分区方法没有噪声时的误判率,说明本文方法具有较强的抵抗噪声的能力。
值得一提的是,在噪声水平大于5%的条件下,损伤程度的估算结果不可靠。
因此需要更好的损伤程度估算方法(如B P 人工神经网络方法)。