当前位置:文档之家› 正则化FDA的核化及与SVM的比较研究

正则化FDA的核化及与SVM的比较研究

第27卷第3期 2010年3月 计算机应用研究 Application Research of Computers Vo1.27 No.3 Mar.2010 

正则化FDA的核化及与SVM的比较研究球 于春梅,潘泉,程咏梅,张洪才 (西北工业大学自动化学院,西安710072) 

摘要:无论是Fisher判别分析(FDA)还是基于核的FDA(KFDA),在小样本情况下都会面临矩阵的病态问题, 正则化技术是解决该问题的有效途径。为了便于研究正则化FDA与支持向量机(SVM)的关系,推导了一种正 则化FDA的核化算法。将约束优化问题转换为对偶的优化问题,得到了与SVM相似的形式,分析了该核化算法 与SVM的联系。针对Tenessee—Eastman(TE)过程的故障诊断结果表明,正则化KFDA的诊断效果明显好于LS— SVM。 关键词:正则化;Fisher判别分析;核方法;凸优化;支持向量机 中图分类号:TP18 文献标志码:A 文章编号:1001—3695(2010)03—0897—02 doi:10.3969/j.issn.1001-3695.2010.03.024 

Kernel form of regularized FDA and comparison study with SVM YU Chun—mei,PAN Quan,CHENG Yong—mei,ZHANG Hong—cai (College ofAutomation,Northwestern Polytechnical University,Xi’an 710072,China) 

Abstract:Whereas small sample size(3S)problem will be arose in both FDA and KFDA.Regularized FDA iS an effective SOlution for this problem.To study the comparison of regularized FDA and support vector machine(SVM),this paper derived a novel kernel form of regularized FDA.which transfered optimization problem with constraint to optimization problem in dual space.0btained the kernel forill which similar to SVM and gave the links with SVM.Simulation results for Tenessee—Eastman (TE)process show that regularized KFDA get better diagnosis effects than least squares SVM(LS.SVM). Key words:regularization:Fisher discriminant analysis:kernel methods:convex optimization;SVM 

0 引言 FDA是一种常用的线性分类算法,它通过寻找从原始空 间到新空间的线性变换,使得变换后的数据类内离散度最小、 类间离散度最大,是一种在故障诊断、模式分类领域广泛应用 的降维技术。虽然FDA具有概念简单、易于实现的优点,但其 无法提取数据中的非线性关系。Mika等人 首先提出将核函 数引入FDA,其基本思想是首先将数据从原始输入空间非线 性地映射到某一个高维的特征空间中,在高维特征空间中设计 

一个线性算法,并用满足Mercer条件的核函数来代替内积运 算,从而推导出一个与样本数有关、与样本维数无关的优化问 题,这称为线性问题的核化算法。只有推导出核化算法,才能 将其应用于实际程序。正是基于这个原因,许建华等人 给 出了经典线性算法的核形式。也有不少文献将核化算法应用 于模式识别领域,取得了较好的效果 。但FDA和KFDA在 离散度矩阵奇异(小样本)时难以应用,尤其是KFDA,其小样 本问题更为突出。对于多数工业过程来说,获取各种工况的数 据样本通常是比较困难的,而且要耗费大量人力和财力。因此 如何在数据量有限或者小样本下取得较为满意的结果,这是值 

得研究的课题。 正则化技术是为了专门处理该问题而提出来的数学方法, 其作用是控制算法的泛化能力、提高数值计算的稳定性、改善 迭代算法的收敛性。O’Sullivanl4 的综述中给出了不少正则化 技术成功应用的例子。对于正则化Fisher判别式的核化,典型 的方法是转换为广义特征值问题的求解 ,但这种方法不方 便研究其与SVM的关系。本文提出了一种将约束优化问题转 换为对偶优化问题的方法,便于研究其与支持向量机的关系。 已经有不少学者对KFDA与其他核方法的关系进行了研 究,Gestel等人 将KFD和LS—SVM统一在Bayesian框架下; Xu Jian—hua等人 推导了KFD、LS—SVM及KRR三者的关系; 孙平等人 得出了核典型相关分析与KFD几乎是完全等价的 结论。这些文献都是从不同核方法的解的形式而得出的结论。 本文则从优化问题本身理论上得出KFDA与SVM的关系,还 以TE过程 故障0、故障1、故障2数据为例,给出正则化KF— DA与SVM的故障诊断结果比较。 

1 Fisher判别式的正则化 考虑两类分类问题,样本X={ ,x2,…, }。类1的样 收稿日期:2009—07—13;修回日期:2009—08.12 基金项目:国家自然科学基金资助项目(60634030,60702066);高校博士点专项基金资 助项目(20060699032) 作者简介:于春梅(1970.),女,江苏如皋人,副教授,硕士,主要研究方向为系统辨识、故障诊断、模式识别等(y ̄cm@sohu.com);潘泉 (1961一),男,上海人,教授,博导,主要研究方向为动态系统建模、信息融合、多目标跟踪等;程咏梅(1960一),女,陕西西安人,教授,博士,主要研究 方向为信息融合、复杂环境下机动运动目标建模、数据关联、主动及被动式跟踪;张洪才(1938一),男,上海人,教授,博导,主要研究方向为非线性估 计与控制、系统辨识、故障诊断与容错控制、目标跟踪、模式识别等. ・898・ 计算机应用研究 第27卷 本数量为 个,表示为{ , ,…,硝};类2的样本数量为z: 个,表示为{ ,《,…,砭};输出Y=[Y。,Y ,…,Y ] ; , , ∈R ,Y ∈{±1},i=1,2,-一,fl, =1,2,…,f2,k=1,2,…,f, z +12:f。为了衡量类内、类间数据的分离程度,定义类问离 散度矩阵为 =(ml—m2)(mI一 ) (1) 类内离散度矩阵为 

s : 2 ,(xl—m-)( 一m )T/l + 言(《一m2)( 一m2) l1 

(2) 其中:m 、m2分别为两类数据的均值向量,m- 1 ,m2= 

古 。 FDA的任务是寻找从原始空间到新空间的线性变换W, 使得 SbW尽量大,同时 W最小,即FDA最大化Fisher 准则函数(广义Rayleigh商)。 

)=寒 (3) 

对高维数据,类内离散度矩阵 可能是病态的(如果z< 则为奇异),这样数据的微小变化会导致 和解W大的变 化,即其对噪声非常敏感导致差的泛化能力。 针对该问题的一个有效解决方案是对 增加一个对角 阵的方法,即对Fisher判别式进行正则化处理 ],问题重新描 述为 w S^W ,( ) ‘ ) 

考虑到FDA不能提取数据的非线性特征,其对应的核化 算法应运而生。对于该问题,一般采用先将FDA核化,再正则 化的策略。本文推导一种新的正则化FDA的核化算法。 

2正则化FDA的凸优化解法 根据优化理论,正则化Fisher判别式还可等价地由下式来 描述: rainjCw): ts ”W s.t.wTSbW=D (5) 考虑最大间隔分类器的约束条件 s.t.Y (( , )一6)≥1,i=1,2,…,1 (6) 将上式分开写成等价的两个式子 (W, )一b≥1,i=1,2,…,zl (W, )一6≥1,i=1,2,…,l2 (7) 整理得 wT(m1一tn2)I>2 (8) 即 wTSbw≥4 (9) 若将式(5)的约束条件用上式代替,其解即最优超平面的 方向不变(不考虑偏置项b),而且因为不等式约束解满足KKT 条件,因而具有稀疏性。优化问题重新描述为 

min.,( )=— 1 ( ,)W (1o) s.t.Y ((W, )一6)≥1,i=1,2,…,l 下面仿照支持向量机的方法求解上述优化问题的核化算 

法。设 = ,, =s w, = ,则有 ÷ ( + 0w=÷( w) (-。 1/2w)= 一W(11) 

和 <W,x/)=(s W, )=(W, ) (12) 式(10)的优化问题重新写成 

rain,( )=÷ W s.t.Y ((W, )一b)≥1,i=1,2,…, 上式可转换为对偶优化问题 

m axL(ct)= 一寺 otjy ygx;, ) ( 。) 

s...t 三 O/ =0, />0 这样,根据Schislkopf等人的理论 ,可将上式的点积运算 用核函数代替,从而得到正则化FDA的核化算法,分类函数的 形式可用线性分类器或者Bayes分类器。 式(1O)的实质是对分类间隔和类内离散度矩阵指标的 折中,这与Xiong Tao等人 叫提出的混合LDA/SVM方法等 价; 的大小决定了正则作用的强弱,也即对结构风险控制的 程度, 越大,算法的泛化能力越强。硬间隔SVM与式(13) 在类内离散度矩阵为单位阵且取 =0时等价;或者也可以 将算法看成经验风险为类内离散度矩阵的SVM,两者的折中 由正则项调节。 

3仿真比较 以TE过程故障0、故障1、故障2数据为例,采用核Bayes 分类函数直接进行三类故障的诊断…J,在正则参数取0.叭时 的最优核参数C、降维矩阵维数a及相应的误分率如表1所示。 最优参数同样采用网格法选取,其中核参数从5O变化到 2 000,间隔50;降维矩阵维数从2变化到l7,间隔3。特征的 选择另外详细描述,选择的结果是变量44、47和1。表1中误 分率代表漏报、误警及错分之和的百分比,SS代表样本数量。 表1 正则化KFDA的最优参数及误分率( =O.叭) 

作为核方法的最早应用,近十多年来,SVM得到了飞速的 发展,尤其被公认为对解决小样本问题特别有效。为了比较 KFDA与SVM的诊断效果,表2中列出了LS—SVM在不同样本 下的最优参数及误分率。这里的程序采用陆振波博士公开的 IJS—SVM代码” 。最优参数同样采用网格法选取,经多次仿 真,选择核参数在0.5—50变化,间隔0.5;折中参数在0.01~ 0.2变化,间隔0.O1。特征的选择与KFDA相同,二类到多类 的编码采用最小误分率方案。 表2 SVM的最优参数及误分率 

相关主题