第32卷第7期 振动与冲击 JOURNAL OF VⅡiRA11ON AND SHOCK
基于独立分量分析的欠定盲源分离方法
杨杰 ,俞文文 ,田吴 ,关珍贞
(1.军械工程学院,石家庄050003;2.华阴兵器试验中心,陕西华阴714200)
摘 要:针对欠定盲分离算法只能分离稀疏信号,对不稀疏信号分离效果不理想,而经典独立分量分析算法中扩 展I ̄omax算法能分离超高斯信号及亚高斯信号,却只能应用于观测数不少于源数的超定盲源分离等问题,结合扩展In— fomax算法,提出欠定ICA算法,通过生成隐藏数据将欠定盲分离问题转化为超定盲分离问题,应用经典的扩展Infomax 算法进行分析,并对实测齿轮箱混合故障信号进行分离,用包络阶次方法对分离出的信号进行分析,成功识别出齿轮箱不 同故障特征。验证该算法在齿轮箱故障诊断中的有效性。 关键词:独立分量分析;扩展Infomax;欠定盲源分离:故障诊断 中图分类号:TH165.3 文献标识码:A
Underdetermined blind source separation method based on independent component analysis
YANG Jie ,YU Wen—wen ,TIAN Hao ,GUAN Zhen-zhen
(1.Ordnance Engineering College,Shijiazhuang 050003,China;2.Huayin Ordnance Center,Huayin 714200,China)
Abstract:The underdetermined blind source separation(UBSS)algorithm at present can only separate sparse signals,but can’t separate non—sparse signals successfully.Classical ICA algorithms,such as,extended Infomax,can separate both super—Gaussian and sub-Gaussian signals,but it is used only in an over-determined BSS(OBSS).Combined with an extended Infomax,an underdetermined ICA algorithm was proposed here.By generating hidden data,an UBSS
problem was transformed into an OBSS one,and then an extended Informax algorithm was used to analyze the signals. This method could separate both super-Gaussian and sub—Gaussian signals in an UBSS problem.Through analyzing
transient signals of a gearbox by use of the underdetermined ICA combined with the order envelope spectral analysis,its
fault features were fully detected and the effectiveness of the proposed method was verified. Key words:independent component analysis(ICA);extended infomax;underdetermined BSS;fault diagnosis
齿轮箱发生故障时常出现多种故障并发情形,用
诊断单一故障的频谱诊断法、轴心轨迹法、小波诊断法
已不再有效,而盲源分离技术为较有效的机械复合故 障诊断方法。但已有研究基本针对超定盲分离而言,
即要求观测器个数多于或等于源信号个数。少于源信 号个数的欠定盲分离问题,已成为盲信号处理领域中
挑战性问题。 源数多于传感器数时,机械故障源分离主要考虑
稀疏源,利用源信号稀疏性估计混合矩阵;源稀疏性较 好时,通过聚类方法可达到较好的盲分离效果¨ 。
源信号稀疏性较差时,虽可利用稀疏性得到混合矩阵
估计,但通过聚类方法得不到较好的分离效果。
独立分量分析(ICA)是解决盲源分离问题(BSS)
基金项目:国家自然科学基金资助项目(50775219);军械工程学院院基 金项目(yjjxml0019) 收稿日期:2011—04—08修改稿收到日期:2012—04—18 第一作者杨杰女,博士生,1983年生 的主要算法,其可使输出信号各分量统计独立以实现 信号分离。已有多种不同算法 J,如扩展Infomax算
法。由于其既能分离超高斯信号,也能分离亚高斯信 号,因而得到广泛应用。但该算法只能用于超定盲分
离。本文提出的欠定ICA算法,通过生成隐藏数据将 欠定盲分离转化为超定盲分离问题,再用扩展Infomax
算法对信号进行分析。该方法可分离欠定情形下超高
斯与亚高斯混合信号。结合包络阶次方法对齿轮箱实 测瞬态信号进行分析,找到故障特征,验证该方法的有
效性。
1 基于独立分量分析的盲源分离算法
1.1独立分量分析问题描述 图1为 (t)由m个传感器获得m路观测信号,每
个观测信号由 个独立源信号 (t)(i=1,2,…, )的
线性混合,即: ( )=As(t) (1) 式中: (t)=[ 。(t), :(t),…,
(t)r为m个混合 第7期 杨杰等:基于独立分量分析的欠定盲源分离方法 31
信号,s(t)=[s (t),s (t),…,s (t)] 为n个未知源
信号,A=[a ,a ,…,a ]为未知的m×/-t维混叠矩
阵,ICA算法目的为从多路观测信号 中分离出隐含其 中的源信号s,即寻找分离矩阵w,有:
u=Wx (2) 式中: (t):[ ,(t), :(t),…, (t)]T为对隐含源
信号分量s的逼近。
一
}…………一一_1 、、 束知混合系统 / ~………
图1盲源分离原理图 Fig.1 The principle sketch of blind source separation
1.2扩展的Infomax算法
Infomax算法L4 处理过程为:经矩阵w解混后对所
得 的每个分量 分别用一个非线性函数g ( )进行
处理,得: r=g( )=[g1(“1),…,gⅣ(“Ⅳ)] ’=
,…,r ]T (3)
自适应处理目标函数可调节w使r的总熵量
(r, )极大,由信息理论知,日(r, )极大表示u的各
分量间互信息,(u 一,u )极小。传统Infomax算法中
分离矩阵w迭代式为:
W(n+1)=W(n)+ [,一 ( )M ]W(n) (4)
式中: 为时变调节步长。 ( )=【一 等,…,
一 】,理论上g (M )应取信源s 的概率密度函数,
( i)即p(Si)的累积概率分布,而 (“i)=一 。
源信号中既有超高斯信号又有亚高斯信号时,采
用 (/t)的选择将无法得到满意分离,Lee等 在传统
Infomax基础上提出扩展的Infomax算法。在信号分离 过程中,根据信号峰度变化,转换动态模型系数。分离
矩阵调整公式为:
W( +1)=W(n)+ [,一Ktanh(u)M 一“ ]W(n)
(5) 式中:K=diag[sign( (u。)),…,sign(k ( ))],
k (・)为信号峭度,超高斯情况k >0,亚高斯情况
k <0,输出信号 i峭度可计算如下:
k (U )=E[sech (“ )]E(u )一E[tanh( )一M ]
(6) 式中:E(・)表示期望,处理过程中可用样本均值进行 估计。 2欠定ICA算法
对欠定盲分离问题,大多数算法均在假设源信号
稀疏前提下采用聚类或优化算法。该算法对不稀疏
信号无能为力;对亚高斯信号缺乏有效欠定盲分离 方法。 本文通过生成隐藏数据 ,将欠定盲分离问题转化
为传统超定盲分离问题,从而应用传统的ICA算法进 行分离。隐藏数据z的生成通过最大化已知混叠信号
和解混矩阵w条件概率实现,有: =arg maxlogp(z I ,W)=
.drg l0g =
arg maxlogp (Wy)I detWl=
arg m.ax∑log P 。w y) (7)
生成隐藏数据z后,源信号分离问题转化为传统盲 源分离问题,如图2所示,新的混叠信号为:
y: (8)
式中:Y∈ , ∈ 。
图2欠定ICA算法流程图 Fig.2 Block diagram of underdetermined ICA
为较好估计隐藏数据 ,需较准确估计源信号的概
率密度。概率密度估计方法分参数估计与非参数估 计。参数估计方法,需假定作为判别依据的、随机取值
的数据样本在各个可能的类别中均服从特定分布经验
及理论说明,参数模型的基本假定与实际物理模型间
常存在较大差距,因此该方法并非总能取得满意结果。 鉴于此,Rosenblatt等 提出非参数估计方法,即核密 度估计方法。由于核密度估计方法不用有关数据分布
的先验知识,对数据分布不附加任何假定,从数据样本
本身出发研究数据分布特征,因此非常适用于信号盲 处理。 给定独立同分布随机变量 的一组实现 , ,
…, , 的概率密度可估计为:
1 n ( )=÷∑Kh(x—X ) (9) i 1
式中:K(x)称为概率密度函数估计核函数,要求K(x) 满足条件:
(1)K( )对称,且p K( )=K(一 );
一+∞ (2)J K( )dx=1;
32 振动与冲击 2013年第32卷
(3) =1,2,…,k一1时有J K( )dx=0,而 J一∞ r十∞ I K( )dx≠0。 J一∞ 通常将满足此三个条件的连续函数K( )称为k
阶核函数。在概率密度函数估计的核函数法中,最常
用的核函数为高斯核函数(b( )= e 。 √ 基于扩展Infomax的欠定ICA算法为: (1)初始化分离矩阵W; (2)给定观测信号 与分离矩阵w后,据式(10) 及当前估计源信号u的核密度估计式(12)由极大似然
估计法生成隐藏数据z;
(3)由扩展Infomax算法,式(5)更新分离矩阵
2O广—————————————————————————1 0 .H_一 叫
一20 — ■— —— —— — — 垂.
O j翌 馨.0
乏0 j型 ・0 0 点数×102/n (a)三个源信号 w,式(2)估计当前源信号“;
(4)返回步骤(1)直到算法收敛。
3仿真信号分析
选一标准的Laplace信号作为仿真超高斯源信 号51(f);选S2(t):sin(407rt)sin(600wt),S (t)= sin(200a'rt)作为仿真两亚高斯源信号,采样点数为
1 200,用Matlab产生的随机混合矩阵A对源信号进 行混合产生混合信号X=A [s。;s ;S ],三个源信
号与两路混叠信号波形如图3所示。图4为分离后 信号,可以看出,除ICA算法本身固有的分离信号排
列顺序及幅值不确定性,信号分离效果较好。
4 >2 迪0 坚一2 .4 0 2 4 6 8 1O 12 点数×102/n (b)两路混叠信号
图3源信号与混叠信号 Fig.3 Source signals and mixed signals
图5实测振动信号 Fig.5 Vibration signals 阶次 图6实测振动信号的包络阶次谱图 Fig.6 Order envelope spectrum of vibration signals
4齿轮箱复合故障信号分析
用某型单级齿轮箱进行试验验证。该系统由电机
带动输入轴,输出轴带动负载。主动齿轮齿数Z =30,
被动齿轮齿数Z =50,输入轴轴承为6206型单列向心
滚动轴承,输出轴轴承为7207型单列向心滚动轴承,
通过在齿轮啮合面切去一定厚度材料模拟齿面磨损故
障。轴承故障是在输入轴轴承内圈和滚动体通过线切
割实现,对振动信号在时域里进行等时间间隔采样,输 MM 州
— — —— —’『__— 2 ’r’—— ‘。‘。。。。。。。。。。。’ ’ ’———————‘ ‘。 。。。。。。。。 _1
馨一o5 ̄
— v
1v v vv—v w__}l
2
.: !!!
图4分离信号 Fig.4 Separated signals
图7分离信号时域图 Fig.7 Separated signals
入轴转速由0均匀加速1 200 r/min,对加速过程的振
动信号进行分离实验。内圈故障特征阶次为X =
5.42阶,外圈故障特征阶次为X… =3.58阶,滚动体故
障特征阶次为 =2.35阶。 由于机械结构振动信号通过结构传递产生延迟,
机械系统瞬态特征不会保持不变。但当考虑~刚度很
大、位移很小的结构时,其振动传递延迟可忽略不计,
可保持瞬态模型。为此,认为齿轮箱振动信号满足线
性瞬时混合模型。 5 O 5 2O2 2O2O O O O O O. A,覃}梁
一