第27卷第11期 2010牟11月 计算机应用研究 Application Research of Computers V0l|27 No.11 Nov.2010
基于独立分量分析的自适应在线算法
吕淑平,方兴杰
(哈尔滨工程大学自动化学院,哈尔滨150001)
摘要:独立分量分析(ICA)是近几年兴起的一种高效的信号处理方法,学习步长的优化问题是自适应ICA重
要的一方面,基于变步长思想,定义了一种描述信号分离状态的相似性测度,来衡量输出分量之间的相似性程
度,并由此提出一种改进的自适应在线算法。根据相似性程度所反映的信号分离状态自适应调节步长,并建立
学习步长和相似性测度变化量的非线性关系,克服了传统算法在信道矩阵变化时对步长自适应调整的不足。性
能指标分析和仿真实验证明了算法的收敛性和稳态性能。
关键词:独立分量分析;相似性测度;学习步长;性能指标
中图分类号:TP301.6 文献标志码:A 文章编号:1001—3695(2010)l1—4140.04
doi:10.3969/j.issn.1001—3695.2010.11.037
Adaptive on—line algorithm based on independent component analysis
LV Shu—ping,FANG Xing—jie (College ofAutomation,Harbin Engineering University,Harbin 150001,China)
Abstract:ICA is an efficient signal processing method which arose in recent years,an important problem learning in adaptive ICA is opting learning step.According to variable step thinking,this paper defined similarity measure which described the state of signal separation,to measure the level of similarity between output components,and thus developed an improved adap— tive line algorithm.Adjusting the learning step on the basis of traditions of degree of signal separation which was reflected by dependent measure,and established the nonlinear relation between learning step and similarity measure variation,and over- came the disadvantages of traditional algorithms in the channel variation circumstances in the process of adaptive step.Per- formance analysis and simulation results show that separative signal has better performance in convergence and steady. Key words:independent component analysis(ICA);similarity measure(SM);learning step;performance index(PI)
0 引言
独立分量分析(ICA)是指在未知源信号和传递通道路径 的情况下,根据输入源信号的统计独立性,仅由混合后的观测
信号检测并分离出源信号中各个独立的成分。ICA在线算法
主要有基于信息论分析的自然梯度算法和能够实时处理的H— J…算法,本文主要研究自然梯度算法。2005年Yuan_2 提出
梯度变步长的自然梯度算法,很好地解决了步长随梯度变化的
问题,并且具有较好的跟踪信号能力。张贤达等人l4 提出一
种步长学习规则与信号分离状态有关的分阶段学习算法,文献
中根据信号的分离状态分阶段地自适应调整步长。
本文提出一种改进的自适应步长的自然梯度算法。定义
一种相似性测度(SM)来衡量输出信号分量之间的相似性程 度,相似性程度变化量反映信号的分离程度,并根据其变化量 调整步长调节因子,进而使步长自适应地变化。同时防止步长
过大或过小,设置上下限,使信号尽快收敛到平衡点。本文针
对信道矩阵恒定和变化情况下进行模拟实验,证明该算法的稳
定性能和收敛性。
1独立分量分析的问题
假定x为m维零均值观测信号,由n个未知的零均值独 立源信号s线性混合的。在噪声存在的情况,将其本身看成一
个独立源,与其他真正的源信号进行盲分离。盲源分离的模型
如图1所示。线性混合模型表示为
n x=As=∑aisj =1,2,…,n (1) J=1 其中:A=[a 一,a ]为m×n阶满秩任意的混合信号,独立分
量s 和混合矩阵 都是未知的。为使ICA问题有唯一解,工
程上需要一些假设条件,具体见参考文献[1]。
n(力l 巫 I调整 匝萄
图1盲信号分离原理图
1.1 ICA存在两类不确定性
ICA问题存在以下两类不确定性: a)分离信号排列顺序。x=As=Ap~ps,Ap 看成一个
混合矩阵,ps看成新的独立源信号,同样得到观测向量x,对恢
复出的信号是s还是pS无法确定,即信号的幅值不确定,工程
上大多考虑信号的波形信息,因此对实际意义影响不大。
b)幅值不确定。分离信号Y=ps,P是移位矩阵,即存在
排列顺序的不确定。 在混合矩阵和源信号均未知情况下,为尽可能地分离出源
收稿日期:2010.04—30;修回日期:2010—06—18 作者简介:吕淑平(1963一),女,教授,博导,主要研究方向为模式识别理论及应用、信号处理;A- ̄,A(1985.),男,硕士研究生,主要研究方向为 信号处理.
第11期 方兴杰,等:基于独立分量分析的自适应在线算法 ・4141・
信号,构建一个分离矩阵 ,这样ICA问题的求解可表示为
Y=Wx=WAs=Gs r21
其中:G为广义交换矩阵(每行和每列只有一个非零元素),通
过学习能使G=PA,P为置换矩阵,A为对角阵,从而能达到
分离源信号的目的。
1.2性能指标
为验证算法的分离精度,定义性能指标(PI)为
孙 . Ig.k l-1)+( _1))(3)
其中:g 是矩阵G= A的第i行和第 列元素;max,J l表
示第 列所有元素绝对值的最大值;P,越小表示解混效果越
好,分离效果越好。每一次的在线算法求出相应的 值,可以
直观地看出信号的稳态误差和收敛情况。
2独立分量分析的自然梯度算法
ICA算法可描述为:ICA算法=目标函数+优化算法,这
两方面构成ICA的核心。目标函数体现算法的统计性质;优
化算法决定算法的收敛速度和稳态误差。
2.1 目标函数
基于信息论分析的ICA算法主要有互信息最小化判据
(minimum mutual information,MMI)、信息极大化判据(infor—
max)、极大似然判据(maximum likelihood estimation)。这三种
目标函数是等价的,详见文献[3]。本文主要采用MMI判据,
定义如下:
,( )=^=L[p(y), p(y )]=∑. (Y )一 ( ) (4)
其中:KL代表散度。由KL知识可知,( )≥0,当且仅当 中
各分量独立时,(Y)=0。MMI算法简述如下:
Y=Wx H( )=一E[1ogp(y)]
p( )=p(x)/det( (5) 得到日(Y):一E[1og P(x)]+E[1og det( ,)],即
日( )= (x)+log det(∽ (6)
其中:H(・)表示微分熵, [・]表示均值,H(x):一f::P
(x)logP (x)dx。 综合式(4)和(6),得到目标函数如下:
’,(vt,3=一日(x)一logl det( l—E{ ( ))} (7)
其中:日()与解混矩阵W无关,可舍弃,
。E log(p Y
X
2.2 ICA的自然梯度算法
ICA的目标使式(7)最小化,用随机梯度搜索寻优的思想,
得到随机梯度的实时学习算法:
AW(k)=一 ( )V J(y( ), =一 ( ) (8)
( )为学习步长,具体推导见参考文献[2],得到推导式如下:
aW(k)=一 ( )鱼 = ( )(w—T一 ( )) )(9)
其中 Y(k))为非线性激活函数。可知W。。。是 的转置逆
矩阵。由于计算量大,而且容易出现病态,影响收敛速度,为此
引入一可逆矩阵G 作用于随机梯度,即
AW(k)= 邮 (1o) 文献[4]矩阵G的自然选择为
G-I : WrW: I-f(Y)Y ]W(11) oW oW
其分离矩阵迭代式为
△w( )=弘( )[i一_厂(y( ))y(&) ]W( ) (12)
得出最后的自然梯度算法的在线迭代式:
k+1)= ) ( )[I一,( ( ))y( ) ] ) (13)
2.3 YUAN LX算法
YUAN LX提出的变步长梯度算法:
( )= ( 一1)一p (14)
-trac ,
由式(13)可知
= ,一 卅) (…]w( ) )(16)
由 ,( )=W(k一1)+/z( 一1)[,一l厂(Y( 一1)) ( 一
1)] 一1)得到:
k-1 …
k一1)= 一1) (17)
这样得到学习步长的迭代式:
( )= ( 一1) ptrace(丁 ( )丁( 一1)) (18) 仿真实验证明该算法在初始步长较小时,分离出的信号稳
态误差小,但收敛慢;当初始步长较大时,收敛速度快,但稳态
误差变大。因而不能同时兼顾收敛速度和稳态误差。
3本文算法
3.1 自适应步长思想
盲分离算法的最终目的使得△ 0,保证分离矩阵
收敛到最优状态,即满足:
,W(k+1)= W( )=Wopt (19)
重写自然梯度算法的在线迭代式(13):
k+1)= ) ( )[/-f( ( )) ( ) ] k) (20) 可知在步长 (k)和W(k)不为零条件下,当[,一 (Y( ))
Y( ) ] 时,式(19)成立,此时输出 分量之间相互独立,分 离矩阵最优。由此定义一种相似性测度(SM),来衡量输出
分量之间的相似性程度。 SM=ll I—l厂( ) ;=trace(B B) (21)
其中:ll・ 是矩阵的Frobenius范数,日=f-f(Y)y 。在分
离初始阶段,输出 分量之间的相似性程度大,分离效果不好,
即SM值越大,随着迭代次数增加SM值越来越小,分离程度越 好,直到SM为零。可以看出SM值变化定性反映输出信号
分量之间的相似性程度,实际工程采用平滑的E(SM)代替
SM,E(SM)逐渐下降直到E{_厂( )y }一,,此时 分量之间的相 似性程度最小,即收敛到最优矩阵。但实际上存在一定的扰
动,导致E(SM)抖动。尤其在信道变化前后,会出现更大的 波动。 所谓变步长的思想就是通过合理的调整步长使其增加到
一个合理的稳定值邻域,满足最好的收敛效果,同时存在一定
的抖动,需要在该邻域内合理地减少步长,这样保证更好的稳
态误差。根据变步长思想,
将相似性测度用于自适应地控制步