当前位置:文档之家› 盲信号分离的理论与发展现状

盲信号分离的理论与发展现状

672008年4月(下)责任编辑:周霞 zhouxia2006@gmail.com

前沿技术

尺寸的减小,场区参数R1和R2相应收缩。这是一个很有意义的结果。5 结束语基于以上的分析和验算,可以说明ISO/IEC18047标准规定的测试参数:观察距离3λ和10λ,天线尺寸0.1m和 是可行的。 ★【作者简介】刘礼白:研究员级高工,中国电子科技集团公司第七研究所科技委主任、专家委员会副主任,信息产业部宽带无线移动通信技术专家组成员。中华人民共和国电子工业部有突出贡献专家,享受国务院颁发的政府特殊津贴。1 引言盲分离是信号处理领域一个极富挑战性的研究课题。由于盲分离在语音识别、信号去噪、无线通讯、声纳问题、生物医学信号处理、光纤通信等众多应用领域有着广泛的应用前景,从而成为信号处理领域和神经网络领域的研究热点。盲分离(BSS,Blind Source Separation)的研究起源于鸡尾酒问题。在多个说话人同时讲话的语音环境中,通常每个麦克风接收到是多个说话者的混合声音,如何仅仅从话筒接收到的语音信号中分离出所需要的说话者的声音?这便是盲分离问题。盲分离问题的主要特征就是在未知混叠参数的情盲信号分离的理论与发展现状*李荣华 赵 敏 华南理工大学电子与信息学院王 进 国家移动通信工程中心【摘要】文章首先介绍了盲信号分离问题的起源、特征、含义,然后介绍了盲信号分离的原理和算法,最后介绍了盲分离研究的现状,探讨了盲分离研究仍存在的一些问题。【关键词】盲信号分离 混叠模型 瞬时线性 非线性 卷积收稿日期:2008年3月14日*本文得到国家自然科学基金重点项目(U0635001),国家自然科学基金(60774094)的资助。682008年4月(下)责任编辑:周霞 zhouxia2006@gmail.com 前沿技术况下,仅仅根据观测到的混叠信号恢复出原始源信号,通常观测信号来自一组传感器的输出,其中每一个传感器接收到多个原始信号的一组组合,如图1所示。这是一个无需训练数据、“自学习”或者说“无监督”的求逆过程,我们不知道有关原始输入信号与信道结构的先验知识。由于许多盲分离方法都假设原始输入信号相互统计独立,因此这一过程有时候可以归结为独立元分析。术语“盲”有两重含义:(1)信源未知,源信号无法观测,或者无法直接观测;(2)信道未知,源信号如何混叠是未知的。当从信源到传感器之间的传输系统很难建立数学模型,或者关于传输的先验知识无法获得时,盲分离是一种自然而且比较理想的选择。盲分离的核心问题是对分离(或混叠)矩阵的学习,它属于无监督的学习,其基本思想是抽取源信号的某些特征(比如独立性、稀疏性等等)作为输入的表示,而又不丢失信息。图1 盲分离示意图总的来说,盲分离问题的研究内容大体上可以划分为瞬时线性混叠盲分离、卷积混叠盲分离,非线性混叠盲分离以及盲分离的应用四部分。当混叠模型为非线性时,很难从混叠数据中恢复源信号,除非对信号和混叠模型有进一步的先验知识。到目前为止,在大多数的研究中,讨论得最多的是瞬时线性混叠盲分离和卷积混叠盲分离。2 盲信号分离的原理盲分离的早期研究始于二十世纪八十年代中后期,短短的十几年里,有关盲分离理论和算法研究得到了较快的发展,包括盲分离问题本身的可解性以及求解原理等方面的基本理论问题已经在一定的程度上部分得到了解决,并提出了一些在分离能力、内存需求、计算量等方面性能各异的盲分离算法。一般认为,对盲分离问题的最早研究是由法国的Herault和Jutten于1985年左右开始的,1991年发表论文[1],现在通常称他们的方法为H-J算法,H-J算法中提出了一种针对两个源信号和两个混叠信号的递归连接人工神经网络,利用梯度下降算法调整网络权值对网络输出信号的残差最小化实现盲分离。Herault和Jutten之后,不少学者对H-J算法的收敛性进行了系统的研究,在只存在两个源信号和两个混叠信号的最简单情况下,收敛性问题得到了完满的解决。此后盲分离问题引起了神经网络领域和信号处理领域的广泛研究兴趣,盛况空前。瞬时线性混叠盲分离相对而然最为简单,到目前为止,研究成果也最为丰富。瞬时线性混叠数学模型如下:x(t)=As(t) , (1)y(t)=Wx(t), (2)其中(1)式为混叠模型,(2)式为分离模型;s(t)=(s1(t),s2(t),…,Sn(t))T为源信号矢量,x(t)=(x1(t),x2(t),…,xm(t))T为观测信号矢量y(t)=(y1(t),y2(t),…,yn(t))T为分离信号矢量;A为未知的m×n的混叠矩阵,源信号s(t)也是未知的,W为分离矩阵。瞬时线性混叠盲分离的目的就是通过调节分离矩阵W(或混叠矩阵A),使得分离信号与对应的源信号的波形保持一致,即:y(t)=PDs(t), (3)其中P为置换矩阵,D为对角矩阵。y(t)是对源信号s(t)的估计,瞬时线性混叠盲分离问题允许存在两个盲信号分离的理论与发展现状692008年4月(下)责任编辑:周霞 zhouxia2006@gmail.com

前沿技术方面的不确定性:一个是排列顺序的不确定性,无法了解所抽取的信号应是源信号s(t)为哪一个分量;另一个是信号幅度的不确定性,即无法知道源信号的真实幅值。由于信号的信息很大一部分隐含在波形中,所以很多时候这两种不确定性并不影响盲分离技术的应用。瞬时线性盲分离实现的具体过程如图2所示,其中LA表示学习算法(Learning Algorithm)。图2 瞬时线性混叠盲分离示意图瞬时线性混叠盲分离代表性的算法主要有:Bell-Sejnowski最大信息量(Infomax)方法、Amari自然梯度(Natural Gradient)方法、Cardoso等变化自适应方法(EASI)、Hyvarinen快速独立元分析算法(FastICA)、矩阵特征值分解方法等。其它算法很多都是在这些算法的基础上推广或者补充发展起来的,当然盲分离并不仅仅局限于这些算法。盲分离中经常要用到优化运算,就优化手段而然,Infomax算法、自然梯度算法、和EASI算法属于梯度下降(上升)寻优算法,收敛速度是线性的,速度略慢一些,但属于自适应方法、具有实时在线处理能力;FastICA算法是一种快速而数值稳定的方法,采用拟牛顿算法实现寻优,具有超线性收敛速度,通常收敛速度较梯度下降寻优算法快得多;矩阵特征值分解盲分离方法通过对矩阵进行特征分解或者广义特征分解估计分离矩阵,是一种解析方法,可直接找到闭形式解(Closed Form Soutions),没有迭代寻优过程,因此运行速度最快。其中前面四种算法梯度如表1所示。其中μ是学习步长,g(·)为事先给定的非线性函数。g(y)=(g(y1),…,g(yn))T。对于FastICA,βi=-E{yi·g(yi)},αi=-1/(βi+E{g'(yi)}),其中g1(x)=tanh(ax)和g2(x)=x·exp(-x2/2)分别用于超高斯信号和亚高斯信号。相比瞬时线性混叠和卷积混叠盲分离,非线性混叠盲分离难度非常大,到目前为止只有少数学者研究了非线性混叠盲分离。Taleb和Jutten研究了独立源信号非线性混叠的可分离性,他们指出一般意义下的非线性混叠盲分离不具备唯一解,其中后非线性(PNL,Post-nonlinear)混叠具有较好的可分离性,并且针对后非线性混叠盲分离模型提出了盲分离算法。后非线性混叠模型如下: (4)其中fi(·)表示可逆可导非线性函数,x(t)=x1(t),…,xm(t)T表示观测信号向量。后非线性混叠盲分离模型如下: (5)其中y(t)=(y1(t),…,ym(t))T为源信号的估计。后非线性混叠盲分离过程如图3所示:图3 后非线性混叠盲分离示意图算 法InfomaxNatural GradientEASIFastICA梯度公式△W=μ·[(WT)-1-g(y) ·XT]△W=μ·[I-g(y)·yT] ·W△W=μ·[I-y·yT-g(y) ·yT+y·g(yT)]·W△W=diag(αi)·[diag(βi)+E{g(y)·yT}]·W盲信号分离的理论与发展现状表1 几种代表性的盲分离算法及其梯度公式702008年4月(下)责任编辑:周霞 zhouxia2006@gmail.com 前沿技术非线性混叠盲分离主要有以下几类方法:(1)自组织映射(SOM,Self-organiza-tion Map)网络方法:该方法不考虑非线性混叠的具体形式,Pajunen、Hyvarinen和Karhunen使用Kohonen自组织映射从非线性混叠观测信号中抽取独立信号。这类方法网络复杂性呈指数增长,分离连续源时插值误差非常严重。(2)感知器模型法:Burel用一个两层感知器和基于BP思想的无监督训练算法,使用梯度下降法最小化互信息量,得到一种盲分离算法,可以用于非线性混叠的盲分离。Yang和Amari利用两层感知器网络结构,通过最大化熵和最小化互信息量准则测量独立性,提出了BP网络训练算法,当合理选取非线性函数时,该算法可以分离出特定非线性混叠的源信号。(3)径向基函数网络法:Tan等使用径向基函数神经网络逼近非线性混叠的逆映射,以此达到去非线性的目的,进而分离源信号。(4)后非线性混叠盲分离:Taleb和Jutten首先提出了后非线性混叠模型,他们指出这类模型具有可分离性,同时他们指出这类模型有许多应用场合,针对这类模型提出了一种非线性混叠盲分离算法。Solazzi和Uncini也针对后非线性混叠,基于信息量最大准则,利用自适应B-样条函数,提出了样条神经网络(Spline Neural Network)后非线性盲分离算法。3 盲分离研究现状现实生活中很多问题都可以归结为盲分离。如:上面提到的鸡尾酒问题[1-3],从多个话筒接收到的声音中确认出每个说话者的内容(通常语音识别之前,首先需要分离出识别对象的声音(如图4所示);CDMA盲多用户检测[4],在存在用户间干扰和码间干扰的情况下,从与多个发射器相对应的天线观测到的接收信号中恢复出通信信号(如图5所示);信号去噪,在对噪声先验信息一无所知的情况下进行信号去噪[5](如图6所示);声纳问题[6],在多个船舶的马达噪声构成的水下声音环境中,从多个声音传感器接收到的信号里,分离出所需的信号;光纤通信中光频分复用器的设计[7],利用了一根光纤可以同时传输多个不同波长的光载波的特点,把光纤可能应用的波长范围划分成若干个波段,每个波段用作一个独立的通道传输一种预定波长的光信号,在接收端采用复用器分离出不同波长的光信号,从而大大提高光纤容量;医学遥感图像处理,斯华龄教授提出一种多通道、单象素无监督学习盲分离方法,将其应用于医学和遥感图像处理,获得巨大成功[8]。此外,盲分离在语音增强,图像增强(如图7所示),图像识别(如图8所示),脑电(EEG,Electroencephalography)信号、脑磁记录(MEG,Magnetoencephalography)信号、心电(ECG,Eletrocardiography)信号、核磁共振成像(fMRI,Functional Magnetic Resonance Imaging)信号之类医学信号处理等方面有着广泛的应用前景[2](如图9所示)。由于盲信号处理需要的先验信息很少,使得其具有极强的适应性和广阔的应用领域。在这样的背景之下,有关盲信号处理的研究一直是信号处理领域和神经网络领域的研究热点。

图6 图像去噪图4 语音分离 图5 CDMA盲检测 盲信号分离的理论与发展现状

相关主题