当前位置:文档之家› 盲源分离综述_问题_原理和方法

盲源分离综述_问题_原理和方法

中图分类号:T N97111 文献标志码:A 文章编号:C N51-1694(2008)02-0001-05收稿日期:2007-11-29;修回日期:2007-12-30作者简介:陈锡明(1970-),男,高级工程师,博士;黄硕翼(1983-),男,硕士研究生。

盲源分离综述———问题、原理和方法陈锡明,黄硕翼(信息综合控制国家重点实验室,成都610036)摘要:盲源分离,是从观测到的混合信号中恢复不可观测的源信号的问题。

作为阵列信号处理的一种新技术,近几年来受到广泛关注。

文章按源信号不同的混合方式,将盲源分离问题分为三种类型:线性瞬时混合、线性卷积混合和非线性混合,综述了它们各自分离的原理和方法,并结合国内外的研究现状,对未来的发展作出了展望。

关键词:盲源分离;独立分量分析B lind Source Separation :Problem ,Principle and MethodCHE N X i 2ming ,HUANG Shuo 2yi(National In formation C ontrol Lab oratory ,Chengdu 610036,China )Abstract :Blind source separation is to recover unobserved source signals from observed mixtures.As a new technology of array signal processing ,it has attracted wide attention.Blind source separation is classified into three types :linear instantaneous mixtures ,linear conv olutional mixtures ,and nonlinear mixtures ,as per different mixture methods.And a survey is presented on separation principles and methods of each type.The prospect of future development is given too.K ey w ords :blind source separation ;independent com ponent analysis (ICA )1 引言盲源分离(BSS )是信号处理领域的一个基本问题,是根据观测到的信号来分离或恢复出未知源信号的过程。

它在医学信号处理、数据挖掘、语音增强、图像识别以及雷达与通信信号处理等方面正受到越来越广泛的重视。

其更一般的表述为:已知从多输入—多输出(MI M O )非线性动态系统(SIS O ,SI M O 是特例)中测得的传感器信号X (t )=[x 1(t ),x 2(t ),…,x m (t )]T,要求找到一个逆系统,以重构估计原始的源信号S (t )=[s 1(t ),s 2(t ),…,s n (t )]T[1]。

源信号S (t )未知,源信号如何混合得到观测信号也未知,这体现了求解问题的“盲”。

最简单的情况,如果X (t )是S (t )的线性瞬时混合,即X (t )=H 3S (t ),H 为一个m ×n 维的混合矩阵,盲分离问题简化为求一个n ×m 维的解混矩阵W ,使输出Y (t )=W 3X (t )=W 3H 3S (t )≈S (t )。

事实上,在缺乏某些先验知识时是不可能唯一地确定源信号的,所以盲分离问题存在两个内在的解不确定性:一是输出分量排列顺序的不确定性,即无法确定所恢复的信号对应于原始信号源的哪一个分量;二是输出信号幅度的不确定性,即无法恢复原始信号源的真实幅度。

但因为源的大量信息蕴涵在源信号的波形中而不是信号的振幅或者系统输出的排列顺序中,所以这并不影响盲分离的应用。

2 盲源分离的基本类型和解决方法 就源信号经过传输通道的混合方式而言,可分为线性混合和非线性混合信号的盲分离;其中1电子信息对抗技术・第23卷2008年3月第2期陈锡明,黄硕翼盲源分离综述———问题、原理和方法线性混合又主要可分为线性瞬时混合和线性卷积混合。

盲处理的大部分方法是依据一定的理论构造目标函数的无监督学习方法。

采用的目标函数主要有负熵、高阶累积量、互信息量、K L散度、最大似然估计等。

确定了目标函数以后,再用一定的算法作寻优处理得到源分离矩阵。

不同的混合方式,构造目标函数的原则基本相同,不同的是寻优算法。

下面就这些方法进行概略描述。

2.1 线性瞬时混合线性瞬时混合是最简单的一种混合方式,也是研究另外两种类型的基础。

尽管它有许多不同的盲分离算法,但其原理却都可以归纳为以下四种方法:(1)最普遍的方法就是用代价函数来衡量信号独立性和非高斯性或者稀疏性。

当假设源信号具有统计独立性,且没有时间结构时,高阶统计量方法是求解盲源分离问题的基本手段。

这种方法对多于一个高斯分布的源信号不适用。

(2)如果源信号具有时序结构,则其有非零的时序相关数,从而可以降低对统计独立性的限制条件,用二阶统计量方法(S OS)就足以估计混合矩阵和源信号[2-3]。

这种S OS方法不允许分离功率谱形状相同或统计独立的源信号。

(3)采用非平稳性和二阶统计量。

由于源信号主要随时间有不同的变化,就可以考虑利用二阶非平稳性[4-6]。

与其他方法相比,基于非平稳性信息的方法能够分离具有相同功率谱形状的有色高斯源,然而,却不能够分离具有相同非平稳特性的信号。

(4)运用了信号的不同多样性,典型的是时域多样性、频域多样性或者时频域多样性,更一般地,即联合空间—时间—频率多样性。

其中,独立分量分析(IC A)属于第一类,是解决盲源分离(BSS)问题的重要方法。

它利用源信号统计独立等容易满足的先验条件,从混合信号中恢复不可观测的各个信号分量。

也就是说,IC A 的基本假设条件之一是在任何时刻t,源信号S(t)的各分量s i(t)之间统计独立,而IC A对S(t)在时域是否相关未作任何约束。

Cardos o在文献[7]中提到:若源是相互独立的,混合矩阵是可逆的,则如果向量Y(t)=C・S(t)也相互独立,那么Y(t)就是S(t)的一个恢复。

其中C为这样的一个矩阵:其每行每列都只有一个非零元素。

这就说明了盲源的可分离性,同时也意味着输出达到统计独立就可以实现盲源分离,也指导了IC A优化目标函数的建立。

IC A 优化目标函数的建立准则如下:(1)互信息最小化。

K L散度是统计独立性的参数,它与信息熵表示的互信息量相当。

IC A 的目的就是使输出信号Y(t)各分量尽可能独立, K L散度(或互信息)自然可作为度量参数。

(2)信息传输最大化或负熵最大化。

在信噪比较高的情况下,输入和输出之间互信息量的最大化意味着输出与输入之间的信息冗余量达到最小,这样就使得各输出之间的互信息量最小,从而各输出分量相互统计独立。

(3)最大似然目标函数。

最大似然估计的目标就是由观测数据样本来估计信号的真实概率密度,具有一致性、方差最小及全局最优等许多优点,但缺点是需输入信号概率分布函数的先验知识,现有的方法是用核函数的非参数估计方法,利用随机变量的一组实现来估计信号的概率密度。

事实上,一定条件下,这三种准则之间是等价的。

而在建立目标函数后就需要寻优算法来求解。

寻优算法主要分为在线算法和离线算法,前者是实时的方法,存在自适应算法的收敛问题,如随机梯度法[8]、自然梯度法[9]和相对梯度法[10];而后者则是接收数据后再进行批处理,典型的有FastIC A[11-12]。

而在此基础上发展的局部独立分量分析,就是对可利用的传感器数据,首先在空间域或者时域、频域或者时频域内将这些数据分成不同类,然后再对每类数据局部地进行线性独立分量分析。

更一般地,最优的局部独立分量分析是以下两个过程相互作用的结果,即合理的分类处理过程和对每类数据应用独立分量分析的过程。

2.2 卷积混合上面主要论述的是盲源分离的最简单和基本的模型———瞬时混合。

更接近实际的是把混合看作是源信号和信道的卷积过程,使得盲分离成为盲解卷积,事实上也同时是盲均衡的方法。

而恢复的信号可能是源信号经过幅度伸缩或者时延以后的估计。

很容易想到,时域卷积等于频域相乘,就将时2陈锡明,黄硕翼盲源分离综述———问题、原理和方法电子信息对抗技术・第23卷2008年3月第2期域的卷积混合转化为频域的瞬时混合问题[13]。

将数据分段,每段进行FFT,得到:X(ω,m)=H(ω)S(ω,m),Y(ω,m)=W(ω)X(ω,m)其中,m为数据段(帧)的位置,mΦM.对每一个频率ω,将有M个数据进行盲分离计算W(ω),最后再对W(ω)求IFFT得到时域分离矩阵。

从这个过程中我们可以看到,M值不能太小,这会导致S(ω,m)各分量的独立性减弱。

而FFT点数也不能太小,否则频域盲分离的点数少将导致反变换回时域的分辨率降低。

所以频域盲分离的要求点数很多,一般为批处理算法且计算量大[14],而且也不能适应环境的改变。

同时,已经证明频域盲分离方法与频域自适应波束形成方法是等价的,所以其性能不能超出自适应波束形成给出的上界[13]。

直接在时域进行解卷积,其代价函数一般可分为两类:互信息最小/熵最大和基于累积量的算法。

Bussgang算法和自然梯度算法是第一类的两个典型例子。

Bussgang方法应用随机梯度下降使依赖于均衡器输出信号的非凸代价函数最小化。

它简单且易于实现,但由于存在局部极小点,可能收敛到错误的解。

Amari等人提出自然梯度算法首先应用于解瞬时混合,后来又扩展到解卷积。

如果将乘法和卷积同作为一个算子,可以证明瞬时混合和多通道卷积混合的所有代数性质等价[15],这样将时域解瞬时混合的自然梯度算法的对比函数和学习规则中乘积符号换成卷积,就可以得到时域解多通道卷积混合,能够显著提高盲分离和盲解卷积的效率。

基于累积量的方法的例子有倒三谱[16],基本原则是使基于高阶累积量的非线性代价函数最小化。

2.3 非线性混合实际环境中观察到的混合信号更加一般的是经过非线性混合得到,这种问题的BSS和IC A要比上述线性混合复杂得多。

此时,线性混合信号盲分离算法不再适用,如果仍把非线性混合模型假设为线性混合,并利用线性IC A方法求解,可能会导致完全错误的结果。

解决非线性混合信号的BSS问题通常很困难,需要额外的先验信息或施加适当的约束。

对于非线性混合信号盲分离算法的研究,大致可以分为两类:一类是将混合建模为后置非线性问题,即把非线性混合看作是源信号先经过线性混合再经过非线性传递函数f,分离部分首先用f-1进行非线性校正,得到近似线性混合的信号向量后再进行线性分离。

相关主题