语音信号盲分离—ICA算法
研究现状简介
线性瞬时混合信号
较早进行盲源分离方法研究的是jutten和Herault,1986年,他们提出了一种盲源分 离方法,该方法基于反馈神经网络,通过选取奇次的非线性函数构成Hebb训练,从 而达到盲源分离的目的。但该方法不能完成多于两个源信号的分离,非线性函数的 选取具有随意性,并且缺乏理论解释。 1991年,Juttcn, Herault以及Comon和Sorouchyari在杂志Signal Processing上发表了 关于盲信号分离的三篇经典文章,标志着盲源分离问题研究的重大进展.他们不仅提 出了盲源分离中著名的H-J学习算法,而且设计了专门的CMOS集成芯片来实现他们 的算法。H-J方法后来由Jutten和Herault、Comon, Cichocki和Moszczynski以及其他研 究者解释并发展。Tong和liu分析了盲源分离的可分离性和不确定,并给出了一类基 于高阶统计量的矩阵代数分方法。 1993年,Cardoso提出了基于高阶统计的联合对角化盲源分离方法,并应用于波 束形成。
(2)如果源信号具有时序结构,则其有非零的时序相关数,从而可以降低对统计 独立性的限制条件,用二阶统计量方法(SOS)就足以估计混合矩阵和源信号。这种 (SOS)方法不允许分离功率谱形状相同或i.id(独立同分布)的源信号。 (3)第三种方法即采用非平稳性(Ns)和二阶统计量(SOS)。由于源信号主要随时间 有不同的变化,就可以考虑利用二阶非平稳性。Matsuoka等人首先考虑了非平稳性, 并证‘明在盲源分离中可以应用简单的解相关技术。与其他方法相比,基于非平稳 性信息的方法能够分离具有相同功率谱形状的有色高斯源,然而,却不能够分离具 有相同非平稳特性的源信号。
研究现状简介
1995年,Bell和Sejnowsk基于信息理论,通过最大化输出非线性节点的熵,得出 一种最大信息(Informatian Maximization,简记Infomax)传输的准则函数,并由此导出 一种自适应盲源分离和盲反卷积方法,当该方法中非线性函数的选取逼近源信号的 概率分布时,可以较好地恢复出源信号。该算法虽有其局限性,但在分离线性混合 的语音信号方面非常有效。 1997年,Hyvarinen等基于源信号非高斯性测度,给出一类定点训练算法(fixedpoint),该类算法可以提取单个具有正或负峰度的源信号。 1999年,Lee、 Girolami和Sejnowski将信息最大化原则的独立分量分析作了进一 步的扩展,实现了超高斯源信号和亚高斯源信号的盲源分离,这个方法选取两个不 同的非线性函数分别实现超高斯信号和亚高斯信号的盲源分离。但是这个方法只局 限于实现标准的独立分量分析,不能解决当源信号维数大于混合信号维数时的盲源 分离向题,也不能实现具有噪音的独立分量分析。
语音信号盲分离 —ICA算法
主要内容
背景介绍 研究现状介绍 盲分离的概念、方法和准则
ICA算法 语音信号盲分离实例
Fast
背景介绍
语音信号的分离近年来成为信号处理领域的一个研究热点,它在电话会议、助 听器及便携设备、机器的语音识别方面有很多的应用与影响。而盲信号处理的方法 常被用于语音分离中去,“盲”是指没有关于源信号本身以及传输信道的知识,盲 分离的理论基础是独立分量分析(ICA),其可以广泛的被应用于通信、图像、语音、 生物医学、雷达、地震、声纳等多种类型信号的处理。盲分离技术可以用于消除不 需要的干扰以增加语音质量。 语音分离使得助听器有更强大的处理功能,使得接收信号分离出尽可能接近原 始的语音。更适合于语音编码和基音检测。特别是在混合语音信号进行编码方面, 传统的单通道方法处理起来十分困难,而混合语音可以看作多路语音信号的线性组 合,其每一路语音信号都可视为独立分量,这正好与ICA的假设相符。语音识别。机 器的语音识别能力远不及人类,尤其是在有噪音和干扰的背景下。 这时作为语音识 别的前端处理,盲语音分离可以很好的去除干扰,不论是加性噪声还是其他不感兴 趣的语音,这就大大增强了机器的识别率。
盲分离的概念、方法和准则
盲源分离的基本方法
(4)第四种方法运用了信号的不同多样性,典型的是时域多样性、频域多样性(谱 或时间相干性”)或者时频域多样性,更一般的,即联合空间一时间一频率(STF)多样 性。
BSS和ICA的区别与关系
自从 BSS 和 ICA 的概念产生以来,人们几乎是不加区分地使用这两个概念。但 是,如果深入研究 BSS 和ICA 的基本原理和作用对象,两者之间的区别和联系是显 而易见的。 Comon 对 ICA 给出了较严格的定义:对于观测信号矢量,存在一个线性变换, 使得观测信号在线性变换下各分量的统计独立性最大化。这一过程称之为 ICA 过程。
盲源分离的目的就是在源信号s和混合系统A均未知的情况下,仅由观测数据向量x通 过调整分离系统W,使得输出y是源信号s的估计,即:
y W x s
盲分离的概念、方法和准则
盲源分离的基本方法
盲源分离包含了线性瞬时混合和卷积混合两种盲源分离问题。解决盲源分离问题 的重要方法一独立分量分析(Independent Component Analysis,ICA)通常以线性瞬时混 合为模型,而盲解卷积则是一种更为实际的盲源分离问题,其混合模型是一种卷积混 合,线性卷积混合模型比较接近实际,这是因为: (1)实际中每一个源信号不会同时到达所有的传感器,每一个传感器对不同的源延 时不同,延时值的大小取决于传感器与源信号间的相对位置以及信号的传播速度; (2)源信号到达传感器是经过多途传播的,即多径效应。假设信号是线性组合的, 则从传感器观测到的信号是源信号各种延时值的线性组合。解决此类问题的盲信号处 理方法就是盲解卷积。特别地,ICA方法也可被用于盲解卷积或盲均衡。此外,盲信 号处理还包括许多重要内容,例如非线性BSS或非线性ICA问题、盲多用户检测以及 盲波束形成等等。
1994年,Krob和Benidir研究了利用高阶统计量解决多项式结构的非线性混合问题。 1995年,Deco和Brauer研究了一个基于Volume-Conserving结构的非线性变换的盲 源分离。 1997年,Yang、Amari和Cichocki基于对于源信号各分量统计独立的假设,利用 两层感知器网络结构得出基于最大熵( Minimum Entropy,简记ME)和最小互信息思 想(Minimum Mutual information,简记MMI )的代价函数,并提出了反向学习算法, 当合理选择非线性函数时该算法可以分离出一些特定非线性混合的源信号。
BSS考察的是在什么条件下可以使全局矩阵实现广义对角化,而不去衡量输出信 号的统计独立性是否达到最大化。因此BSS并不一定要求源信号是统计独立的。例如 AMUSE、GED算法只要求源信号具有统计不相关性。如果源信号是统计独立的,那 么BSS的输出信号也一定是统计独立的,这时BSS和ICA等价。 从作用对象看,ICA除了可以用于多源信号的分离外,还可以用于其它多维数据 的分析,例如图像的特征提取、经济数据分析等。而BSS不仅仅局限于瞬时混合信号 的分离,还包括实际应用中更重要的卷积混合信号的分离。 可以说ICA是实现BSS的一种方法,而BSS是ICA的一个具体的应用。
研究现状简介
1998年,Taleb、Jutten 和 Olympieff 提出了一种非线性混合信号盲源分 离算法,该算法基于熵,对于分离某些盲混合信号具有良好性能。
2001年,Valpola、Honkela 和 Karhunen提出了贝叶斯集合学习算法 (Bayesian Ensemble Learning Algorithm ),该算法采用多层感知器神经元网络 (MLP ),能够对非线性静态和动态过程实现盲源分离。Tan和Wang提出了基 于遗传算法( Genetic Algorithm)的盲源分离方法,该算法利用遗传算法使信 号非线性混合度最小化,然后对去除非线性后的数据进行线性分离,从而实 现盲源分离。与传统的梯度算法相比,基于遗传算法的盲源分离方法有着更 快的收敛速度和稳定性,能够在全局范围内寻找最优解。Tan、Wang和 Zurada提出了径向基网络算法(Radial Basis Function Network Algorithm),使 用径向基函数神经网络来逼近非线性混合的逆映射实现盲源分离。
盲分离的概念、方法和准则
盲分离的目标准则
根据源信号不同的特征,盲源分离的实现方法有很多,但它们的原理可以归纳 为以下四种准则:
(1)独立分量分析(Independent Component Analysis, ICA):当假设源信号各分量间 彼此统计独立,且没有时间结构时,在某一分离准则下通过对神经网络权值的反馈 调整,使得变换后信号的不同分量之间的相依性最小,也即输出达到尽可能的独立。 这种方法对多于一个高斯分布的源信号不适用(因为高斯信号的线性叠加仍是高斯信 号),这是近年来盲源分离的主要解决方法。
与此对应,可以给出BSS的如下定义:对于观测信号矢量,存在线性变换w,使 得全局矩阵G的各行及各列中只有一个非零元素(不妨称之为广义对角矩阵),即 G=PD。其中P为置换阵;D为对角阵,从而实现信号分离。
盲分离的概念、方法和准则
BSS和ICA的区别与联系
ICA的目的是通过线性变换使得观测信号的各个分量的统计独立性最大化。通常 用输出信号的互信息、熵等作为统计独立性的量度,如基于信息论的Informax 算法、 Amari 的自然梯度算法等。如果源信号之间具有统计独立性,那么可以通过ICA实现 信号的分离。
盲分离的概念、方法和准则
盲源分离的基本方法
尽管有许多不同的盲源分离算法可用,但它们的原理却都可以归纳为如图所示 的以下四个方法:
相互独立、 非高斯、 ICA
非稳态、 时变方差
时序结构、 线性可预测
时频、谱和 空间多样性
盲分离的概念、方法和准则
盲源分离的基本函数来衡量信号独立性和非高斯性或者稀疏性。 当假信号具有统计独立性,且没有时间结构时,高阶统计量方法是求解盲源分离问 题的基段(间接或直接的),这种方法对多于一个高斯分布的源信号不适用。