当前位置:文档之家› 盲源分离算法初步研究

盲源分离算法初步研究

盲源分离算法初步研究一、盲源分离基本问题1.概念BSS 信号盲分离,是指从若干观测到的混合信号中恢复出未知的源信号的方法。

典型的观测到的混合信号是一系列传感器的输出,而每一个传感器输出的是一系列源信号经过不同程度的混合之后的信号。

其中,“盲”有两方面的含义:(1)源信号是未知的;(2)混合方式也是未知的。

根据不同的分类标准,信号盲分离问题可以分成以下几类:(1)从混合通道的个数上分,信号的盲分离可以分为多通道信号分离和单通道信号分离。

单通道信号分离是指多路源信号混合后只得到一路混合信号,设法从这一路混合信号中分离出多个源信号的问题就是单通道信号分离。

多通道信号分离是M 个源信号混合后得到N 路混合信号(通常N ≥M )。

从N 路混合信号中恢复出M 个源信号的问题即为多通道信号分离。

一般情况下,单通道信号分离的难度要超过多通道信号分离。

(2)从源信号的混合方式上分,可将信号盲分离问题分为瞬时混合和卷积混合、线性混合和非线性混合等不同种类。

在目前信号盲分离的研究文章中,所建模型大部分为瞬时混合。

但是,作为更接近实际情况的卷积混合方式正受到越来越多的关注。

(3)根据源信号的种类,也可将信号盲分离分为多类。

在通常的处理方法上,根据不同种类信号的特点,也有一些独特的处理技术。

2.盲分离问题的描述BSS 是指仅从观测的混合信号(通常是多个传感器的输出)中恢复独立的源信号,在科学研究和工程应用中,很多观测信号都可以假设成是不可见的源信号的混合。

所谓的“鸡尾酒会”问题就是一个典型的例子。

在某个场所,多个人正在高声交谈。

我们用多个麦克风来接受这些人说话的声音信号。

每个人说话的声音是源信号,麦克风阵列的输出是观测信号。

由于每个麦克风距离各个说话者的相对方位不同,它们接受到的也是这些人的声音信号以不同方式的混合。

盲信号分离此时的任务是从麦克风阵列的输出信号中估计出每个人各自说话的声音信号,即源信号。

如果混合系统是已知的,则以上问题就退化成简单的求混合矩阵的逆矩阵。

但是在更多的情况下,人们无法获取有关混合系统的先验知识,这就要求人们从观测信号来推断这个混合矩阵,实现盲源分离。

3.混合模型信号的混合模型包含两个方面的内容:(1)源信号的统计特征;(2)源信号的混合方式。

3.1源信号的统计特征已有的研究表明如果加上源信号间相互独立的限制条件,就可以有效地补偿对以上先验知识的缺乏。

如果用q i 表示第i 个分量的概率密度函数,则这种统计独立性可以表示为:11221()()...()()nn n i i i q s q s q s q s ==⨯⨯⨯=∏q(s) 其中q(s)是s 的联合概率密度函数。

3.2源信号的混合方式最简单的混合模型假定各个分量是线性叠加混合在一起而形成观测信号的。

基于这样的假设,我们可以把观测信号和源信号用矩阵的方式表示为:()()t t =x Hs式中H 是n ×n 阶的混合矩阵。

基于该模型,盲信号分离()()t t =x Hs 的目标可以表述为,找到一个分离矩阵W ,使得()()t t =y Wx ,是对源信号()t s 的良好的估计,显然在最理想的情况下我们应该能找到1-=W H ,此时有()()t t =y s ,即我们完全恢复了源信号。

4.盲分离的数学模型由此我们建立这样的盲源分离的数学模型:设有N 个未知的源信号()i s t ,i=1,…,N 构成一个列向量1()(),...,()TN t s t s t ⎡⎤=⎣⎦S ,其中t 是离散时刻,取值为0,1,2…。

设A 是一个M ×N 维矩阵,一般称为混合矩阵。

设1(t)(),...,()T M x t x t ⎡⎤=⎣⎦X 是由M 个可观察信号(t)i X ,i=1,…,M 构成的列向量,且满足下列方程: (t)()t =X AS , M ≥NBSS 的问题是,对任意t ,根据已知的(t)X 在A 未知的条件下求已知的()t S 。

这构成了一个无噪声的盲分离问题。

设1()(),...,()TM N t N t N t ⎡⎤=⎣⎦是由M 个白色、高斯、统计独立噪声信号()i N t 构成的列向量,且(t)X 满足下列方程: (t)()()t N t =+X AS , M ≥N则由已知的(t)X 在A 未知的条件下求已知的()t S 的问题是一个有噪声盲分离问题。

5.信号盲分离的不确定性需要指出的是对瞬时混合信号盲分离,当源信号可以精确恢复的情况下应有1-=W A ,在假设条件的约束下,盲源分离问题是可解的,只不过存在两个不确定性,即恢复的源信号的幅度不确定和源信号各分量次序的不确定性。

5.1分离结果的幅度存在不确定性由于在X =AS 中,A 和S 均未知,如果将S 中任一分量i S 扩大a 倍,只需将A 中相应的混合系数乘以1/a ,上式仍成立。

在观测信号幅度不变的前提下,源信号的幅度存在不确定性。

因此,在求解独立分量时,往往事先假设S 具有单位方差{}21i E S =,且各分量均值为零。

5.2分离结果的排序存在不确定性由于A 和S 的未知,公式X =AS 中独立分量的顺序可能会被调换,在X =AS 中插入一个置换矩阵P 和它的逆矩阵P -1,得到-1X =AP PS ,将-1AP 看成新的混合矩阵,则PS 中的各分量便成为新的已调换顺序的独立源i S 。

这表明ICA 分离结果存在顺序上的不确定性。

二、独立分量分析1.独立分量分析介绍目前的盲信源分离方法主要都是基于神经网路的ICA 独立分量分析方法,ICA 是20世纪90年代发展起来的一种新的型号处理技术,最早是由Comon 提出的,它是从多维统计数据中找出隐含因子或分量的方法。

从线性变换和线性空间角度,源信号为相互独立的非高斯型号,可以看作线性空间的基信号,而观测信号则为源信号的线性组合,ICA 就是在源信号和线性变换均不可知的情况下,从观测的混合信号中估计出数据空间的基本结构或者说源信号。

所以说ICA 的任务和目的就是在只有传感器观测数据的条件下恢复独立的源信号,而这些传感器观测数据是那些不可测量的独立源信号经过未知线性混合后的输出。

2.独立分量分析的线性模型ICA 是伴随着BSS 问题发展起来的,ICA 的目的是对任何t ,根据已知的X(t)在A 未知时求未知的S(t),ICA 的思路是设置一个N ×N 维反混合阵(w )ij =W ,X(t)经过W 变换后得到N 维输出列向量Y(t),1()(),...,()TN Y t Y t Y t ⎡⎤=⎣⎦,考虑如下线性瞬时混合信号系统模型,即假设传输是瞬时的,也就是不同信号到达各个传感器的时间差别可以忽略不计,并且传感器接收到的是各个源信号的线性组合,即有 ()()()t t t ==Y WX WAS整个过程可以表示成如下图:如果通过学习得以实现WA =I (I 是N ×N 维单位阵),则()()t t =Y S ,从而达到了源信号分离目标。

3.ICA 问题中的基本假设由于源信号来自不同的信号源,所以一个合理的假设是认为各个源信号S i (t)之间是统计独立的。

用f(s)表示源信号矢量s(t)的联合概率密度函数,而用f 1(s 1),…,f N (s N )分别表示源信号的边际概率密度函数,则源信号矢量各个分量之间的统计独立性假设描述为:11221()()()...()()Nn n i i i f s f s f s f s f s ==⨯⨯⨯=∏ 即源信号矢量s(t)的联合概率密度函数为其各分量的边际概率密度函数的乘积。

这一源信号的统计独立性假设,是已有的绝大多数信号源盲分离算法的基础出发点。

除了对源信号矢量s(t)各个分量之间的统计独立性假设之外,还需要对混合矩阵做出合理的假设。

显然,如果能求出矩阵A 的广义逆矩阵A -1,则有-1()(t )S t A X =为使盲分离问题可解,必须保证混合矩阵A 的左逆存在,因此盲分离问题总假设混合矩阵A 是列满秩的。

综上所示,ICA 的几个基本假设条件来解决BSS 问题:(1)各源信号S i (t)均为0均值、实随机变量,各源信号之间统计独立。

(2)源信号数M 与观察信号数N 相同,即N=M ,这是混合阵A 是一个确定且未知的N ×N 维方阵。

假设A 是列满秩的,逆矩阵A -1存在。

(3)各个S i (t)的概率分布函数中最多允许有一个具有高斯分布。

(4)各观察器引入的噪声很小,可以忽略不计。

源信号与观察信号之间的关系N=M 。

(5)关于各源信号的概率分布函数要略有一些先验知识。

4.对信号的预处理在使用ICA 算法之前进行一些预处理通常是十分有利的。

它们常使ICA 估计问题变得更加简单。

最常见的预处理过程有两个,一是去除信号的均值,另一个事白化。

4.1信号的零均值化对观测信号去均值是ICA 算法最基本和最必须的预处理步骤,其处理过程是从观测信号中减去信号的均值向量(x)m =E ,使得观测信号成为零均值向量。

这意味着ICA 得到的源信号的S(t)估计y(t)也是零均值的,该预处理只是为了简化ICA 算法,并不意味着均值不能估计出来。

用去均值数据估计分离矩阵W 后,可以在源信号的估计Y 上加上均值,此时所加的均值矢量是-1A m ,m 为在预处理过程中所减去的均值。

4.2白化一般情况下,所获得的数据都具有相关性,所以通常都要求对数据进行初步的白化或球化处理,因为白化处理可去除观测信号之间的相关性,从而简化了后续独立分量的提取过程,而且通常情况下,数据进行白化处理与不对数据进行白化处理相比,算法的收敛性较好,有更好的稳定性。

但是当混合矩阵A 为病态矩阵或者某些源信号较其他源信号强度弱很多时,白化可能使ICA 很难甚至不可能实现分离。

5.独立分量分析独立性的度量ICA 以统计独立性为基本原则,统计独立的衡量为ICA 算法的关键。

5.1非高斯性极大非高斯性的存在是ICA 方法必须的前提条件,如果随机变量都是高斯分布,那么ICA 方法也就没有研究的必要。

实际上,自然界中的大部分随机信号都是超高斯或亚高斯分布,真正满足高斯分布的很少,因此ICA 具有极其重要的意义和广泛的应用前景。

基于非高斯性极大的ICA 思想来自于中心极限定理,中心极限定理表明,当一组均值和方差为同一数量级的随机变量共同作用的结果必接近于高斯分布。

因此,如果观测信号是多个独立源的线性组合,那么观测信号比源信号更接近高斯分布,或者说源信号的非高斯性比观测信号的非高斯性要强。

根据这一思想,我们可以对分离结果的非高斯性进行度量,当其非高斯性达到最大时,可以认为实现最佳分离。

5.2互信息量最小互信息通常为非负值,只有当变量之间相互独立时,互信息为0。

相关主题