1、立论依据
课题来源及研究的目的和意义:
信号处理技术在实际应用中一直具有非常重要的作用,随着科技的飞速发展,信号处理技术面临巨大的挑战,比如在移动通信技术中,发射端发射未知信号,称之为源信号[1],怎样只根据接收端接收的信号判别同时提取出源信号,成为一项值得深入探索的难题,为此产生了盲信号处理理论,称之为盲源分离(Blind Source Separation,BSS)[2]。
盲源分离理论来源于“鸡尾酒会”模型,即在酒会上众多人讲话声音与音乐声以及其它各种声音混杂在一起,致使我们难以得到感兴趣的某些声音信号,这类问题的显著特点就是源信号与传输信道参数均是无法预知的,要想从麦克风采集到的混叠声音中获取我们想要得到的声音信号,具有很大难度。
但是盲源分离可以解决此类问题,从而可以从麦克风的混叠声音中分离出想要得到的声音信号。
由此可得,盲源分离[3-5]可以解释为在源信号和传输信道模型参数均为不可预知的情况下,按照所输入信号数学特征,只通过观测所得混合信号来重构并分离得到源信号的过程。
传统解决盲源分离的算法有主成分分析法(Principal Component Analysis,PCA)、独立分量分析法(Independent Component Analysis,ICA)[6-7]等方法,尤其ICA较大程度促进了盲源分离的进步,许多学者在此算法基础上进行改进并创新。
欠定盲源分离(Underdetermined Blind Source Separation,UBSS)是盲源分离中的一种特殊情况,即观测信号的数目少于源信号的数目。
欠定盲源分离模型的系统为不可逆的,因而研究起来比较困难,解决欠定盲源分离问题已经不能使用传统解决盲源分离的方法。
在实际应用中许多信号在一定条件下具备稀疏特性,该稀疏特性可以体现在时域或变换域中[8],因此有学者提出稀疏分量分析方法(Sparse Component Analysis,SCA),有的称为稀疏表示(Sparse Representation)[9-10]解决欠定盲源分离问题。
其中“两步法”是解决基于稀疏分量分析的欠定盲源分离的常用方法,“两步法”的第一步是使用聚类或者势函数方法估计混合矩阵;第二步根据估计的混合矩阵重构源信号。
在实际应用中,通常许多信号在时域中并不是稀疏信号,但是在时频域会呈现出一定稀疏性,对于时域中非稀疏信号利用稀疏变换工具,如傅里叶变换、短时傅里叶变换、小波变换和Gabor变换等,使该信号在其对应变换域中表现出良好的稀疏性。
然后利用信号在时域或其变换域中的稀疏特性实现对欠定盲源信号的分离。
本文在对国内外研究现状深入分析的基础之上,主要针对源信号稀疏性较弱的情况,对欠定盲源分离混合矩阵的估计方法进行了探索。
针对传统许多算法解决欠定盲源分离问题时存在需要已知源信号数目的局限性与混合矩阵估计精度不高的不足,进行改进与完善。
最后通过实验仿真与数据分析表明本文所研究的方法具有一定理论研究价值。
2、文献综述
国内外研究现状及分析:
BSS模型开始由法国Herault与Jutten提出,他们于1991年提议H-J方法[9],此方法对应两路源信号和两路混合信号,采用递归连接的神经网络,应用梯度下降方法,不停调节网络权值,最终实现输出信号误差达到最小,从而达到盲源分离结果。
此后BSS在国际上被高度重视并被广泛探索。
Cardoso早期研究了四阶累积量的代数性质,提出了基于矩阵联合对角化的预白化(Joint Approximate Diagonalization of Eigen matrix,JADE)算法[10]。
Comon详细研究源信号的可分离性[11],总结出独立分量分析(Independent Component Analysis,ICA)方法,并成功实现了盲信号分离,促使此方法迅速成为热门方法,极大促进了BSS进步。
随后文献[12]利用峰度理论,结合近似负嫡准则,改进ICA方法得到FastICA,提高了ICA算法的收敛速度,降低了算法复杂度,得到了广泛应用与研究。
虽然ICA已趋于成熟,但是要求源信号的数目需满足不大于观测信号的数目,因此不再适用UBSS。
但在实际应用中,欠定盲源分离模型比较普遍,因此许多学者针对欠定盲源分离模型进行了积极探索与研究。
由于欠定盲源分离模型的系统为不可逆的,直接求分离矩阵不再适用,要解决欠定盲源分离需要另外开辟新的途径,Lewicki首次提出信号稀疏性[13]概念,并利用此特征对欠定数学模型下的盲信号进行分离,该方法随后被称为稀疏分量分析方法(SCA)。
SCA由此开始被广泛研究,并成为解决UBSS的前沿办法。
随后Fabian Theis利用SCA在无噪声条件下较好实现欠定盲信号分离。
2000年,Jourjine和Rickard在时频掩蔽算法基础之上,提出了基于退化分离估计技术[14](Degenerate Unmixing Estimation Technique,DUET)方法,需使得信号在加窗并且之间不叠加正交(W-Disjoint Orthogonality,WDO)前提之下,可以有效解决瞬时模型中的UBSS。
随后Yilmaz等人将此算法经过完善,放宽信号前提标准,最终经过将观测信号时频比统计组建直方图,通过寻找峰值坐标预估矩阵,同时形成掩蔽模板预估源信号[15]。
2001年,Bofill基于信号稀疏分量分析理论提出“两步法”原则,第一步利用势函数方法预估混叠矩阵,第二步依据已经得到的混叠矩阵分离源信号,成功地从两路观测信号中分离出六路源信号[16],虽然此方法的参数选择缺乏理论指导并且只能应用两路观测信号,但是该方法仍然成为SCA“两步法”的经典算法。
其中第一步混合矩阵的估计在整个盲源分离过程中具有十分关键性的作用,估计所得的混合矩阵的精度将直接影响源信号的恢复程度。
随后出现了K-均值聚类(K-means)法以及模糊C-均值聚类(Fuzzy C-means,FCM)方法,经过寻找聚类中心[17]来获得估计矩阵,此后聚类方法与势函数方法常用在解决UBSS的第一步。
2004年,李远清等人在Bofill所提理论基础之上,根据源信号的稀疏性以及两步法原则,提出利用K-means估计混合矩阵[18],随后经过解l1范数最小化值恢复出源信号。
Deville和
Abrard在混合信号时频比(Time Frequeney Ratio of Mixture,TIFORM)算法[19-20]中提出了单源时频窗的概念,经过查验观测信号时频比在接连时频窗里是否保持不变,确定单源区间,之后估计混合矩阵。
Georgiev提出了源信号的稀疏程度与可分离关系[21],此研究的提出较大程度上促进了欠定盲源分离的发展。
2006年,李远清针对混合矩阵的估计研究改进了基于DUET和混合信号时频比方法(Time-Frequency Ratio of Mixtures,LITROM),对混合矩阵估计方法进行创新,经过算出观测信号时频比矩阵[22],查验拥有同样列矢量的子矩阵从而完成各个单源点检验,然后获得估计矩阵并较好恢复了源信号。
此方法能够降低对信号的稀疏度的要求。
随后许多学者针对单源时频点展开了深入研究。
2009年,Kim凭据单源时频点数据相应的时频比为实数的特点,提出了一种单源时频点检测算法[23],放宽对信号稀疏性要求,随后利用K-means聚类方法获得预估矩阵。
而Reju等学者采用单源时频点的实部矢量和虚部矢量方向相同[24-27]的特性,另外提议了一种判定单源时频点的方法,增强了信号的稀疏度[28-30],之后采取聚类方法估计混合矩阵,减小估计误差。
2002年,Shindo H等学者初次结合图像处理领域中的霍夫变换[31]方法(Hough Transform, HT),把对原图形空间中直线方向检验变为对变换空间里峰值点检测,经过统计峰值点数目与坐标预估源信号数目与矩阵。
但是霍夫变换方法对源信号的稀疏性要求比较严格,稀疏度较低则容易出现峰值簇拥问题,进而导致无法准确估计混合矩阵。
针对霍夫变换方法容易出现的峰值簇拥问题,出现了把K-means聚类与霍夫变换相结合的方法[33],但是采用K-means 必须预先知道源信号数目,并且此方法依赖聚类中心选择。
而基于密度空间的聚类(Density Based Spatial Clustering of Applications with Noise,DBSCAN)方法[34],不需要预先设定聚类个数,就能较好实现采样点分类。
实际往往源信号数量[35]是无法预知的,因而解决此估计问题对BSS进展方向具有明确指示价值。
为了解决此问题,Bofill使用了势函数方法,经过检测势函数局部最大值数目确定源信号数量。
建立在两步法原理基础之上,提出概率统计方法[36]成功完成了源信号数量的估计。
但是上述势函数法以及概率统计方法仅适用于二维观测信号,并且对信号稀疏度要求比较高。
针对此问题,提出了基于拉普拉斯势函数方法[37],该方法借助聚类方法预估势函数局部最大值,能够准确得到源信号数目[38]。
而针对源信号的恢复与重构[39],通常的解决方法是线性规划方法,常用的有求解l1范数的最小化以及最短路径方法恢复源信号。
伴随压缩感知(Compressed Sensing,CS)理论的发展,开始将基于压缩感知[40]的SCA方法用于解决语音信号的增强和噪声分离。
对于源信号重构部分,利用压缩感知结合K均值奇异值分解(K-means Singular Value Decomposition,K-SVD)方法,大大促进了源信号重构方法迅猛发展。