EMDEmpirical Mode Decomposition经验模态分解美国工程院院士黄锷1998年提出一种自适应数据处理或挖掘方法,适用于非线性、非平稳时间序列的处理。
1.什么是平稳和非平稳时间序列的平稳,一般是宽平稳,即时间序列的方差和均值是和时间无关的常数,协方差与与时间间隔有关、与时间无关。
未来样本时间序列,其均值、方差、协方差必定与已经获得的样本相同,理解为平稳的时间序列是有规律且可预测的,样本拟合曲线的形态具有“惯性”。
而非平稳信号样本的本质特征只存在于信号所发生的当下,不会延续到未来,不可预测。
严格来说实际上不存在理想平稳序列,实际情况下都是非平稳。
2.什么是EMD经验模态分解方法?EMD理论上可以应用于任何类型时间序列信号的分解,在实际工况中大量非平稳信号数据的处理上具有明显优势。
这种优势是相对于建立在先验性假设的谐波基函数上的傅里叶分解和小波基函数上的小波分解而言的。
EMD分解信号不需要事先预定或强制给定基函数,而是依赖信号本身特征自适应地进行分解。
相对于小波分解:EMD克服了基函数无自适应性的问题,小波分析需要选定一个已经定义好的小波基,小波基的选择至关重要,一旦选定,在整个分析过程中无法更换。
这就导致全局最优的小波基在局部的表现可能并不好,缺乏适应性。
而EMD不需要做预先的分析与研究,可以直接开始分解,不需要人为的设置和干预。
相对于傅里叶变换:EMD克服了传统傅里叶变换中用无意义的谐波分量来表示非线性、非平稳信号的缺点,并且可以得到极高的时频分辨率。
EMD方法的关键是将复杂信号分解为有限个本征模函数IMF,Intrinsic Mode Function。
分解出来的IMF分量包含了原信号的不同时间尺度上的局部特征信号。
这句话中:不同时间尺度=局部平稳化,通过数据的特征时间尺度来获得本征波动模式,然后分解or筛选数据。
本质上,EMD将一个频率不规则的波化为多个单一频率的波+残波的形式。
原波形=ΣIMFs+余波信号()t f筛选出的本征模函数IMF包括余波,对应有实际的物理成因。
现实中的信号分量IMF不会保持完全稳定的频率和振幅,也常常无法从各个分量中直接看出信号规律。
EMD分解经常被用作信号特征提取的一个预先处理手段,将各IMF分量作为后续分析方法的输入,以完成更加复杂的工作。
3.IMF的筛选过程第一步:Get原数据曲线f(t)所有极大值点,三次样条插值函数拟合成原数据的上包络线;Get原数据曲线f(t)所有极小值点,三次样条插值函数拟合成原数据的下包络线。
第二步:上包络线和下包络线的均值or中位数曲线m(t)(在图中显示为中间的包络线,即平均包络线),均值or中位数记为ml原数据-平均包络=IMFF(t)-m(t)=H(t)第三步:如果hl中还存在负的局部极大值和正的局部极小值,说明这还不是一个本征模函数,需要继续进行筛选,重复前两步,直到SD(筛分门限值,一般取0.2~0.3)小于门限值时停止。
具体过程如图所示:所分解出来的各个IMF分量包含了原信号的不同时间尺度的局部特征信号。
第四步:残差r(t)=f(t)-H(t),重复前三步,直到r(t)满足预先设定的条件。
如果成功完成筛选过程,获得第一个IMF,可以通过原始信号减去先前提取的IMF,再一次重复上述过程二获得下一个IMF。
依此类推,直到提取完所有的IMF为止,即残差只包含不超过2个极值时停止。
整个过程不是基于严格的数学计算,而是基于经验。
4.EMD分解基于以下假设条件:(1)数据至少有两个极值,一个最大值一个最小值;(2)数据的局部时域特性是由极值点间的时间尺度唯一确定;(3)如果数据没有极值点但有拐点,则可以通过对数据微分一次或多次求得极值,然后再通过积分来获得分解结果。
IMF的约束条件:即每个本征模函数IMF都应该满足的两个条件(1)在整个数据范围内,局部极值点和过零点的数目必须相等,或相差数目为1。
(2)在任意时刻,局部最大值的包络,即上包络线,和局部最小值的包络,即下包络线,的平均值必须为0.IMF图像特征:曲线要反复跨越x轴,且不能在某次穿过零点后出现多个极点;包络线要对称。
图一为原始信号;图二到七为EMD分解后得到的6个IMF分量,IMF1~IMF5;图八为残差。
每个IMF都满足约束条件。
5.EMD存在的缺陷,改善方法?IMF分解时存在模态混叠现象,也就是说当信号的时间尺度存在跳跃性变换、信号极值点分布不均匀时,对信号进行EMD分解,一个IMF中会包含不同时间尺度的特征成分。
原因一方面由于原始信号频率特征的影响,另一方面是EMD算法本身的缺陷。
模态混叠的出现,使EMD分解得到的IMF分量失去了物理意义。
历史解决方案:黄锷曾经提出过中断检测的方法,即直接对结果进行观察,如果出现模态混叠则重新分解,需要人为进行后验判断。
重庆大学谭善文提出了多分辨率的EMD方法,对每一个IMF规定一个尺度范围来解决模态混叠,这种方法牺牲了EMD良好的自适应性。
黄锷2009年提出EEMD,一种噪声辅助信号处理方法,更好的解决模态混叠问题。
(2)在分解出IMF的过程中需要进行多次迭代(?),而停止迭代的条件缺乏明确的标准,所以不同的停止条件下,得到的IMF也是不同的。
(3)端点效应端点效应是影响经验模态分解精度的主要因素,即在筛选过程中上下包络在数据序列的两端会出现发散现象,并且这种发散还会逐渐向内,“污染”整个数据序列从而使得到的IMF严重失真;在对得到的IMF进行Hilbert变换时,信号的两端也会有端点效应问题出现。
端点效应会增加一些虚假成分,信号的总能量也随之增加。
历史解决方案:Huang等人提出采用"特征波"延拓法来抑制信号的端点效应,是根据信号的频率和幅值在信号两端添加一个特征波,但是如何确定合适的特征波是一个难题。
程军圣等人提出一种支持矢量回归机的延拓方法,先构造一个回归机模型,再用该模型对数据两端点之外的值逐个预测。
其他方法:直接以数据端点作为极值点多项式拟合算法神经网络延拓算法镜像闭合延拓法极值点与对称延拓相结合基于自回归模型的数据延拓方法等6. 什么是所谓的EEMD ?它怎么解决模态混叠问题?Ensemble Empirical Mode Decomposition 集成经验模态分解黄锷 2009年一种噪声辅助信号处理(NADA)方法 补充缺失尺度是EMD 的改进算法(Wu and Huang (2005)指出:"白噪声强制集合在筛选过程去排除所用可能的解决方法是必要的,这从而使不同的尺度信号在由二元滤波器组描述的适当的本征模态函数(IMF )中进行整理。
由于EMD 是时间空间分析方法,白噪声在具有足够数量的试验的情况下被平均化。
在平均过程中保留下来的唯一持久性部分是信号,然后将其视为真实且更有实际意义的答案。
“)将白噪声加入待分解的信号,利用白噪声频谱的均匀分布,当信号加在遍布整个时频空间,且分布一致的白噪声背景上时,不同时间尺度的信号会自动分布到合适的参考尺度上。
并且由于零均值噪声的特性,经过多次平均后,噪声将相互抵消,集成均值的结果就可作为最终结果。
EEMD 的特点:继承了EMD 的自适应性;引入了白噪声扰动并进行集合平均,避免了尺度混合问题,使得最终分解的IMFs 保持了物理上的唯一性。
EEMD 的步骤:(1) 向信号加入正态分布白噪声。
)()()(t n t y t y i i +=)(t y i 表示第i 次加入的高斯白噪声信号,加入的高斯白噪声的大小会直接影响信号 EEM D 避免模式混淆的分解效果。
(2) 将加入白噪声的信号分解成各IMF 分量。
对)(t y i 分别进行EMD 分解,得到的IMF 记为)(t c ij ,与一个余项记为)(t r i 。
其中,)(t c ij 表示第i 次加入高斯白噪声后,分解所得到的第j 个IMF 。
(3) 重复步骤( 1) ,( 2) ,每次加入新的白噪声序列。
(4) 将每次得到的IMF 集成均值作为最终结果。
利用不相关随机序列的统计均值为0的原理,将上述对应的IMF 进行总体平均运算,消除多次加入的高斯白噪声对真实IMF 的影响,最终得到EEMD 分解后的IMF 为)(t c j 表示对原始信号进行EEMD 分解后所得到的第j 个IMF 。
EEMD 的算法步骤:第一步:定义一个Maxlter ,表示要进行EMD 的总次数,m 表示进行EMD 的当前次数; 第二步:将信号加入白噪声,得到加噪之后的待处理信号。
用EMD 分解待处理信号,得到p 个IMF 分量m j C , ,表示第m 次分解出来的第j 个IMF 。
第三步:将Maxlter 次EMD 得到的每个阶段对应的IMF 进行求平均值,最后这个值就是通过EEMD 得到的最终IMFs 。
7. EMD 与HHT 是什么关系?HHT Hilbert -Huang Transform 黄锷等 1998年提出经验模态分解EMD 作为希尔伯特-黄变换HHT 的基础部分被提出来。
HHT 分为两个阶段:第一个阶段是使用EMD 算法获得本征模函数IMF ,第二阶段是对每一阶的IMF 进行Hilbert 变换,得到瞬时频率谱。
8. EMD 算法的难点?(1)如何获取信号的极值点,尤其是端点处的极值点判断;(2)如何判断所处理的信号不再含有IMF 分量。
EMD 的停止标准:Huang1 利用筛选前后结果得到的标准差的大小2 在相继的S 次筛选中,如果极值点和零交叉点个数相同,则筛选停止。
于德介基于能量差跟踪法的停止标准[1]刘慧婷,倪志伟,李建洋.经验模态分解方法及其实现[J].计算机工程与应用,2006(32):44-47.9. EMD 算法的应用领域包括声音识别、图像处理、地理科学等,特别是机械系统旋转件故障诊断方面,随着EMD 方法研究深度和广度的扩展,其自适应性及在非平稳信号处理中的优势特性,更多学者开始探讨其原始方法的进一步创新、优化与应用拓展。
10. EMD 算法在轨道交通机械故障诊断中的应用?综述-2008Liu B 2006 利用EMD和相应的Hilbert谱进行齿轮箱故障诊断,研究发现与连续小波变换相比能更有效地提取齿轮故障特征。
[1]Gearbox fault diagnosis using empirical mode decomposition and Hilbert spectrum. B. Liu,S. Riemenschneider,Y. Xu. Mechanical Systems and Signals Processing . 2006杨宇2006 利用EMD能量熵进行故障诊断,通过EMD将滚动轴承振动信号分解为IMF分量,然后计算每个IMF的能量,得到振动信号的能量熵,实验表明轴承外圈故障信号与内圈故障信号的能量熵不同,可以利用IMF的能量作为特征进行轴承故障诊断。