当前位置:文档之家› 心音信号的识别与分类

心音信号的识别与分类

心音信号的识别与分类王衍文 王海滨 综述 程敬之 审校(西安交通大学生物医学工程与仪器系,西安 710049) 摘要 综述了心音信号识别与分类的基本方法(统计分析方法、神经网络方法)及其研究进展,并对各种方法中存在的主要问题进行了探讨。关键词 心音 模式识别 人工神经网络RecognitionandClassificationofHeartSoundsWangYanwen WangHaibin ChengJingzhi(DepartmentofBiomedicalEngineeringandInstrumentation,Xi'anJiaotongUniversity,Xi'an 710049) Abstract Thispaperreviewsthemethodsandresearchadvancesofrecognitionandclassificationofheartsounds.Themethodsincludethestatisticaltechniquesandartificialneuralnetwork.Italsodis-cussesthemainproblemsinthemethods.Keywords Heartsounds Patternrecognition Artificialneuralnetwork1 引 言随着现代社会物质生活水平的改善,心血管疾病的发病率和死亡率已越来越高。统计资料表明,在我国因心血管疾病死亡者占总死亡人数的44%。美国1978年报道了4000万人有不同形式的心血管疾病,死于心脏病者近100万人。可见,心脏病已成为危害人类健康的多发病和常见病。因此,心脏系统疾病的防治和诊断成为医学界面临的首要问题之一。心音是心脏及心血管系统机械运动状况的反映,其中包含着心脏各个部分本身及相互之间作用的生理和病理信息。心音信号的识别与分类对心血管系统疾病的诊断具有重要的意义,其准确性、可靠性的好坏决定着诊断与治疗心脏病患者的效果。早期的心音识别与分类是医生根据听诊结果来完成的,显然这一过程具有一定的主观性且可靠性不高。随着信号处理与分析技术的不断发展,对心音的研究也逐步由定性分析进入了定量分析的阶段。国内外许多生物医学工程研究人员将传统的模式识别方法,以及神经网络方法用于心音的识别与分类,期望实现心音的自动解释和自动诊断,以便向临床医生提供实用的辅助诊断信息。此外,心音的识别与分类还有助于对心音产生机制的理解。心音信号识别与分类的方法是多种多样的,本文重点介绍了实际中应用较多的基于统计分析以及神经网络的识别与分类方法。2 统计模式识别方法统计模式识别方法是在对模式结构进行测量和变换的基础上进行分类的。基于统计方法的分类器的性能取决于特征和特征向量的概率分布,这些方法把模式作为随机向量对待,实际上意味着同一类型的模式的分布近似是高斯型生物医学工程学杂志JBiomedEng 1999∶16(3)∶382~387 的,通常运用线性方法把特征或性质聚类。根据心音的参数模型提取心音信号的特征参数,用统计分析的方法建立判别函数,采用逐步多元分析来自动筛选特征量,以提高分类的效果。这其中有Joo[1]和Bement[11]的极-零点模型法。他们根据临床经验选择出特征矢量x=[f1f2],其中f1和f2为对应两个最大谱峰处的频率,且f1处的功率大于f2处的功率。采用以最大熵为准则的Steightz-McBride法(8个极点、8个零点的极-零点模型)求得经过瓣膜修复术后的主动脉瓣关闭音。分类器为二次高斯型,它以双曲线型式将特征空间分为两个部分,根据特征矢量在特征空间的分布区域差别是正常或异常心音。对20例样本的分类结果表明,正确识别率为17/20。而在误判中除一例远离临界线外,其它两例均位于临界线附近。90年代初Durand等[2]针对猪心生物替换二尖瓣的关闭音,研究了它的模式识别。他们分别采用高斯-贝叶斯模型和基于最邻近原则的距离测量算法,并比较了两种模式识别方法检测瓣膜变性的诊断特性。研究中通过两类指导学习处理来决定由6个或更少的参数组成的最优判别模式,分类器的错误概率用“余一”法来估计。此后的进一步研究中[3],他们结合四种窗函数的两种谱分析方法(快速富里叶变换、AR模型),采用两类分类器(贝叶斯模型、基于最邻近原则的距离测量算法)检测心脏瓣膜的特性。对95个病人进行了评估,其中47个病人在主动脉瓣施行猪瓣膜生物修复(24人正常,23人瓣膜变性),48个病人在二尖瓣施行猪瓣膜生物修复(19人正常,29人瓣膜变性)。对于每一类瓣膜,从瓣膜关闭音谱中提取21个参数对识别系统进行训练和测试,并在21个参数中选择2~5个综合参数进行估计。结果表明,FFT结合最近点分类器具有最佳性能:用汉宁窗对主动脉瓣的正确分类率为87%,用矩形窗对二尖瓣的正确分类率为94%。采用AR模型的结果为:用最近点分类器结合汉宁窗对主动脉瓣的正确分类率为81%,用贝叶斯分类器结合海明窗对二尖瓣的正确分类率为92%。对心脏的生物动力学模型的分析表明[4,14],心脏是一个非线性的、时变的复杂系统。因此,心音信号具有很强的非平稳性和随机性,这种随机性与呼吸状态、心脏的血流动力学状态以及人所处环境等各种不确定因素有关。统计模式识别方法的局限性在于,规范化的特征向量限制了识别系统的灵活性,使得系统对可获取信息的利用率降低,在一定程度上影响了系统的性能。3 神经网络模式识别人工神经网络是由非处理单元组成的非线性大规模自适应动力系统。它采用分布方式存储信息,具有联想记忆的功能,其处理单元执行非线性运算,使网络具有很强的自适应和容错能力,用它进行信号处理和模式识别可以更接近于人类思维。人工神经网络还具有许多优良的特性:(1)非线性 在人工神经网络中,神经元处于激活或抑制两种状态,在数学上表现为非线性关系。具有阈值的神经元过程构成网络有更好的性能,可以提高容错性和存储容量;(2)非局域性 神经网络的整体行为不仅取决于单个神经元的特征,而且更多地取决于各个神经元之间的相互联接、相互作用;(3)非定常性 神经网络具有自适应、自组织和自学习能力,在处理信息的同时,其非线性动力系统本身也在不断地变化;(4)非凸性 神经网络具有多个较稳定的平衡态,导致系统演化的多样性。总之,人工神经网络是在结构上模仿生物神经连接的系统,能够设计来进行模式识别工作。但是,神经计算不同于统计模式识别,它不是算法型的方法。因此,神经网络系统需要有存储信息的能力,而且是可以训练的,即系统经过383第3期 王衍文等。 心音信号的识别与分类训练后对于任何给定的输入都能给出期望的输出。神经网络模式识别系统的某些组成部分经常是用试算法得到的,而且它是不稳健的。如果要解决的不是一个特定的问题,而是一个一般性的问题,那么就需要一组系统。3.1 网络输入特征矢量网络输入特征矢量的确定,在神经网络模式识别方法中具有重要的作用。输入特征的选取直接关系着网络识别方法及结果的准确性,对于生物医学信号而言,常用的网络输入特征有时域波形、线性预测系数、预测误差、带通滤波器组、短时富里叶变换谱、倒谱以及小波变换谱。3.1.1 时域波形特征矢量 时域波形包含着信号的所有信息,对于确定性信号,或信号的随机变化不很大并且数据长度在一定范围的随机信号,可以作为神经网络的输入特征。德国Paderborn大学的研究人员研究了不同的心脏监护方法,将神经网络用于估计心收缩期和心舒张期,用于从心音图输入信号分析先天性和后天性心脏病[9]。把心音数据不加任何预处理或只做简单的滤波处理后直接作为神经网络的输入,其优点在于体现客观真实性,发挥神经网络自动提取特征和进行模式识别与分类的功能,避免了数据处理方法中人为因素的渗入。但是也存在一定的缺点:(1)输入数据较多,使得网络规模大,计算代价高,需要学习的样本多;(2)对于心音信号而言输入节点的含义不明确,通常要求网络具有移不变性,使得网络结构较为复杂。此外,心音信号既是非平稳的又是非线性的,其时域波形的幅值和相位均呈现随机性的变化。直接将心音图作为网络的输入特征,由于信号随机变化的影响,不易对心音进行准确的分类。因此,心音图多用于临床上辅助诊断,而在一般的网络识别系统中不常采用。3.1.2 线性预测系数特征矢量 对心音信号建立模型(AR或ARMA)得到线性预测系数,是获取心音信号特征的方法之一。线性预测系数具有较高的压缩率,并且能够反映信号的大部分信息。Akay[5,6]将神经网络用于冠状动脉声音的检测,作者首先利用自适应线性增强方法减小舒张期心音的背景噪声,再对滤波后的心音计算平均自相关函数延迟,采用修正的Yule-Walker自回归模型,用于计算平均线性预测系数的每个病人的数据要经过10个心周期的平均,在每个病人的记录上计算已滤波的线性预测系数。并将这些参数形成一个10点模拟特征矢量,作为神经网络的输入。所用神经网络为三层BP网络,对网络的测试表明,10个输入节点、10个隐层节点和2个输出节点的网络性能最佳。网络正确识别了64个冠状动脉疾病病人中的50个以及36个无明显阻塞病人中的32个,网络的检出率为78.1%、假阳性率为11.1%。作为神经网络输入的线性预测系数是信号分成若干段,然后对每一段建立AR模型得到的,并且假定每段信号是平稳的零均值随机信号。对于心音信号,由于生理和环境等因素的影响,每一心动周期的信号具有明显的时变性和随机性。因此,从严格的意义上来说,具有非平稳特性的心音信号本身不满足建立AR模型的条件。不难理解采用AR模型对心音信号建模,并且以线性预测系数作为识别特征而产生识别分类误差的原因。此外,在心音信号建模过程中,模型介数的确定也是至关重要的。一般情况下,AR模型阶数过低,会使AR谱不能准确反映信号的谱峰,表现在线性预测系数上,会使信号的部分信息丢失;而AR模型阶数过高,可能导致AR谱产生分裂,造成线性预测系数包含错误信息。目前各种确定AR模型阶数的准则均不很理想,在实际应用中通常依靠试验来确定阶数。另外对于带噪声的信号,模型的性能下降很快。3.1.3 倒谱特征矢量 心音的倒谱是对心音信号进行同态处理得到的,同态处理对一段心音信号的对数谱的富里叶反变换进行线性滤384生物医学工程学杂志 第16卷波,并将其分离或解卷为两个分量,一个可认为是心胸声传输系统的冲激响应,另一个可视为瓣膜的振动和血液流动产生的激励源的作用。同态处理中假设信号可以表示为线性的、随时间慢变化的系统的输出。对于某些心音信号,它们满足此条件。例如二尖瓣狭窄时的全收缩期杂音,其激励源产生于收缩期血液由心室向心房时狭窄的二尖瓣的振动。对此类杂音进行同态处理,可以得到心杂音的源特性和基音周期,据此可以估计二尖瓣瓣膜的狭窄程度等生理病理参数。然而,对于大多数心音信号同态处理的前提条件常常难以满足。Durand[4]的研究结果表明,心胸声传输系统具有很强的时变性,在心动周期的不同时刻,心脏的动力学特性是有差异的。显然心音信号不能表示为随时间慢变化的线性系统的输出。此外,产生心音的激励源不止一个,并且各激励源之间的相互作用呈随机性。因此,从理论上讲,对心音信号进行同态处理得到的倒谱有可能造成生理含义的混淆,以倒谱作为神经网络的输入,其识别结果也不会准确。3.1.4 短时富里叶变换谱特征矢量 短时富里叶变换是一种应用较为广泛的时频分析方法,它假设非平稳信号为短时平稳的,采用滑动窗截取信号,对截取的信号作富里叶变换得到信号的谱图。分析窗的类型和长度对结果的影响是很关键的。但是无论怎样选择窗,短时富里叶变换的时间分辨率和频率分辨率总是矛盾的,这是由测不准原理所决定的,也就是说不可能同时获得较高的时间分辨率和频率分辨率。在具体应用时,应根据信号的时频域特征,合理选取窗函数及相应参数。Guo等[7]设计了一个三层BP网络用于检测在主动脉瓣植入生物替代性瓣膜的瓣膜关闭音,并对其进行分类。他们分别以富里叶变换谱和线性预测系数作为网络的输入特征矢量,研究结果表明,隐层单元在2~20之间较为合适,对于不同的输入特征矢量,其最佳网络结构分别为:5-7-2(功率谱特征为输入特征矢量),12-9-2(线性预测系数为输入特征矢量)。对47个病人的分析结果表明,以功率谱特征为输入特征矢量的网络的正确识别率为85%,以线性预测系数为输入特征矢量的网络的正确识别率为89%。3.1.5 小波变换谱特征矢量 所谓小波就是满足可容性条件的具有特殊性质的函数或称小波基函数,而小波变换就是选择适当的基本小波或称母波,通过对基小波平移、伸缩而形成一系列的小波,然后将欲分析的信号投影到由平移、伸缩小波构成信号空间之中。这种平移、放大、缩小是小波变换的一个特点,因而可以在不同的频率范围、不同的时间位置对信号进行分析。小波变换以其对信号的非线性成分的反映能力及其稳健性越来越广泛地用于生物医学信号的分析中。文献[10]设计了一个适合于对信号的时频谱进行分类的两维ART-2神经网络,利用小波变换谱作为神经网络的输入特征,实现了识别系统的特征提取、特征压缩和特征定位。文中采用二进非正交小波变换,小波基函数为Mor-let小波。分析结果显示采用该小波基有助于消除心音信号中较强的相位随机性的影响,使小波变换谱在各个尺度上的分布具有较好的稳定性,提高了网络识别的性能。而采用离散正交的小波分解得到的在各个尺度上的信号成分含有相位信息,其小波变换谱稳定性较差,不利于网络的正确识别。根据该神经网络对36例第一心音的分类结果表明,小波变换谱对于心音信号的快变成分具有很高的分辨能力,能对心音信号进行准确定位;ART-2神经网络具有好的稳定性、快速的识别能力和较强的抑制噪声的特性,并且是无监督的学习。3.2 神经网各类型的选择至今,人们已经提出了数十种神经网络模型,并以其独特的优越性在生物医学信号处理和生物医学信号模式识别中得到越来越多的应385第3期 王衍文等。 心音信号的识别与分类

相关主题