当前位置:文档之家› 语音增强子空间算法

语音增强子空间算法

4
幅度
0 -0.5
0
0.5
1 时间
1.5
2
2.5 x 10
4
S
3)对比算法处理后的测试语音的MOS(5分制),如下表:
SNR 0dB 10dB 0dB 10dB
噪声类型 babble噪声 babble噪声 汽车噪声 汽车噪声
本文改进算法 3.2 4.6 3.5 4.7
传统子空间算法 2.8 4.1 2.7 4.1
2 .语音增强算法现状
语音增强算法分类
1、谱减法 2、基于统计模型的算法 3、子空间算法
语音增强算法发展趋势
变化域语音增强算法可以充分利用变化域中语音与背景噪声较时域更为明显 的特征,且又能有效的消除语音信号在时域中存在的相关特性,因此增强效 果更明显,变化域增强算法是当今研究的热点,这是本文选取变化域语音增 强算法的主要原因。
3 .改进算法的总方案
带噪 语音
带噪语音协 方差矩阵
噪声协方 差矩阵
平稳/非平稳 噪声估计
内 嵌 预 白 化 对 角 化 矩 阵
建筑业应用软件
特 征 值 分 解 人耳 听觉 掩蔽 约束 维纳 滤波 最 优 估 计 矩 阵 增 强 语 音
4 .算法改进的要点
噪声连续频谱最小值跟踪 内置预白化处理色噪声 人耳听觉约束维纳滤波
0dB
10dB
火车站噪声
火车站噪声
3.5
4.7
3.0
4.2
3)对比算法在不同背景噪声输出语音的分段信噪比,如下表:
噪声类型 Babble噪声(0dB)
输入 (dB) 2.6824
本文算法 (dB) 3.4335
子空间算法 (dB) 2.8598
Babble 噪 声 ( 10dB ) 9.9377
汽车噪声(0dB) 汽车噪声(10dB) 火车噪声(0dB) 火车噪声(10dB) 2.8033 9.9389 2.7493 9.9800
其中 为LPC多项式, 为短时线性预测系数, 为控制共振峰区域的能量 误差的参数, 为预测阶数
2)对噪声失真进行频谱整ห้องสมุดไป่ตู้其实现过程为:
其中:
将上式结合维纳约束优化问题,解得最优线性估计器:
得函数:
,求解
知:
对于白噪声,最优估计器满足:
对于色噪声,结合内嵌预白化最优估计器满足:
5 .算法仿真分析与总结
11.2479
4.3016 11.9964 3.8230 12.2161
10.3990
3.5367 10.3867 3.6936 11.5947
总结
本文提出的基于人耳听觉掩蔽维纳滤波的改进子空间语音 算法,从三个关键要点对传统的子空间算法进行了改进优化, 克服了传统子空间语音增强算法中去除噪声过程中出现的音 乐噪声和失真问题,仿真结果表明在传统子空间算法基础上, 利用人耳听觉掩蔽效应对带噪语音的噪声频谱整形,将其集 成到维纳滤波,对获得的信号子空间进行修改,得到了最优 的估计器,滤波处理后得到的增强语音,达到了理想的去噪 效果。 此外,本文的连续频谱最小值跟踪虽然在语音段也可连续 更新估计噪声,但其存在不论噪声功率是否增加,只要带噪 语音功率谱变大,噪声估计也会跟踪变大的缺点,还有待改 进完善。
4
幅度
0 -0.5
0
0.5
1 时间
1.5
2
2.5 x 10
4
2)仿真对象为输入SNR为10dB的babble带噪语音,时域波形如图:
(a)带 噪 语 音 0.5
幅度
0 -0.5
0
0.5
1 时间
1.5
2
2.5 x 10
4
(b)纯 净 语 音 0.5
幅度
0 -0.5 0 0.5 1 时间 (c)本 文 改 进 算 法 增 强 语 音 0.5 1.5 2 2.5 x 10
1)仿真对象为输入SNR为0dB的babble带噪语音,时域波形如图:
(a)带 噪 语 音 0.5
幅度
0 -0.5
0
0.5
1 时间
1.5
2
2.5 x 10
4
(b)纯 净 语 音 0.5
幅度
0 -0.5 0 0.5 1 时间 (c)本 文 改 进 算 法 增 强 语 音 0.5 1.5 2 2.5 x 10
噪声连续频谱最小值跟踪
对噪声谱进行非线性处理,对功率谱的最小值进行跟踪:
内置预白化处理色噪声
对于色噪声,对带噪信号协方差与噪声信号协 方差矩阵进行EVD分解,其中的 角阵,我们寻找矩阵可以同时对角化 不是对 和 :
其中

分别为
的特征值和特征向量,即:
人耳听觉约束维纳滤波
1)利用信号的LPC分析所导出的感知滤波来将残留噪声 频谱适当分布以使能被信号谱所掩蔽,其传递函数如下:
• 姓名:龙志军
日期:2015年6月7
1 .应用背景
3 3 4 5 2
2 .语音增强算法现状
3 .改进算法的总方案 4 .算法改进的要点
5 .算法仿真分析与总结
1 .应用背景

语音通信是生活中不可或缺的一部分,实际通信环 境中背景噪声广泛存在,语音信号会受到这些噪声的 干扰。语音增强(speech enhancement)技术是消除噪 声干扰的重要手段,以此达到提高受损语音的质量及 可懂度的目的。语音增强技术几乎渗透到所有的语音 信号处理环节中,它在众多领域有着很好的实际应用 价值与发展前景。
相关主题