第八章 语音增强
2.
语音包含元音和辅音两种音素:从时域波形 上看,浊音(包括元音)具有明显的准周期 性和较强的振幅,清音类似白噪声并有较弱 的振幅。
语音信号短时谱的统计特性在语音增强中有 着举足轻重的作用。(据中心极限定理,语 音的短时谱的统计特性服从高斯分布。)
5
3.
二、
1.
人耳感知特性
对于声波频率高低的感觉与实际频率的高低不呈线性 关系,而近似为对数关系;对频率的分辨能力受声强 的影响;对语音信号的幅度谱较为敏感,对相位不敏 感。
2
8.1 概述
二、语音增强的意义 1. 日常生活中,经常会遇到在噪声干பைடு நூலகம்下进
行语音通信的问题。例如在汽车、火车上使用
移动电话,旁人的喧闹声,马路旁和市场里的
公用电话等。 2. 军事通信中,指挥员的作战命令和战斗员 的战情汇报都需要用语音来表达,由于战斗环 境中的声环境恶劣,特别是炸弹产生的冲击性 噪声,使有用信号完全淹没在噪声中。
x(n)=s(n)+d(n)
|D'(ejw)|
|S'(ejw)|
ejarg(X(jw))
IDFT
原始语音谱幅度的估值
s'(n)
13
1.减谱法的基本原理描述 将含噪语音信号和有声/无声判别得到的 纯噪声信号进行DFT变化,从含噪语音谱幅度的 平方中减去纯噪声的谱幅度的平方,然后开方,
得原始语音谱幅度的估值,再借用含噪语音的
人耳掩蔽效应:产生一个声音由于另外一个声音的出 现而导致该声音能被感知的阈值提高的现象。 语音增强的最终效果度量是人耳的主观感觉,所以在 语音增强中可以利用人耳感知特性来减少运算代价。
2.
6
三、 噪声特性
1.
加性噪声:冲激噪声、周期噪声、宽带噪声、语音 干扰噪声等 非加性噪声:残响及传输网络的电路噪声(非加性 噪声往往可以通过某种变换转为加性噪声)
相位,进行IDFT变化,得到增强的语音。
14
蓝色为原始含噪语音 黄色为减谱法处理的结果
15
3、时频语音增强技术
为了达到更好的消噪效果,可将自适应消 噪技术和谱相减结合起来。
主输入信号
自
适
谱
相 减 消 噪
16
增强语音
参考信号
应 消 噪
原始含 噪语音
基本自适 应抗噪输 出结果 自适 应抗噪与 谱相减相 结合后的 输出结果
第八章 语音增强
8.1 概述 8.2 语音特性、人耳感知特性及噪声特性
8.3 语音增强的原理和方法
1
8.1 概述 一、语音增强的定义
第八章 语音增强
语音增强是指当语音信号被各种各样的噪声 干扰、甚至淹没后,从噪声背景中提取有用的语 音信号,抑制、降低噪声干扰的技术。一句话,
从含噪语音中提取尽可能纯净的原始语音。
3
(3)窃听技术中需要语音增强 (4)语音识别技术需要语音增强 在实际生活中,语音信号无时无地不受各种噪 声干扰。人们正常的生活环境就是一个声级为60dB 左右的噪声环境。被强噪声污染的场合,噪声达 120dB以上。
4
8.2语音特性、人耳感知特性及噪声特性
一、
1.
语音特性
语音信号的短时平稳特性。
0 . 6
0 . 4
0 . 2
0
- 0 . 2
- 0 . 4
- 0 . 6
- 0 . 8
0
0 .5
1
1 . 5
2
2 .5
3 x
3 . 5 1 0
4
17
9
通过语音增强技术来改善语音质量的过程如下图所示
滤波法 自相关抗噪法 非线性处理法 减谱法 Weiner滤波法
10
8.3 语音增强的原理和方法
一、滤波法语音增强技术 1 陷波器法
对于周期噪声采用陷波器是比较简便和有效的 方法,设计的陷波器的幅频曲线的凹处对应于周期噪 声的基频和各次谐波,并使这些频率处的限波宽度足 够窄。
2.
7
四、噪声的度量
声压、声强和声功率 (1)声压级(SPL):Lp=20lg(P/P0) P0=20uPa 声压就是有声波存在时,在单位面积上大气压的变化 部分 ,最弱的声音声压为0.00002 Pa,最强的声音 的声压为20 Pa。 (2)声强级:LI=20lg(I/I0) I0=1012W/m2 声强是指单位面积上通过多少瓦的声能,单位是W/m2 (瓦/平方米)。 (3)声功率级:Lw=20lg(W/W0) W0=1012W 声功率是指声源在单位时间内向外辐射出的总声能
带噪 语音 DFT 频谱整形器 IDFT 增强 语音
11
2 自适应滤波器 自适应滤波器能有效地在未知环境中跟踪时变 的输入信号。使输出信号达到最优,所以可以用来 构成自适应的噪声消除器。
12
二、减谱法语音增强技术 含噪 语音
DFT |X(ejw)| 插入 相位
2
+
-
纯噪 平方 DFT
声
d'(n)
8
噪声源和噪声环境 飞机附近 织布车间 地铁 繁华街道 普通谈话
声压/Pa 200 20 0.63 0.063 0.02
声压级/dB 140 100 90 70 60
安静房间 耳语 树叶沙沙声 农村静夜 听阈
0.002 0.00063 0.0002 0.000063 0.00002
40 30 20 10 0