当前位置：文档之家› 麦克风阵列语音降噪技术一-Read

麦克风阵列语音降噪技术一-Read

噪声
噪声的幅度谱的平方谱相减
不同的音乐噪声幅度谱的平方 music1 music2 music3
▪ 第一次谱相减：将含噪语音的幅度谱的平方减去标准纯噪声的幅度谱的平方。
▪ 第二次谱相减：将第一次谱相减的结果减去第一帧音乐噪声的幅度谱的平方。
▪ 第三次谱相减：将第二次谱相减的结果减去第二帧音乐噪声的幅度谱的平方。
三、噪声的分类
1.噪声是扣除被测信号真实值后的各种测量值，可能来自外界环境、物理系统、操作人员等。广义将噪声称为干扰。
2.按性质分为：脉冲噪声（爆炸、撞击和放电）;周期性噪声（如交流电的干扰）; 平稳噪声（如白噪声）和非平稳噪声（如色噪声）；按噪声和信号相关的性质分为加性噪声和乘性噪声。
主话筒和参考话筒获得的信号是语音和噪声在话筒处迭加后的混合信号。
主话筒
+
输出
话
+
S(e j ) e jarg( X (e j )) s(n)
☆幅度谱平方运算的原因
（1）噪声与语音信号不相关；
E
X
(e
j
)
2
E
S (e
j
)
2
E
D(e
j
)
2
E S(e j ) D*(e j ) E D(e j ) S*(e j )
E
X
(e
j
)
2
E
S (e
j
)
2
E
D(e
j
)
2
语音增强技术（Speech Ehancement ）
§1 语音增强技术的基本知识 §2 语音增强的原理和方法
§1 语音增强技术的基本知识
一、语音增强的定义二、语音增强的意义三、噪声的分类
一、语音增强的定义
语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后，从噪声背景中提取有用的语音信号，抑制、降低噪声干扰的技术。一句话，从含噪语音中提取尽可能纯净的原始语音。
2. 军事通信中，指挥员的作战命令和战斗员的战情汇报都需要用语言来表达，由于战斗环境恶劣，特别是炸弹产生的冲击性噪声，使有用信号完全淹没在噪声中。
（3）侦听技术中需要语音增强
（4）语音识别技术需要语音增强
在实际生活中，语音信号无时无地不受各种噪声干扰。人们正常的生活环境就是一个声级为60dB左右的噪声环境。被强噪声污染的场合，噪声达 120dB以上。
E
D(e
j
)
2
利用语音信号的短时平稳性，加之噪声信号的平稳性。由于傅立叶变换不会改变信号的统计特性，在一帧中， X (、e j ) 和S(e j ) 都是D平(e j稳 ) 的。因此，在一帧内可用单个值来代替均值。
X (e j ) 2 S (e j ) 2 D(e j ) 2
PX () PS () PD ()
1
2
3
4
5
6
x
7 104
2
4
6
8
10
x
12 4
10
1
2
3
4
5
6
7
x
8 4 10
§2 语音增强的原理和方法
一、频域语音增强技术二、时域语音增强技术三、时频语音增强技术四、麦克风阵列语音降噪技术
一、频域语音增强技术(宽带噪声)
是语音信号中的一种重要技术，由于其原理简单所以被广泛使用，如手机中的降噪处理就是采用的此方法，其中谱相减法是频域语音增强技术的常用方法。
cocktail party effect
y(n) s1(n) s2 (n) s3(n)
Speaker 1 Speaker 2 Speaker 3
Blind source separation: Separate one speech source from another
Channel Impairment
将含噪语音信号和有声/无声判别得到的纯噪声信号进行DFT变化，从含噪语音幅度谱的平方中减去纯噪声的幅度谱的平方，然后开方，得原始语音谱幅度的估值，再借用含噪语音的相位，进行IDFT变化，得到增强的语音。
2. 谱相减法的数学推导
首先假设语音和噪声信号是线性叠加的，且语音和噪声是平稳的，噪声与语音信号不相关。
▪ 依次类推
级联谱相减
标准纯噪声
含噪语音
标准纯噪声幅度谱的含噪语音幅度谱平方平方
第一次谱相减
第一次谱相减 500 music1
第二次谱相减
0
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
500
music2
0
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
500
第三次谱相减 music3
0
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
400
第四次谱相减
200
0
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
400
200
0
0
1000
2000
3000
4000
5000
6000
7000
8000
-0. 6
-0. 8 0
2
4
6
8
10
x
12 4
10
0. 5
0. 4
rnfmusic.wav
0. 3 0. 2 0. 1
0
-0. 1
-0. 2
-0. 3
-0. 4
-0. 5 0
0. 6
asfalarm.wav
0. 4 0. 2
0
-0. 2
-0. 4
-0. 6
-0. 8 0
1 0. 8
rnfwailsiren.wav 0.6 0. 4 0. 2 0 -0. 2 -0. 4 -0. 6 -0. 8 0
幅度谱相减
残留的音乐噪声幅度谱的平方
☆音乐噪声帧的获得
▪ 将任意两帧纯噪声的幅度谱的平方进行相减，可作为音乐噪声幅度谱的平方的估计值。将多帧纯噪声的幅度谱的平方减去同一帧纯噪声（标准纯噪声）的幅度谱的平方，得到不同的音乐噪声幅度谱的平方的估计值。
标准纯噪声第一帧第二帧第三帧第四帧
对上式两边取数学期望有：
E
X
(e
j
)
2
E
S (e
j
)
2
E
D(e
j
)
2
E S(e j ) D*(e j ) E D(e j ) S*(e j )
由于噪声与语音信号不相关，且傅立叶变换不会改变信号之间的相关性，上式中，最后两项均为0。则上式简化为：
E
X
(e
j
)
2
E
S (e
j
)
2

-0. 2
-0. 4
-0. 6
-0. 8 0
1
2
3
4
5
6
7
8
9
x
10 4
10
0. 5
0. 4
asfradio.wav
0. 3 0. 2 0. 1
0
-0. 1
-0. 2
-0. 3
-0. 4 0
1
2
3
4
5
6
7
x
8 4 10
0. 8
0. 6
0. 4
asfsportscar.wav
0. 2 0
-0. 2
-0. 4
Original speech
compression
Fading Channel degraded speech
Enhancement restored speech
二、语音增强的意义
保证通信的正常进行，需要语音增强。
1.日常生活中，经常会遇到在噪声干扰下进行语音通信的问题。例如在汽车、火车上使用移动电话，马路旁和市场里的公用电话等。
1. 谱相减法（Spectral Subtraction）的基本原理 2. 谱相减法的数学推导 3. 谱相减法的特点 4. 改进的谱相减算法
1. 谱相减法的基本原理（流程图描述）
x(n) s(n) d(n)
x(n) DFT X (ej )
＋
X (e j ) 2
－ D(e j ) 2
含噪语音
插入相位
PX ()
1 N
X (e j ) 2
由于平稳噪声的功率谱在发声前和发声后可以认为基本没有变化，利用有声/无声判决的纯噪声信
号 d来(n估) 计噪声的功率谱，PD从(而) 有：
PS () PX () PD ()
S (e j ) 2 X (e j ) 2 D(e j ) 2
开方后，再借用含噪语音的相位
x(n) s(n) d (n) X (e j ) S (e j ) D(e j )
X (e j ) X * (e j ) S (e j ) D(e j ) S (e j ) D(e j )* X (e j ) 2 S (e j ) S*(e j ) S (e j ) D*(e j ) D(e j ) S*(e j ) D(e j ) D*(e j ) X (e j ) 2 S (e j ) 2 D(e j ) 2 S (e j ) D*(e j ) D(e j ) S *(e j )

e商务文档

麦克风阵列语音降噪技术一-Read

相关文档推荐：