当前位置:文档之家› 结点阈值小波包变换语音增强新算法

结点阈值小波包变换语音增强新算法


analvsis
abilitv SO
that

it
can
better
simulate
the Irequencv
analvsis
characteristics
ot
human
ear.In this
pal
.a

new
algornittnhmm。 is pDrroposseed
ftoort spoeeeecclh3
fO.oV,0<厂<500
z={0.oovf+1.5,500≤f<1 220
(1)
t 61n f一32.6, f≥1 220
令小波多分辨分析中的滤波器系数分别为h孟和g孟,
f咖(右)=∑h孟dp(2t—k) I_哕(右)=∑g孟dp(2t一尼)
图1 Bark尺度小波包分解结构示意图
Fig.1 Decomposition structure of Bark--scaled wavelet package transform
进行Bark尺度小波包变换,采用结点阈值法进行阈值操
作,选取参数为。
噪声为白噪声时,进行了不同信噪比下的对比实验,对
比算法为R.Martin提出的谱减法。实验结果表明,信噪比
较高时,本文算法接近谱减法,而信噪比较低时则远远优于
谱减法。图3给出了信噪比为一5 dB时的实验结果。
1 ∞

赵0
1吨nⅢ}
一1 O


1●


11






1●
nOUS nOlSe con(1ltlons.esoeelaLlV UnCIer cOlor noise ano non-statlonarV nOlSe con(1ltlons.
Key words:speech enhancement;Bark-scaled wavelet packet decomposition;node threshold;spectral entropy method
2 ∞ ¥
._.…▲…■L..I一-一…~.
-一11 寇0
二1£衄l
一一_r。
-2

0.5

1.5

t|S
(d)谱熵法增强后的语音信号
(d)Enhancing speech with spectral entropy
图3信噪比为一5 dB的含白噪声的语音信号增强结果
Fig.3
Enhancement results of speech signal containing white noise while SNR is一一1气 I dB
(2)计算结点n处的归一化谱熵

Entropy(711)=∑P咖log P咖
(6)
(3)估计频谱强度和噪声标准差,确定结点阈值
利用直方图估计每一结点的频谱强度,并设辅助阈:
o(n)=Entropy(n)·NUM凡·卢
(7)
于是得到噪声标准差:
吒,孟=nb×W
(8)
式中:儿6为大于o(n)的直方条数目,w为直方条的宽
收稿日期 万:方20数06-据06 Received Date:2006-06
结果中存在音乐噪声,因此达不到令人满意的效果。 MMSE和维纳滤波方法计算量适中,但没有提供在语音 信号的失真和残留噪声之间进行控制的机制。
基于小波变换的信号去噪是近年来发展起来的去噪 新方法,它利用信号和噪声的小波系数在各尺度上的不 同分布特性,采取阈值的方法,达到去除噪声的目的∞J。 常用的小波变换去噪法一刮以阈值的形式虽然可以对带 噪语音去除噪声,但去噪同时也丢失了大量语音清音信 息,严重影响了重建信号的质量。小波包变换是在小波 变换基础上进一步提出的,具有很好的频带划分功能。 文献[9—10]采用小波包变换对语音信号进行增强,但这 些方法是在高斯白噪声前提下提出的,具有很大局限性,
—IJ_● L.
—__1I
O.5


1.5
t/s
_o r。
(a)原始纯净语音信号 (a)Pure speech signal
_ _

5 ∞ ≮
越0
1衄
-£=L
-5 O
O.5

1.5

t/s
(b)信噪比为一5 dB的带噪语音信号
(b)Speech signal with SNR is-5 dB
t/s
(c)谱减法增强后的语音信号 (c)Enhancing speech with spectral subtraction
幅值很小,所余系数主要由语音信号控制。因此阈值法对
小波系数设置一个门限,仅利用超过门限的那些显著的小
波系数来重构语音信号,这样可较好地去除噪声。
常规小波阈值方法是在高斯白噪声前提下提出的,
在小波包分解情况下,阈值为人=叮以ln(儿l092 N),盯=
MAD/O.674 5,MAD是第一层小波系数的绝对值取中
图中针对8 kHz的采样信号,在原1 7个频带分解基 础上,对625 Hz以下频带和3 000~4 000 Hz频带进一步 分解,使其子带中心频率相差1/2 Bark,最终得到24个 子频带。(m,儿)表示对信号进行第m级分解得到的第儿 个结点。对16 kHz采样信号可在高频带做进一步分解。 图2是对应小波包分解得到的子带中心频率与人耳实际 特性的比较图,实线代表按式(1)得到的人耳bark—Hz曲 线;水代表本文提出的24子频带bark尺度小波包分解结 构。从图2中可见,采用的小波包很好地模拟了人耳听 觉特性。
1引
...:L一

由于环境的影响,语音识别系统不可避免的受到各 种噪声的污染,系统性能下降。为此,人们提出许多语音 增强算法来从带噪语音中尽可能地提取纯净的原始 语音。
一般来说,语音增强的方法分为2大类:时域方法 (如子空间法)u剖和频域方法(如谱减法旧J、最小均方误 差(MMSE)估计M1和卡尔曼滤波法∞1等)。时域方法一 般计算量较大,而频域法计算量较小,其中,谱减法是近 年来研究较多的方法,它具有计算量小的特点,但在处理
提出了一种新的基于结点阈值的小波包变换语音增强算法。采用Bark尺度小波包对含噪语音进行分解,在语音信号的子带层
次上进行阈值操作,并采用软阈值方法进行阈值处理。采用谱熵法估计结点噪声。实验表明,该算法在多种噪声,尤其是有色
噪声和非平稳噪声条件下均有较好的语音增强效果。
关键词:语音增强;Bark尺度小波包分解;结点阈值;谱熵法
与实际应用环境并不符合,因此,本文采用谱熵法帕1估计
噪声,步骤如下:
(1)用小波包分解系数直方图估计每一终端结点的
频谱密度函数(设直方图中有B个直方条)
Pn,b=蒜,¨1,2,…,B
(5)
式中:儿配m砌为在直方条b中的小波系数C舶的数目,
NUM凡为该终端结点的系数总数目,n=1,2,…,24是结
点(.7,k)的序列号,按频率大小排列。
纯净语音样本来源于安静环境下8 kHz采样的自然
连续语音,噪声来源于噪声数据包NoiseX92,选取了白噪
声(White)、F1 6战机噪声(F1 6)、粉色噪声(Pink)、工厂
噪声(Factoryl)和汽车噪声(Car)。通过改变噪声强度,
构造不同信噪比的含噪语音。采用5阶Daubechies小波
本文在上述研究的基础上提出了一种新的阈值选取
方法,称之为“结点阈值法",它是对每个小波包树的终
札=吒,孟痂 端结点应用不同的阈值,表示为:
(4)
式中:盯舶是小波包树终端结点(歹,k)处的噪声标准差。
这种阈值取法突破了高斯白噪声和平稳噪声的局限性。
在上述各种阈值中,都存在噪声标准差盯的估计问
题。传统的MAD估值方法是在高斯噪声前提下提出的,
第28卷第5期 2007年5月
仪器仪 表学 报
Chinese Journal of Scientific Instrument
VoL 28 No.5 May 2007
结点阈值小波包变换语音增强新算法
王娜,郑德忠 (燕山大学电气工程学院秦皇岛066004)
摘 要:人耳频率分辨率是非线性的,而小波包算法有灵活的时频分析能力,可较好的模拟人耳基底膜的频率分析特性。本文
耳Bark域频率频率感知特性相似的小波包分解结构,称之 为“Bark尺度小波包分解"。常规方法是模拟人耳的24个 频率群,对于8 kHz采样的语音信号,选取1至第17个频 率群,得到的每个子带的中心频率相差1 Bark。实验证实, 如果对Bark域进行更细致的划分,对语音的描述会更加细 致,也不会导致较大的计算量u1|。因此,本文提出一种新 的小波包分解结构,如图1所示。
卜(右)=在∑厄(尼)lZn(2t一尼)



I_配2州(右)=在∑厄(尼)lZn(2t一尼)
冀 o
if-
万方数据
图2 小波包分解对人耳Bark域频率描述的模拟示意图
Fig.2 Illustration of simulating Bark field frequency



,I

perception characterlstlc o土human ear using wavelet
package d小波语音增强新算法
基于阈值的小波域语音增强算法是一种直观而有效 的去噪方法。语音信号与噪声的小波变换呈现的特性截
954
仪器仪表学报
第2 8卷
然相反,语音信号的小波变换模值随小波尺度的增加而增
加,而噪声的模值随小波尺度增加而减小。这样,连续若
干次小波变换后,噪声所对应的小波变换系数基本去除或
相关主题