当前位置:
文档之家› 语音信号处理-第03章 语音信号的时域分析方法
语音信号处理-第03章 语音信号的时域分析方法
白噪声信号
相关分析的依据
修改坐标的自相关函数波形
• 用于确定两个信号在时域内的相似性。常用 的物理量为自相关函数和互相关函数。 • 当两个信号的互相关函数大时,则说明一个 信号可能是另一个信号的时间滞后或提前; • 当互相关函数为0时,则两个信号完全不同。 • 自相关函数用于研究信号本身,如波形的同 步性和周期性。
PG ( x ) = [ 3 8πσ x x ] e
1 2 − 3x 2σ x
PL ( x) =
− 1 e 2σ x 2σ x
2x
二、零均值 三、非平稳时变信号;短时平稳:10~30ms
§3.2语音信号短时分析方法
语音信号的开窗分析技术: (1)均匀窗: (2)非均匀窗:各种国际标准 (3)重叠窗(Overlap) 设:语音信号为S(n),加窗语音记为 Sw(n) = W[S(n)] = S(n) w(n-m),n=0~(N-1) 则语音处理系统可表示为
5
基于能量和过零率的双门限法检测法
首先用短时能量做第一次判断,然后在此基础上 用短时平均过零率做第二次判断。 这种方法端点的确定与以后的判决无关,因此称 为显式法。
三、短时相关分析
短时自相关函数性质 • 1. R w( −l ) = R w(l ) 为偶函数; • 2. 在-N+1~N-1之间有值; • 3. R ( 0 ) = ∑ s ( n ) ≥ R ( k ) 为最大值。 • 4.当时域信号为周期信号时,自相关函 数也是周期性函数,两者周期相同。 浊音:呈现‘准’周期性、逐渐衰减
男声汉语拼音s的一帧信号(在采样频率为22050Hz 的情况下,取20ms作为一帧),清音的短时能量为 3.88。
二.短时过零率分析
• 过零率定义:信号跨越横轴的次数情况。 • 对于连续信号,观察语音时域波形通过 横轴的情况; • 对于离散信号,相邻的采样值具有不同 的代数符号,也就是样点改变符号的次 数。
• 1.在浊音下M0的概率密度高,因此设一高阈 值Mh,当M0>Mh时,可判断出语音信号前后两 点N1和N2,使(N1,N2)区间为有声音区。 • 2.确定精确起终点:再设置一个低阈值ML, 由N1向前找,当M<ML时有N3;由N2向后找,当 M<ML时有N4,则(N3,N4)区间为语音区。 • 3.根据无声时Z均值设置ZT,由N3向前,N4向 后计算过零率Z,Z>3ZT的部分仍为语音区; 至Z<3ZT时,得(N5,N6),搜索结束。
2
1
0 .3
0 .8
0 .2
0 .6
0 .4
0 .1
0 .2
0
0
-0 . 2
-0 . 1
-0 . 4
-0 . 2
-0 . 6
-0 . 8
-0 . 3
-1
0
50
100
150
200
250
300
350
400
450
-0 . 4
0
50
100
150
200
250
300
350
400
450
女声汉语拼音a的一帧信号(在采样频率为 22050Hz的情况下,取20ms作为一帧),浊 音的短时能量为78.61。
清 音 谱
五.Gabor变换和小波变换
平稳信号的分析工具: Fourier变换:将信号分解为正弦波的线性组 合。 非平稳信号的分析工具: Wavelet变换:将信号分解为小波的• 声道的共振峰特性对基音周期的估计造 成干扰,这是因为语音信号包含丰富的 谐波分量。基音频率的范围分布在50~ 450Hz左右。同时,第一共振峰通常在 200~1000Hz的范围内,这样可能导致语 音的谐波分量高于基频分量,对基音周 期的估计造成错误。
-2000
正弦波周期信号的自相关函数波形
-3000
0
1000
2000
3000
4000
5000
6000
6
1
0 .5
相关函数的作用
• 1.区分清/浊音。 浊音的自相关函数具有一定的周期性。 清音的自相关函数不具有周期性,类似噪 声,有点如语音信号本身。 • 2.估计浊音信号的周期,即估计基音周期。
0
-0 . 5
常用语音信号短时分析特征参数
(1)短时能量 E0
E0 = ∑ S w ( n ) = ∑ S w 2 ( n )
2 n=0 n =0 N −1 N −1
(2)短时平均幅度 M0
M 0 = ∑ Sw (n)
n =0 N −1
(3)短时平均过零率 Z0
Q = ∑ W[s(k)]h(n − k)
n k=-∞
t n
过零情况
3
1
短时平均过零的作用
• 1.区分清/浊音: 浊音平均过零率低,集中在低频端; 清音平均过零率高,集中在高频端。 • 2.从背景噪声中找出是否有语音,以及语 音的起点。
0 .8
0 .6
0 .4
0 .2
0
-0 . 2
-0 . 4
-0 . 6
-0 . 8
-1
0
50
100
150
200
250
语音信号处理
Speech Signal Processing
长春工业大学图像工程研究所 史东承教授
dcshi@ 2010.8
第三章 语音信号的分析方法
§3.1 语音信号的统计特性
一、概率密度函数: 语音信号是非平稳超高斯随机信号;近似 Gamma分布,可用 Laplace 分布近似。
用MATLAB的函数randn,产生一帧高斯白噪 声,其自相关函数图。说明清音是噪声激励的 正确性。
8
利用信号的相关性达到消除噪 声的目的
• 主信号s+n0,为有用信号s(来自信号源) 和一个与它不相关的噪声信号混合而成。 • n1为另外拾取的噪声参考信号,与n0相关。 主输入信号x=s+n0 +
-1
0
50
100
150
200
250
300
350
400
450
原始语音信号
100 50 0
-5 0
自相关函数波形
0 50 100 150 200 250 300 350 400 450
-1 0 0
女声汉语拼音a的一帧信号(在采样频率为 22050Hz的情况下,取20ms作为一帧),自相关 波形图。说明浊音的自相关函数具有一定的周 期性。
4
在实际应用中,短时平均过零率容易受到A/D 转换是的直流偏移、50Hz交流电源的干扰以及 噪声的影响。 减少这些干扰可以有两种方法:一种是采用带 通滤波器消除信号中的直流和50Hz低频分量; 另一种是用过门限率来修改过零率,减少随机 噪声的影响。
x(n) Hb(ejw) w Bandpass filte Hb
因
0 50 100 150 200 250
序列 号n
-0.75
序列 号n
4 3 2 1
1.0
s ( exp ( jw) ) = S ( exp ( jw) ) ⊗ W ( exp ( jw) )
w
s ( n ) = s ( n ) ⋅W ( n )
w
,所以
0.8
0.6
• 对于方窗:W(exp(jw))上下冲较大,由 于 Sw(exp(jw))与S(exp(jw))差距较大,此 称为Gibbs效应。
80
原始语音信号和其自相关函数波形
60
Auto-Correlation Peaks
40
20
0
-20
-40
-60
0
50
100
150
200
250
300
350
400
450
500
7
0 .4
0 .2
原始语音信号
原始语音信号
0
-0 . 2
-0 . 4
0
50
100
150
200
250
300
350
400
450
3 2 1 0 -1 -2
∞
Z
0
1 ⎧ N −1 ⎫ = ⎨∑ sgn ⎡ s w ( n ) ⎤ − sgn ⎡ s w ( n − 1) ⎤ ⎬ ⎣ ⎦ ⎣ ⎦ 2 ⎩ n =1 ⎭
1
(4)短时自相关函数 Rw
R (l ) = ∑ s (l + n ) s (n ) = ∑ s (n ) s (n + l )
w n = −∞ w w n =0 w w
N −1 n=0 2 w w w
清音:Rw(0)较大,衰减很快 静默:Rw(0)小,衰减很快
1
3000
0.5
正弦波信号和其自相关函数具有相同周期
2000
0
-0.5
-1
1000
0 1000 2000 3000 4000 5000 6000
正弦波周期信号
3000 2000 1000
0
-1000
0 -1000 -2000 -3000 0 1000 2000 3000 4000 5000 6000
∞
N − l −1
短时能量E0、短时平均幅度M0和短时 平均过零率Z0的分布特性 短时能量 平均幅度M0 过零率Z0
(5)短时傅立叶变换 Fn
E0
S (exp( jw))
w
DTFT ( S W ( n) ) = ∑S W ( n) exp ( − jwn)
n=0
N −1
(6)短时功率谱
| S w ( exp ( jw ) ) |2 =
过门限率反映了穿过正负门限的次数,如果 存在随机噪声,只要信号没有超过[-T,T]的 范围,就没有有过零率产生。