当前位置:文档之家› 3第三章 语音信号分析---时域分析 语音信号处理 课件

3第三章 语音信号分析---时域分析 语音信号处理 课件


6/17/2020
7
011 010 001
/2 000 111
110 101 100
6/17/2020
8
量化误差(噪声) e(n)=x(n)- xa(nT) -/2 e(n) /2
(1)假设量化噪声是平稳的白噪声过程,有
E[e(n)e(n+m)]=
2 m0 =其0他
(2)假设量化噪声与输入信号不相关,有
预滤波器是一个带通滤波器,一般情况下,上、 下截止频率为: fH=3400Hz, fL=60~100Hz。
6/17/2020
4
2.采样: 将时间连续信号
变成时间离散信号。 采样频率通常为
fs=8kHz。
6/17/2020
xa(t) t
xa(nT) n
5
• Ideal sampling and real sampling
• A/D of some common audio signals
Telephone
Frequency scope
200-3400
Sampling frequency
8 khz
Quantizati on bits
8 bits
Wide band 50-7000
16 khz
16 bits
Broadcasti ng
帧移T 帧长N
6/17/2020
15
1 0 n N 1 w(n) 0 otherwise 矩形窗(rectangular)
w(n)
0.5 0
0.5
cos(2 n ) 0 n N
N 1 otherwise
汉宁窗 hanning
1
w(n)
0.54
0.46
co s (2
n) N 1
0
E[e(n)x(n+m)]=0 m为任意值
(3)在每个量化间隔上,量化噪声均匀分布,有
Pe(e(n))=
1 |e(n)| /2
0 其他
6/17/2020
9
量化信噪比
量化噪声的信噪比:SNR=x2/e2 x2语音信号序列的方差, e2噪声序列的方差, 用
分贝表示,SNR=10log(x2/e2) SNR = signal’s energy / noise’s energy
6/17/2020
21
Long window: frequency resolution time resolution
Short window: frequency resolution time resolution
基音频率为200Hz,采样频率为8kHz, 窗长: 8000{(1/200)7}=256
6/17/2020
10
SNR=6.02B+4.77-20log(Xmax/x)=6.02B- 7.27
Xmax表示其峰值 B为量化的比特数 当语音信号的幅度服从拉普拉斯分布时,Xmax=B=8,SNR=40dB,满足一般通信系统的要求。当 量化噪声的信噪比达到 60-70dB,才能保障有高 水平通话质量,这时要求量化为 11-13bits。一 6般/17/2的020 音频A/D、D/A转换芯片,量化为12bits。 11
x(n)
H(z)=1-z-1 x'(n)
6/17/2020
14
2. 加窗分帧处理:
加矩形窗
第n帧 第n+1帧 第n+2帧 第n+3帧 第n+4帧
加汉宁窗 hanning
第n帧 第n+1帧 第n+2帧
t
各帧之间有0~1/2的重叠, 由窗函数的定义决定的。
w(n)=0.5*[1-cos(2n/(N-1))]
CD
20-15khz 20-20khz
37.8 khz 44.1 khz
16 bits 16 bits
二、预处理
1.存储方式:
已量化好的语音信号序列按 先入先出的顺序存入数据区。 以便一个有限容量的数据区来 应付数量极大的语音数据。
6/17/2020
13
2.预加重:
在求语音信号频谱时,频率越高,相应的成 分越小。预加重的目的是提升高频部分,使信号 的频谱变得平坦。以便于频谱分析和声道参数分 析。 一般在语音信号数字化后,通过一个一阶 数字滤波器:H(z)=1-z-1, 接近1。
第三章 语音信号分析
§3.2 §3.3 §3.4 §3.5 §3.6
语音信号的数字化和预处理 语音信号的时域分析 语音信号的频域分析 语音信号的倒谱分析 语音信号的线性预测分析
6/17/2020
1
一、预滤波、采样和A/D转换
1.预滤波的作用:抑制输入信号中频率超出fs/2的 所有分量,防止混叠;抑制50Hz的电源工频干扰。
6/17/2020
20
由于在 10-30ms,语音信号近似平稳。每秒的 帧数约为:33~100帧。
窗口的长度N:频率分辨率f=fs/N。f随N的增加 而减少,频率分辨率得到提高,但时间分辨率降低(与 窗长成反比)。应根据不同的应用场合来选择窗口的长 度N,应包含7个基音周期,因此可选择100~300点 为宜。
加矩形窗(帧移长度为N) x0(m)
第1帧
x1(m) 第2帧
0
N-1 N
2N-1
帧重叠 T=0
加汉宁窗(帧移长度为N/2)
第1帧
0 x0(m)
N-1
第2帧
帧重叠T= N/2
N/2
x1(m) N+(N/2)1
6/17/2020
19
512点的汉宁窗 当采用汉宁窗 ,原有数据的幅度发生变化, 为了保持数据的原始幅度,必须采取各帧数据之 间有1/2的重叠。
6/17/2020
22
Windowing (frame)
– In short-term, non-stationary->stationary – Non-linear->linear (10ms-25ms)
海明窗 hamming
0 n N 1 otherwise
6/17/2020
16
Window shapes
xn(m)w(m)x(nm) 0mN1 N为帧长
1 w(m)0
0mN1 n0,1T,2T,...T.为, 帧
others

长度
x0(m)
0
N-1
x1(m)
T
T+N-1
6/17/2020
18
6/17/2020
6
3. A/D转换
对离散时间信号进行量化,在每一时刻对xa(nT) 独立进行量化,把给定的幅度连续的信号变成为有限 多个幅度的集合中某个幅度值的过程。
xa(t)
采样 xa(nT) 量化
x(n) x(n)=Q[xa(nT)]
x1
xk
xk+1
xL
xa1
xak
xak+1
xaL
xaL+1
相关主题