当前位置:文档之家› 语音信号处理第5讲

语音信号处理第5讲


{ arg[X (e

ln X (e j ) ln X 1 (e j ) ln X 2 (e j )
j
)] arg[ X1 (e j )] arg[ X 2 (e j )]
下面我们根据上面的讨论来分析一下复倒谱和倒谱特点和关 系。 (1)复倒谱要进行复对数运算,而倒谱只进行实对数运算。 (2)在倒谱情况下一个序列经过正逆两个特征系统变换后,不 能还原成自身,因为在计算倒谱的过程中将序列的相位信息 丢失了。 (3)与复倒谱类似,如果c1(n)和c2(n)分别是x1(n)和x2(n)的倒 谱,并且x(n)= x1(n)*x2(n),则x(n)的倒谱c(n)= c1(n)+c2(n) 。 ˆ (n) ,可以由x ˆ (n) 求出它 (4)已知一个实数序列x(n)的复倒谱 x 的倒谱c(n)。 (5)已知一个实数序列x(n)的倒谱c(n),能否用它来求出复倒 ˆ (n)? 谱x
*
ˆ ( n) y
Z
+ +
ˆ ( z) Y
exp

Y ( z)

Z
1

*
y ( n)
同态信号处理的基本原理
第一个子系统D*[]完成将卷积性信号转化为加性信号的运算, 即对于信号x(n)=xl(n)*x2(n)进行了如下运算处理:
{
(1)Z[ x(n)] X ( z) X1 ( z ) X 2 ( z)
对语音信号进行解卷,求取倒谱特征参数的方法有两种,
一种是线性预测分析,一种是同态分析处理。
同态信号处理的基本原理

日常生活中遇到的许多信号,它们并不是加性信号(即组成 各分量按加法原则组合起来)而是乘积性信号或卷积性信号,
如语音信号、图像信号、通信中的衰落信号、调制信号等。

这些信号要用非线性系统来处理 而同态信号处理就是将非线性问题转化为线性问题的处理方
1 2 1 2
同态信号处理的基本原理
ˆ (n)为加性信号,所以第二个子系统可对其进行需要的 由于 x ˆ (n) 。第三个子系统是逆特征系统D*-1[ ],它 线性处理得到 y ˆ ( n) y ˆ1 (n) y ˆ 2 (n) 进行逆变换,使其恢复为卷积性信号, 对y
{
即进行了如下处理:
2.声道冲激响应序列 由此可得声道响应序列复倒谱的性质为:
(1)双边序列
(2)衰减序列,指数衰减
(3)集中在原点附件,在[-25,25]之外倒谱比较小
据此,可以用低倒谱窗从信号的倒谱中取出声道特性的复倒谱
(分离声道、声门)
x(n) x1 (n) * x2 (n) 时间域 ˆ ( n) x ˆ1 (n) x ˆ2 (n) 倒谱域 x
均包含单位圆,因而D*[ DFT的特征系统 (1)D* [ ]= ]与D*-1[ ]系统有如下形式:
X(n)的频谱 X(n)的对数频谱 X(n)的复频谱
{
F ( xn ) X (e j )
ˆ (e j ) ln[X (e j )] X ˆ (e j )] ˆ(n) F 1[ X x
ˆ ( z) X ˆ ( z) X ˆ ( z) (2) ln X ( z) ln X1 ( z) ln X 2 ( z) X 1 2 ˆ ( z)] Z 1[ X ˆ ( z) X ˆ ( z)] x ˆ (n) x ˆ (n) x ˆ(n) (3)Z 1[ X
同态信号处理的基本原理
1)特征系统 D*

把卷积转换为和,把非线性变为线性
ln
*
x ( n)
Z
• •
X ( z)
+
ˆ ( z) X
+
Z
1

+
ˆ ( n) x
2)线性系统 L* 真正需要的处理算法,可利用信号与系统中所学过的各种处 理手段,满足线性、叠加原理 1 3)逆特征系统 D* 把和转换为卷积,把线性变为非线性
系数值小 求对数——展开为泰勒级数——逆Z变换: 于1 ln A n0 pi n mi n ak ck ˆ (n) x n 0 单位圆内 1 n km1 n n k p n 0 0 b d k k n 0 单位圆外 k 1 n k 1 n
4.5语音信号的倒谱分析 4.6语音信号的线性预测分析
语音信号的倒谱分析就是求取语音倒谱特征参数的过程, 它可以通过同态处理来实现。 同态信号处理也称为同态滤波,它实现了将卷积关系变换 为求和关系的分离处理,即解卷。 对语音信号进行解卷,可将语音信号的声门激励信息及声
道响应信息分离开来,从而求得声道共振特征和基音周期, 用于语音编码、合成、识别等。
同态信号处理的基本原理
任何同态系统都可以表示为三个子系统的级联
特征 系统 线性 系统 逆特 征系 统
*
D*
+ +
L*
+
+
D
1 *

*
x(n) x1 (n) * x2 (n) ˆ ( n) x ˆ1 (n) x ˆ2 ( n) x
ˆ ( n) y ˆ1 (n) y ˆ 2 ( n) y y ( n) y1 ( n) * y2 ( n)

声门激励信号: 浊音:x(n) ar n rN p 式中ar 为幅度,N p 为基音周期
M r 0


求x(n)的复倒谱 (2)取对数
ˆ ( z ) ln X ( z ) ln a ln 1 a z N p X 0 r r 1
M


1

以利用这个特点进行清音和浊音的判断。
2.声道冲激响应的倒谱 如果用最严格(也是最普遍的)极零点模型来描述声道响应 x(n),则有: mi m0 (1 a z 1 ) (1 b z ) 圆外
X ( z) A
实系数


k 1 pi k 1
k

k 1 p0 k 1
k
1 ( 1 c z ) (1 d k z ) k
ˆ ( z) Y ˆ ( z) Y ˆ ( z) ˆ (n)] Y (1)Z[ y 1 2
ˆ ( z) Y ( z) Y ( z) Y ( z) (2) expY 1 2
(3) y(n) Z 1[Y1 ( z) Y2 ( z)] y1 (n) * y2 (n)
从而得到卷积性的恢复信号。
用泰勒级数展开ln( )
k a Np r ˆ X ( z ) ln a0 z k 1 r 1 k M

k
1 M k Np z ln a0 ar k 1 k r 1

k
语音信号的复倒谱
在时域语音为:声门序列*声道序列。用复倒谱求解方法分析这两个序列
结论:声门激励信号的复倒谱是无限冲激序列,幅度变、周期不变,倒谱
1 。这表明, 的振幅随着k值的增大而衰减,并且衰减的速度比原序列快 ar
除原点外,可以采用“高时窗”从语音信号的频谱中提取浊音激励的频
谱——实现用复倒谱提取基音
语音信号的复倒谱
在时域语音为:声门序列*声道序列。用复倒谱求解方法分析这两个序列
法。

按被处理的信号来分类,大体分为乘积同态处理和卷积同态 处理两种。 由于语音信号可视为声门激励信号和声道冲击响应的卷积, 所以这里仅讨论卷积同态信号处理。

同态信号处理的基本原理
1)不同信号的处理方法
加性信号:线性关系、叠加原理——处理方法成熟 乘性信号: 卷积信号:非线性关系、不能用叠加原理——处理困难 2)卷积同态系统 *表示离散时间卷积运算

声门激励信号:
M 1 ˆ ( z ) (n kN ),其中 = a k, = ln a ˆ ( n) Z X x p k r 0 0 k 0 k k r 1 1
(1)声门激励源在浊音时,其倒谱只在 n kN p 点上不等于零,
其他个点上均为零。即:倒谱序列第一个非零点与原点的距 离正好为基音周期 N p (2)清音情况下,声门激励源具有噪声特性,此时的倒谱没 有明显的零点,分布范围很宽,从低时域延伸到高时域。可
语音信号两个卷积分量的复倒谱
语音信号可看做是声门激励信号和声道冲激响应两信号的卷 积,分别讨论这两个信号的复倒谱的性质。
复倒谱和倒谱
ˆ (n) 是 x(n) 经特征系统后的值,是时域序列,是信号 概念:x 的频谱对数的反变换。由于与x(n)的谱间关系,称之为: 复倒谱 ˆ ( z ), Y ( z ), Y ˆ ( z ) 的收敛域 在绝大多数数字信号处理中, X ( z ), X
(2)D*-1[
]
ˆ (e j ) F[ y ˆ (n)] Y
ˆ (e j )] Y (e j ) exp[ Y y(n) F 1[Y (e j )]
复倒谱的幅度与相位 同傅里叶变换,复倒谱有幅度特性/相频特性
F [ x(n)] F [ x1 (n) * x2 (n)] X 1 (e j ) X 2 (e j ) X 1 (e ) X 2 (e ) e
复倒谱和倒谱
虽然D*[ ]与D*-1[
ˆ (n) 信号也均是时域 ˆ ( n) 和 y ]系统中的 x
序列,但它们所处的离散时域显然不同于x(n)和y(n)所处的 离散时域,所以我们把它称之为“复倒频谱域”。
ˆ (n)是x(n)的“复倒频谱”,简称为“复倒谱”,有时也称 x
作对数复倒谱。
ˆ (n)也是y(n)的复倒谱。 同样,序列 y
倒谱域中,声道的倒谱随着n增大而迅速衰减,在fs=10kHz时,它在[-25,25]
相关主题