当前位置:文档之家› 第十四讲语音信号处理第7章详解

第十四讲语音信号处理第7章详解


②对数面积比:
针对对数面积比的方式是最为有效的编码方式,很适合 数字编码与传输:
1 ki Ai 1 g i ln[ ] ln[ ] (1 i p) 1 ki Ai
其中Ai为面积函数,通过上式可知 gi幅度均匀分布,可 以采用均匀量化。

变帧率LPC声码器
为降低LPC声码器的速率,应用了变帧速率编码(VFR) 技术的变帧率LPC声码器应运产生。通过付出编解 码复杂化与时延的代价,变帧率LPC声码器可明显 降低传输数码率同时保持音质。
三种编码方式的比较
波形编码
编码信息 波形 9.6~64Kbps 比特率
参数编码
模型参数 2.4~9.6Kbps
混合编码
综合 16~24Kbps
优点
缺点 典型代表
适应能力强, 有效降低了编码比 语音质量好 特率
随着量化粗糙 合成语音质量低, 语音质量下降 处理复杂度高
自适应差分编码调 LPC-10、LPC-10E 制(ADPCM)
x ( n)
y ( n)
ˆ ( n) y
Q【· 】 编码器
X
c ( n)
G ( n)

c(n)
解码器
c(n)
解码器
( n)
~ x ( n)
ˆ ( n) y
ˆ (n) x
+
G(n)

两 种 自 适 应 方 法 的 原 理
匹配自适应
G 匹配自适应
按照自适应参数的来源划分
x ( n)
系统
反馈自适应是由编码器输出来决定量化间 隔,而在接收端由量化传输来的幅度信息 自动生成量化间隔。无须将量化间隔传送 到信道中去,但对误差的灵敏度要求较高。

自适应预测编码
X ( z)

自适应预测编码器(APC)利用线 性预测来改进编码中的量化器性能
E ( z) E( z)

P( z )
Y ( z)
脉冲编码调制 形式一:均匀PCM 最简单最原始的波形编码方式,没有运用压缩技术,产生 的比特率也极高,故在当今运用极少。 形式二:非均匀PCM 将信号进行非线性变换后再均匀量化,变换后信号具有均 匀概率密度分布。编码时常采用对数变换压缩(译码时指数 扩展)。
x
C ( x)
非线性 压缩
z
均匀量化
产生背景:理论与现实的出入
抽样频率 误差表示
e | S ( f ) S ( f ) | W ( f )df
2 0
重建语音傅立叶变换
fs
^
原始语音傅立叶变换
此时,只需W ( f ) 在高频段处较大,低频段处较小, 就可以升高不敏感的高频段的误差,同时降低较敏 感的低频段的误差,从而达到目的。
7.4 语音信号的参数编码

参数编码针对语音信号的特征参数来编码,只适用于语音信 号。实际应用中一般采用的实现设备是线性预测声码器。
线性预测 分析器
s ( n)
信道
编码器 解码器
线性预测 合成器
s ( n)
音调 检测器
LPC声码器框图

LPC参数的变换与量化
①反射系数 ki :
对反射系数的值在【-1,1】区间一般进行非线性量化, 另外比特数分配应递减。
差分脉冲编码调制(DPCM):
不同于DM的一位编码,DPCM多位量化对两个采样 点之间的差分信号利用多位量化进行编码,使信息量 得到压缩的同时降低了信道负载。 x ( n)
x ( n)

+

x p (n)
量化

dq (n)
(n) dq

r

+

+
xr ( n)
预测
发送端
xp (n)
预测
接收端
但采用固定的高阶预测,改善效果并不明显,于是,高阶自 适应预测作为相应的解决方式被提出,自适应预测器随着语音 特征变化不断更新预测系数,从而获得更高的预测增益。
x ( n)

e(n)
eq (n)
+
-
量化
预测系数 自适应

+

xq (n)
xr ( n )
预测
后向自适应预测编码结构框图:

子带编码(SBC)
语音编码依据之一:语音信号冗余度
基本时域冗余: 语音信号幅度非均匀分布性 语音信号样本间的强相关性 浊音语音段具有的准周期性 声道形状及其变化的缓慢性 静止系数 (即语音间隙性)
基本频域冗余: 从长时间的功率谱密度来看,语音信号具有 强烈的非平坦性,存在着固定的冗余度。而 且高频能量通常较低,恰好对应于时域上的 相邻样本相关性。 从短时功率谱密度来看,语音信号在不同频 率交替出现峰值(共振峰)与谷值。整个功 率谱的细节基于基音频率形成高次谐波结构。
较为重要的性能评价准则

编码速率(比特率),决定了编码器工作时占用的信道 带宽,要求尽可能降低。 编码器的顽健性,要求良好。 编码器的时延,要求最小化。 误码容限,要求保持较高值。 算法复杂度(包括运算复杂度与内存要求),影响硬件 成本,尽可能降低。 算法可扩展性,越高越好。
适用于低比 特率语音编 码质量的评 价
LPC-10编码器 LPC-10利用简单的二元激励取代余量信号,在 2.4kbps的速率上得到了清晰的合成语音,在当代 长期被作为标准算法使用。但因为激励信号选取的 影响,抗噪能力与自然度仍不尽如人意。
评测方法
主观评价
客观评价
可懂度评价 (DRT得分)
音质评价
计算较简单,但没有 考虑实际情况,故 适用于高比特率 语音编码质量的评价
平均意见得分 (MOS)
判断满意度测 量(DAM)
7.3 语音信号的波形编码




波形编码 波形编码是语音编码系统在早期所广泛采用的方 法,它把语音信号当成普通的波形信号来处理从而保持原波 形形状。 波形编码适应能力强,合成语音质量好,但比特率过高, 编码的效率也不尽如人意。 几种典型的波形编码: 脉冲编码调制(PCM) 自适应预测编码 自适应增量调制(ADM) 自适应差分脉冲编码调制(ADPCM) 子带编码(SBC)
子带编码原理: 子带编码属于频域编码,它首先将语音信号通过带通 滤波器分割为若干频带(子带),而后对子带信号进行 频谱平移变为基带信号,再利用奈奎斯特速率抽样,最 后进行编码处理。
子带编码优点: 分带后可去除信号相关性,获得与时域一样的效果。 不同子带拥有不同比特数,可获得更佳主观听音质量。 各子带间量化噪音相互独立互不干扰。
LPC计算
C ( z)


P( z )
预测器系数 发端 收端
根据信号量化噪声比的定义:
预测增益
信号平 均能量 预测误差平 均能量
E[s (n)] E[s (n)] E[e (n)] SNR * 2 2 2 E[q (n)] E[e (n)] E[q (n)]
由此可知引入线性预测后,SNR 可得到改善。
| x ( n )| 1 (0 ) X max A
1 | x ( n )| ( 1) A X max
F [ x(n)]

μ律压缩扩张技术(北美及日本标准)
| x ( n) | ln[1 ] X max F [ x(n)] X max sgn[ x(n)] ln(1 )
~ x ( n)
Q【· 】 编码器
c ( n)
x ( n)
~ x ( n)
Q【· 】
编码器
c ( n)
自适应
系统
c(n)
解码器
( n)
Байду номын сангаас
~ x ( n)
前 馈 自 适 应
( n)
自适应
系统
~ x ( n)
c(n)
解码器
反 馈 自 适 应
( n)
自适应
前馈自适应是计算信号有效值并决 定最合适的量化间隔,用此间隔控 制量化器,并将量化间隔信息发送 给接收端。
7.1概述 7.2语音信号压缩编码原理和系统压缩评价 7.3语音信号的波形编码
7.4语音信号的参数编码
7.5语音信号的混合编码
7.1 概述


语音编码(Speech Coding) 从信息论角度看,信源编码 是要以最少的数码表示信源所发的信号,语音编码属于信源 编码的范畴。语音编码通过减少传输码率(或存储量),来 达到提高传输(或存储)效率的目的。 语音编码分为三类: *波形编码:重建后的语音时域信号的波形与原语音信号保 持一致。 *参数编码:通过建立语音信号的产生模型,提取其特征参 数来编码,波形上不要求与原信号匹配,又称声码器技术。 *混合编码:有机结合以上两种编码方式,基于语音产生模 型的假定并采用分析合并技术。
语音编码依据之二:人的听觉特点
人类听觉系统存在着掩蔽效应,即高声级单 音会明显掩蔽临近频率声音。 对于不同频段的声音,人耳的敏感程度不尽 相同。 人类对于语音信号的周期性(即音调)极为 敏感,但对信号的相位却充耳不闻。

语音编码中的几项关键技术 线性预测
线性预测传送整个反应过程变化的参数,其出发点 在于跟踪波形的产生过程而非波形本身。基于全极 点模型假设,使得语音信号编码的比特率得到有效 的降低。 语音信号中存在的两点相关性 样点间的短时相关性 相邻基音周期之间的长时相关性
量化噪声平均 能量
2
2
2
自适应增量调制(ADM)
增量调制的基本方案:
增量调制方式将下一个语音信号与当前语音信号 比较,如果高于当前值则系统编码1,否则系统编码0.
相关主题