当前位置：文档之家› 第十四讲语音信号处理第7章详解

第十四讲语音信号处理第7章详解

②对数面积比：
针对对数面积比的方式是最为有效的编码方式，很适合数字编码与传输：
1 ki Ai 1 g i ln[ ] ln[ ] (1 i p) 1 ki Ai
其中Ai为面积函数，通过上式可知 gi幅度均匀分布，可以采用均匀量化。

变帧率LPC声码器
为降低LPC声码器的速率，应用了变帧速率编码（VFR）技术的变帧率LPC声码器应运产生。通过付出编解码复杂化与时延的代价，变帧率LPC声码器可明显降低传输数码率同时保持音质。
三种编码方式的比较
波形编码
编码信息波形 9.6~64Kbps 比特率
参数编码
模型参数 2.4~9.6Kbps
混合编码
综合 16~24Kbps
优点
缺点典型代表
适应能力强，有效降低了编码比语音质量好特率
随着量化粗糙合成语音质量低，语音质量下降处理复杂度高
自适应差分编码调 LPC-10、LPC-10E 制（ADPCM）
x ( n)
y ( n)
ˆ ( n) y
Q【· 】编码器
X
c ( n)
G ( n)

c(n)
解码器
c(n)
解码器
( n)
~ x ( n)
ˆ ( n) y
ˆ (n) x
+
G(n)

两种自适应方法的原理
匹配自适应
G 匹配自适应
按照自适应参数的来源划分
x ( n)
系统
反馈自适应是由编码器输出来决定量化间隔，而在接收端由量化传输来的幅度信息自动生成量化间隔。无须将量化间隔传送到信道中去，但对误差的灵敏度要求较高。

自适应预测编码
X ( z)

自适应预测编码器（APC）利用线性预测来改进编码中的量化器性能
E ( z) E( z)

P( z )
Y ( z)
脉冲编码调制形式一：均匀PCM 最简单最原始的波形编码方式，没有运用压缩技术，产生的比特率也极高，故在当今运用极少。形式二：非均匀PCM 将信号进行非线性变换后再均匀量化，变换后信号具有均匀概率密度分布。编码时常采用对数变换压缩（译码时指数扩展）。
x
C ( x)
非线性压缩
z
均匀量化
产生背景：理论与现实的出入
抽样频率误差表示
e | S ( f ) S ( f ) | W ( f )df
2 0
重建语音傅立叶变换
fs
^
原始语音傅立叶变换
此时，只需W ( f ) 在高频段处较大，低频段处较小，就可以升高不敏感的高频段的误差，同时降低较敏感的低频段的误差，从而达到目的。
7.4 语音信号的参数编码

参数编码针对语音信号的特征参数来编码，只适用于语音信号。实际应用中一般采用的实现设备是线性预测声码器。
线性预测分析器
s ( n)
信道
编码器解码器
线性预测合成器
s ( n)
音调检测器
LPC声码器框图

LPC参数的变换与量化
①反射系数 ki ：
对反射系数的值在【-1，1】区间一般进行非线性量化，另外比特数分配应递减。
差分脉冲编码调制（DPCM）：
不同于DM的一位编码，DPCM多位量化对两个采样点之间的差分信号利用多位量化进行编码，使信息量得到压缩的同时降低了信道负载。 x ( n)
x ( n)

+

x p (n)
量化

dq (n)
(n) dq

r

+

+
xr ( n)
预测
发送端
xp (n)
预测
接收端
但采用固定的高阶预测，改善效果并不明显，于是，高阶自适应预测作为相应的解决方式被提出，自适应预测器随着语音特征变化不断更新预测系数，从而获得更高的预测增益。
x ( n)

e(n)
eq (n)
+
-
量化
预测系数自适应

+

xq (n)
xr ( n )
预测
后向自适应预测编码结构框图：

子带编码（SBC）
语音编码依据之一：语音信号冗余度
基本时域冗余：语音信号幅度非均匀分布性语音信号样本间的强相关性浊音语音段具有的准周期性声道形状及其变化的缓慢性静止系数（即语音间隙性）
基本频域冗余：从长时间的功率谱密度来看，语音信号具有强烈的非平坦性，存在着固定的冗余度。而且高频能量通常较低，恰好对应于时域上的相邻样本相关性。从短时功率谱密度来看，语音信号在不同频率交替出现峰值（共振峰）与谷值。整个功率谱的细节基于基音频率形成高次谐波结构。
较为重要的性能评价准则

编码速率（比特率），决定了编码器工作时占用的信道带宽，要求尽可能降低。编码器的顽健性，要求良好。编码器的时延，要求最小化。误码容限，要求保持较高值。算法复杂度（包括运算复杂度与内存要求），影响硬件成本，尽可能降低。算法可扩展性，越高越好。
适用于低比特率语音编码质量的评价
LPC-10编码器 LPC-10利用简单的二元激励取代余量信号，在 2.4kbps的速率上得到了清晰的合成语音，在当代长期被作为标准算法使用。但因为激励信号选取的影响，抗噪能力与自然度仍不尽如人意。
评测方法
主观评价
客观评价
可懂度评价（DRT得分）
音质评价
计算较简单，但没有考虑实际情况，故适用于高比特率语音编码质量的评价
平均意见得分（MOS）
判断满意度测量（DAM）
7.3 语音信号的波形编码

波形编码波形编码是语音编码系统在早期所广泛采用的方法，它把语音信号当成普通的波形信号来处理从而保持原波形形状。波形编码适应能力强，合成语音质量好，但比特率过高，编码的效率也不尽如人意。几种典型的波形编码：脉冲编码调制（PCM）自适应预测编码自适应增量调制（ADM）自适应差分脉冲编码调制（ADPCM）子带编码（SBC）
子带编码原理：子带编码属于频域编码，它首先将语音信号通过带通滤波器分割为若干频带（子带），而后对子带信号进行频谱平移变为基带信号，再利用奈奎斯特速率抽样，最后进行编码处理。
子带编码优点：分带后可去除信号相关性，获得与时域一样的效果。不同子带拥有不同比特数，可获得更佳主观听音质量。各子带间量化噪音相互独立互不干扰。
LPC计算
C ( z)

P( z )
预测器系数发端收端
根据信号量化噪声比的定义：
预测增益
信号平均能量预测误差平均能量
E[s (n)] E[s (n)] E[e (n)] SNR * 2 2 2 E[q (n)] E[e (n)] E[q (n)]
由此可知引入线性预测后，SNR 可得到改善。
| x ( n )| 1 (0 ) X max A
1 | x ( n )| ( 1) A X max
F [ x(n)]

μ律压缩扩张技术（北美及日本标准）
| x ( n) | ln[1 ] X max F [ x(n)] X max sgn[ x(n)] ln(1 )
~ x ( n)
Q【· 】编码器
c ( n)
x ( n)
~ x ( n)
Q【· 】
编码器
c ( n)
自适应
系统
c(n)
解码器
( n)
Байду номын сангаас
~ x ( n)
前馈自适应
( n)
自适应
系统
~ x ( n)
c(n)
解码器
反馈自适应
( n)
自适应
前馈自适应是计算信号有效值并决定最合适的量化间隔，用此间隔控制量化器，并将量化间隔信息发送给接收端。
7.1概述 7.2语音信号压缩编码原理和系统压缩评价 7.3语音信号的波形编码
7.4语音信号的参数编码
7.5语音信号的混合编码
7.1 概述

语音编码（Speech Coding）从信息论角度看，信源编码是要以最少的数码表示信源所发的信号，语音编码属于信源编码的范畴。语音编码通过减少传输码率（或存储量），来达到提高传输（或存储）效率的目的。语音编码分为三类： *波形编码：重建后的语音时域信号的波形与原语音信号保持一致。 *参数编码：通过建立语音信号的产生模型，提取其特征参数来编码，波形上不要求与原信号匹配，又称声码器技术。 *混合编码：有机结合以上两种编码方式，基于语音产生模型的假定并采用分析合并技术。
语音编码依据之二：人的听觉特点
人类听觉系统存在着掩蔽效应，即高声级单音会明显掩蔽临近频率声音。对于不同频段的声音，人耳的敏感程度不尽相同。人类对于语音信号的周期性（即音调）极为敏感，但对信号的相位却充耳不闻。

语音编码中的几项关键技术线性预测
线性预测传送整个反应过程变化的参数，其出发点在于跟踪波形的产生过程而非波形本身。基于全极点模型假设，使得语音信号编码的比特率得到有效的降低。语音信号中存在的两点相关性样点间的短时相关性相邻基音周期之间的长时相关性
量化噪声平均能量
2
2
2
自适应增量调制（ADM）
增量调制的基本方案：
增量调制方式将下一个语音信号与当前语音信号比较，如果高于当前值则系统编码1，否则系统编码0.

e商务文档

第十四讲语音信号处理第7章详解

相关文档推荐：