语音压缩编码
第13章 语音的压缩编码
内容
一、引言 二、数字语音的波形编码 三、数字语音的参数编码 四、数字语音的混合编码
17.11.2020
精品课件
2
一、引 言
数字语音压缩编码的必要性
码率 = 取样频率 x 量化位数 x 通道数目
例: 电话语音 =8k x 8b x 1 = 64kbps =8kB/s=28MB/h
CCITT G.711 PCM
64kb/s
CCITT G.721 ADPCM
32Kb/s
CCITT G.726 ADPCM
48, 32, 24, 16 Kb/s
➢ 已广泛应用于电话语音的中继线传输
17.11.2020
精品课件
10
1. CCITT G.711 (脉冲编码调制)
Pulse Code Modulation (PCM) of Voice Frequency
应用于全频带数字声音的表示/存储: CD-DA(CD唱片),DAT (44.1 KHz x 16 bit x 2)
17.11.2020
精品课件
14
2. ADPCM自适应差分脉冲编码调制 (Adaptive Differential PCM)
➢ 原理: 1. 声音信号具有很强的相关性,可从已知信号来预测未知 信号, 即使用前面的样本预测当前的样本,实际样本值 与预测值之间的误差往往很小。 2. 利用自适应的思想改变量化阶的大小,即使用小的量化 阶(step-size)去编码小的差值,使用大的量化阶去编码 大的差值,
混合编码(Hybrid compression) 示例 : CELP
17.11.2020
精品课件
7
三类语音编码器性能比较
• 波形编译码器
(waveform codecs)
• 参数编译码器
语音质量 优 良 中
混合编码
波形编码
(source codecs)
• 混合编译码器
(hybrid codecs)
差
坏
1 极2 低
模型编码(源编码)
4
8 16 32 64
低
中
码率(kb/s)
17.11.2020
精品课件
8
二、数字语音的波形编码
波形编译码器
➢ 算法比较简单,容易实现,低延迟,
➢ 压缩效率不高,数据速率在16 kbps以上,
➢ 声音质量相当好,
➢ 通用性好,适用于任意类型的数字声音,
➢ 很成熟,有一系列国际标准:
F(n): PCM码(1+7位)
000WXYZ 001WXYZ 010WXYZ 011WXYZ 100WXYZ 101WXYZ
110WXYZ 111WXYZ
17.11.2020
精品课件
13
PCM 的应用
应用于数字声音的编辑处理(多媒体计算机) 应用于声音的传输(通信):
长途电话 (8 KHz x 8 bit x 1), 时分多路复用TDM (time-division multiplexing)
预 测 值
DPCM 编码输出
重建
线性预测器
信号 +
逆Xn-1 + A2*Xn-2 + ... + Am*Xn-m
( m阶线性预测,A1, A2, ... , Am可自动修正
。)
17.11.2020
精品课件
17
举例
E
量化结果
-255~-240 -239~-224
编码过程:
码率=104 kbps
低通滤波
Xa(t)
(LPF)
取样
A/D
对数变换
(8kHz) X(n) (13位) x(n) (压缩编码)
F(n)
•分析:
•方法简单,易实时处理, •语音质量好, •压缩效率不高,码率为64kbps。
码率= 8位 x 8k =64 kbps
17.11.2020
精品课件
: -31~-16
-15~0 1~16 17~32
: 225~240 241~255
-248 -232
: -24 -8
8 24 : 232 248
17.11.2020
130,150,140,200,230
f’ = 130, 130, 142, 144,
波形编码 (Perception model-based compression) 优点 : 通用、音频质量较高 缺点 : 很难获得较大的压缩比 示例 : PCM, ADPCM, SBC
参数编码,源编码 (Production model-based compression) 优点: 压缩比较大 缺点: 信号源必须已知 示例: LPC
➢ 效果:量化位数可以显著减少,从而降低了总的码率。
17.11.2020
精品课件
15
增量调制(DM)
17.11.2020
精品课件
16
差分脉冲编码调制 DPCM
实际样本值
• 利用样本与样本之间 存在的相关性进行编 码,即根据前面的样 本估算当前样本的大 小,然后对预测误差 进行量化编码。
差
_值
量化器 Q
对数字语音进行数据压缩的目的:
提高通信/存储效率 降低通信/存储成本
17.11.2020
精品课件
4
数字语音压缩编码的可能性
声音信号中包含有大量的冗余信息 邻近样本之间有很大的相关性 周期之间的相关性 基音之间的相关性 长时(几十秒)自相关性 话音间歇(静音)
可以利用人的听觉感知特性进行压缩, 可以利用语音信号的生成机理进行数据压缩。
17.11.2020
精品课件
5
对语音数据压缩的要求
码率低(bitrate) 质量高(quality : excellent, good, fair ) 延时短(time delay) < 25ms 成本合理(cost effective)
17.11.2020
精品课件
6
语音压缩编码方法分类
A律 / u律
A/D(13位)
x(n)
压缩编码
8位 x 8kHz F(n)
x(n): 线性码(1+12位)
0000000WXYZa 0000001WXYZa 000001WXYZab 00001WXYZabc 0001WXYZabcd 001WXYZabcde 01WXYZabcdef 1WXYZabcdefg
11
对数变换 F=ln(x)
目的 : 适应听觉的非线性 特性;压缩数据。
• 北美和日本等地区 ( μ律压扩算法)
• 欧洲和中国大陆 等地区
( A律压扩算法)
17.11.2020
精品课件
当 0 =< |x| =< 1/A 当 1/A < |x| =< 1
12
压扩算法的实现
Xa(t)
取样(8kHz)