当前位置：文档之家› 语音压缩编码

语音压缩编码

第13章语音的压缩编码
内容
一、引言二、数字语音的波形编码三、数字语音的参数编码四、数字语音的混合编码
17.11.2020
精品课件
2
一、引言
数字语音压缩编码的必要性
码率 = 取样频率 x 量化位数 x 通道数目
例: 电话语音 =8k x 8b x 1 = 64kbps =8kB/s=28MB/h
CCITT G.711 PCM
64kb/s
CCITT G.721 ADPCM
32Kb/s
CCITT G.726 ADPCM
48, 32, 24, 16 Kb/s
➢ 已广泛应用于电话语音的中继线传输
17.11.2020
精品课件
10
1. CCITT G.711 (脉冲编码调制)
Pulse Code Modulation (PCM) of Voice Frequency
应用于全频带数字声音的表示/存储: CD-DA（CD唱片），DAT (44.1 KHz x 16 bit x 2)
17.11.2020
精品课件
14
2. ADPCM自适应差分脉冲编码调制 (Adaptive Differential PCM)
➢ 原理： 1. 声音信号具有很强的相关性，可从已知信号来预测未知信号, 即使用前面的样本预测当前的样本，实际样本值与预测值之间的误差往往很小。 2. 利用自适应的思想改变量化阶的大小，即使用小的量化阶(step-size)去编码小的差值，使用大的量化阶去编码大的差值，
混合编码(Hybrid compression) 示例 : CELP
17.11.2020
精品课件
7
三类语音编码器性能比较
• 波形编译码器
(waveform codecs)
• 参数编译码器
语音质量优良中
混合编码
波形编码
(source codecs)
• 混合编译码器
(hybrid codecs)
差
坏
1 极2 低
模型编码（源编码）
4
8 16 32 64
低
中
码率(kb/s)
17.11.2020
精品课件
8
二、数字语音的波形编码
波形编译码器
➢ 算法比较简单，容易实现，低延迟，
➢ 压缩效率不高，数据速率在16 kbps以上，
➢ 声音质量相当好，
➢ 通用性好，适用于任意类型的数字声音，
➢ 很成熟，有一系列国际标准：
F(n): PCM码(1+7位)
000WXYZ 001WXYZ 010WXYZ 011WXYZ 100WXYZ 101WXYZ
110WXYZ 111WXYZ
17.11.2020
精品课件
13
PCM 的应用
应用于数字声音的编辑处理（多媒体计算机）应用于声音的传输（通信）:
长途电话 (8 KHz x 8 bit x 1), 时分多路复用TDM (time-division multiplexing)
预测值
DPCM 编码输出
重建
线性预测器
信号 +
逆Xn-1 + A2*Xn-2 + ... + Am*Xn-m
( m阶线性预测，A1, A2, ... , Am可自动修正
。)
17.11.2020
精品课件
17
举例
E
量化结果
－255～－240 －239～－224
编码过程：
码率＝104 kbps
低通滤波
Xa(t)
(LPF)
取样
A/D
对数变换
(8kHz) X(n) (13位) x(n) (压缩编码)
F(n)
•分析：
•方法简单，易实时处理， •语音质量好， •压缩效率不高，码率为64kbps。
码率＝ 8位 x 8k ＝64 kbps
17.11.2020
精品课件
: －31～－16
－15～0 1～16 17～32
: 225～240 241～255
－248 －232
: －24 －8
8 24 : 232 248
17.11.2020
130，150，140，200，230
f’ ＝ 130, 130, 142, 144,
波形编码 (Perception model-based compression) 优点 : 通用、音频质量较高缺点 : 很难获得较大的压缩比示例 : PCM, ADPCM, SBC
参数编码,源编码 (Production model-based compression) 优点: 压缩比较大缺点: 信号源必须已知示例: LPC
➢ 效果：量化位数可以显著减少，从而降低了总的码率。
17.11.2020
精品课件
15
增量调制(DM)
17.11.2020
精品课件
16
差分脉冲编码调制 DPCM
实际样本值
• 利用样本与样本之间存在的相关性进行编码，即根据前面的样本估算当前样本的大小，然后对预测误差进行量化编码。
差
_值
量化器 Q
对数字语音进行数据压缩的目的:
提高通信/存储效率降低通信/存储成本
17.11.2020
精品课件
4
数字语音压缩编码的可能性
声音信号中包含有大量的冗余信息邻近样本之间有很大的相关性周期之间的相关性基音之间的相关性长时（几十秒）自相关性话音间歇（静音）
可以利用人的听觉感知特性进行压缩, 可以利用语音信号的生成机理进行数据压缩。
17.11.2020
精品课件
5
对语音数据压缩的要求
码率低（bitrate）质量高（quality ： excellent, good, fair ) 延时短（time delay） < 25ms 成本合理（cost effective）
17.11.2020
精品课件
6
语音压缩编码方法分类
A律 / u律
A/D(13位)
x(n)
压缩编码
8位 x 8kHz F(n)
x(n): 线性码(1+12位)
0000000WXYZa 0000001WXYZa 000001WXYZab 00001WXYZabc 0001WXYZabcd 001WXYZabcde 01WXYZabcdef 1WXYZabcdefg
11
对数变换 F=ln(x)
目的 : 适应听觉的非线性特性；压缩数据。
• 北美和日本等地区（ μ律压扩算法）
• 欧洲和中国大陆等地区
（ A律压扩算法）
17.11.2020
精品课件
当 0 =< |x| =< 1/A 当 1/A < |x| =< 1
12
压扩算法的实现
Xa(t)
取样(8kHz)

e商务文档

语音压缩编码

相关文档推荐：