物理层关键技术
次数,一般可用MIPS 表示; 处理时延:复杂度高→处理时延大。
数据比特率(bps)
数据比特率越低压缩倍数就越大,可通信的话路 数也就越多,移动通信系统也就越有效。
数据比特率降低,语音质量也随之相应降低,为 了补偿质量的下降,可采用提高设备硬件复杂度 和算法软件复杂度的办法。
降低比特速率另一种有效方法是采用可变速率的 自适应传输,它可以大大降低语音的平均传送率。
采用一类反射系数格形算法 采用矢量量化技术
27
混合编码的基本原理
混合编码是介于波形编码与参量编码之间的一种 编码方法,兼有参量编码低速率与波形编码的高 质量的优点。
实现混合编码的基本思想是以参量编码原理,特 别是以LPC原理为基础,保留参量编码低速率的优 点,并适当的吸收波形编码中能部分反映波形个 性特征的因素。重点改善自然度性能。
17
ADPCM波形编码
ADPCM是利用样本与样本之间的高度相关性和量 化阶自适应来压缩数据的一种波形编码技术。
该算法利用了语音信号样点间的相关性,并针对 语音信号的非平稳特点,使用了自适应预测和自 适应量化,在32kbps/8kHz速率上能够给出网络等 级话音质量。
ADPCM标准是一个代码转换系统,它使用ADPCM 转换技术实现64Kb/s A律或u律PCM(脉冲编码调制) 速率和32Kb/s速率之间的相互转换。
15
复杂度与处理时延
语音编码硬件复杂度取决于DSP处理能力,而软件复杂度则主要体现 在算法复杂度上。算法复杂度增大,也会带来更长的运算时间和更大 的处理时延 。
如下所示,我们给出几种已知低数据比特率语音编码的上述四个参数 与性能比较表格。
编码器类型
脉码调制PCM 自适应差分脉码调制ADPCM 自适应子带编码 多脉冲线性预测编码 随机激励线性预测编码 线性预测声码器
数据压缩
目的:在保证一定图像(或声音)质量的条 件下,以最小的数据率来表达和传送图像或 声音信息。
数据能够压缩的可能性在于:
原始数据中存在着大量的冗余信息(时间冗余、 空间冗余、统计冗余);
人的视觉和听觉器官都具有某种不敏感性,舍去 人的感官所不敏感的信息,对图像或声音质量的 影响很小,在某些情况下甚至可以忽略不计。
根据语音产生机理,采用下列物理模型:
周期性信号源 随机性信号源
u(n)
时变线性滤波 输出
器
合成话音C ( n )
增益控制G
24
反映语言特征的主要参数
基音频率与基金周期:声带振动频率、周期 共振峰频率:声道的谐振频率 语音强度: 浊音/清音判决
浊音:有声音—英语元音、汉语韵母 清音:无声音—英语多数辅音、汉语多数声母
I1(上限) log2 N=log2 (256)10 80bps
I
(下限)
2
log2
N=log2 (128)10
70bps
最后可计算出压缩比K为:
K 64Kbps 914 ~ 800倍 70 ~ 80bps
混合编码的性能估计
显然混合编码的理论压缩比是介于上述两类 编码之间,且与语音质量需求有关。若要求 混合编码偏重于个性特征,则其压缩比靠近 波形编码的压缩比值,若要求混和编码偏重 于共性,则其压缩比靠近于参量编码。
25 23 20 17 2.34 2 1.5 1 3.42 4 5.3 8
波形编码的性能估计
由上述分析结果可以得到如下结论: 当语音质量达到进入公网要求标准时,即 σ2/D≈26dB,其K=3.4 倍。 若进一步考虑实际语音分布与主观因素的影 响(因为正态分布R(D)其压缩倍数可以进一步增 大,取K=4 (保守值)这时语音速率可以从未压 缩的PCM 64Kbps降至1/4速率的16Kbps。
ADPCM编码原理
32Kbps ADPCM编码原理如下图所示
ADPCM输出
c'(n)
PCM 线性码
x(n) d(n)
自适应 量化器
c (n )
逆量化 dˆ( n ) 器
y(n)
y(n)
y(n)
定标因子
自适应
自适应
速度控制
QL(n)
自适应 x (n ) 预测器
xˆ (n )
21
ADPCM编码原理
还可以进一步采用语音激活技术,充分利用至少 3/8的有效空隙,可获得大致约2.67dB的有效增益。
14
语音质量
度量方法不外乎客观与主观两个角度: 客观度量可以采用信噪比、误码率、误帧率,
相对而言简单、可行。 主观度量是由人耳主观特性来判断,比客观
度量复杂。目前国际上常采用的主观评判方 法称为MOS方法 。
波形编码的性能估计
信息率--失真R(D)为:
R(D)
1 2 (1 2 )
2 log2
D
D:最大允许失真,σ2:方差,ρ相关系数 广义平稳遍历马氏链信源且有R( ) 2 0 1 上式的计算结果如下表所示
信噪比(dB) 35 R(D)(bit/样点) 4 压缩倍数K 2
32 28 3.5 2.5 2.28 3.2
移动通信语音编码技术概述
语音编码:移动通信数字化的基础,第1/2 代蜂窝系 统的根本区别。
语音编码的意义:
提高通话质量(数字化+信道编码纠错); 提高频谱利用率(低码率编码); 提高系统容量(低码率,语音激活技术)。
移动通信对语音编码的要求:
编码速率低,语音质量好; 有较强的抗噪声干扰和抗误码的性能; 编译码延时小,总延时在65ms 以内; 编译码器复杂度低,便于大规模集成化; 功耗小,便于应用于手持机。
语音编码的分类
波形编码
将时间域信号直接变换为数字代码,目的是尽可能精确地再现原来 的话音波形
PCM、ΔM
参量编码(声源编码)
将信源信号在正交变换域提取特征参量,并将其变换为数字代码 线性预测编码LPC
混合编码
波形编码+参量编码 数字语音信号中既有语音特征参量又有部分波形编码
波形编码质量最高,其质量几乎与压缩处理之前相同,适 用于公用骨干(固定)通信网。参量编码质量最差,仅适合于 特殊通信系统,比如军事与保密通信系统。混和编码质量 介于两者之间,目前主要用于移动通信网。
ADPCM解码原理
32Kbps ADPCM译码原理如下图所示
c(n) 逆量化 y(n)
dˆ(n) + xˆ(n) + x(n)
PCM 线性码
自适应 预测
同步编码 调整
y(n)
定标因子 自适应
y(n)
QL (n)
自适应 速度控制
23
参量编码的基本原理
参量编码不直接传送语音波形,而是传送产 生、激励语音波形的基本参量。
限失真信源编码定理
限失真信源编码定理:只要信源符号序列长 度N足够大,当每个符号的信息率大于R(D) ,必存在一种编码方法,其平均失真可无限 逼近D;反之,若信息率小于R(D),则任何 编码的平均失真必将大于D。
利用信息论中连续(模拟)有记忆信源的信息 率--失真R(D)函数理论可以分析波形编码的 性能。
应用:WAV,MP3,G.721等
ADPCM基本用小的量化阶去 编码小的差值,使用大的量化阶去编码大的差值,使 用过去的样本值估算下一个输入样本的预测值,使实 际样本值和预测值之间的差值总是最小。ADPCM 记录的量化值不是每个采样点的幅值,而是该点的幅 值与前一个采样点幅值之差。
数据比特率 (Kbps) 64 32 16 8 4 2
复杂度 (MIPS)
0.01 0.1 1 10 100 1
时延 (ms)
0 0 25 35 35 35
质量 (MOS)
4.3 4.1 4 3.5 3.5 3.1
16
语音压缩编码原理
波形编码的基本原理
自适应差分脉冲编码调制(ADPCM)是建立在差分脉 冲编码调制(DPCM)的基础上,而DPCM又是建立在 脉冲编码调制(PCM)的基础上。
研究在限定失真下为了恢复信源符号所必需 的信息率,简称率失真理论。
率失真理论就是用以计算不同类型的信源在 各种失真限度下所需的最小信息率。
率失真函数--计算率失真函数是率失真理论 的中心问题。率失真函数只指出限失真条件 下所必需的最小信息率。从理论上讲,尚应 能证明实际存在一种编码方法,用这样的信 息率就能实现限失真的要求。
改进LPC主要从三方面入手:改进语音生成物理模 型、激励源结构和合成滤波器结构,提高语音质 量;改进参量量化和传输方法,进一步压缩传输 速率;采用自适应技术,进一步解决系统与信源 和信道之间的统计匹配。
28
移动通信中的语音编码
本节将结合第二代(2G)的GSM与IS-95系统以 及 第 三 代 (3G) 的 WCDMA 和 CDMA2000 等 不 同系统所采用的语音编码具体方案,着重从 原理上来阐述移动通信中的语音编码。
4.5,6.7,11.2
CT2
无绳 ADPCM
32
DECT
无绳 ADPCM
32
PHS
无绳 ADPCM
32
PCS-1800 蜂窝 RPE-LTP规则脉冲激励长期预测编码 13
PACS
个人通信 ADPCM
32
WCDMA 蜂窝 AMR
信息率-失真理论
information rate-distortion theory
IMA ADPCM算法对量化步长的调整使用了简单的 查表方法,对于一个输入的PCM值X(n),将其与前 一时刻的X(n-1)预测值做差值 得到d(n),然后根据 当前的量化步长对d(n)进行编码,再用此样点的编 码值调整量化步长,同时还要得到当前样点的预测 值供下一样点编码使用。
ADPCM编码原理
移动通信中的语音编码
高质量的混合编码是移动通信中的优选方案。