当前位置：文档之家› 语音编码分类及编解码标准解读

语音编码分类及编解码标准解读

语音编码分类及编解码标准将音频或视频信号在模拟格式和数字格式之间转换的硬件（编码器/解码器）；压缩和解压缩音频或视频数据的硬件或软件（压缩/解压缩）；或是编码器/解码器和压缩/解压缩的组合。

通常，编码解码器能够压缩未压缩的数字数据，以减少内存使用量。

编解码器（codec）指的是一个能够对一个信号或者一个数据流进行变换的设备或者程序。

这里指的变换既包括将信号或者数据流进行编码（通常是为了传输、存储或者加密）或者提取得到一个编码流的操作，也包括为了观察或者处理从这个编码流中恢复适合观察或操作的形式的操作。

编解码器经常用在视频会议和流媒体等应用中，通常主要还是用在广电行业，作前端应用。

G.711类型：Audio制定者：ITU-T所需频宽：64Kbps特性：算法复杂度小，音质一般优点：算法复杂度低，压缩比小（CD音质>400kbps），编解码延时最短（相对其它技术）缺点：占用的带宽较高应用领域：voip版税方式：Free备注：70年代CCITT公布的G.711 64kb/s脉冲编码调制PCM。

G.721类型：Audio制定者：ITU-T所需频宽：32Kbps特性：相对于PCMA和PCMU，其压缩比较高，可以提供2：1的压缩比。

优点：压缩比大缺点：声音质量一般应用领域：voip版税方式：Free备注：子带ADPCM（SB-ADPCM）技术。

G.721标准是一个代码转换系统。

它使用ADPCM转换技术，实现64 kb/s A律或μ律PC M速率和32 kb/s速率之间的相互转换。

G.722类型：Audio制定者：ITU-T所需频宽：64Kbps特性：G722能提供高保真的语音质量优点：音质好缺点：带宽要求高应用领域：voip版税方式：Free备注：子带ADPCM（SB-ADPCM）技术G.723(低码率语音编码算法)类型：Audio制定者：ITU-T所需频宽：5.3Kbps/6.3Kbps特性：语音质量接近良，带宽要求低，高效实现，便于多路扩展，可利用C5402片内16kRAM实现53coder。

达到ITU-TG723要求的语音质量，性能稳定。

可用于IP电话语音信源编码或高效语音压缩存储。

优点：码率低，带宽要求较小。

并达到ITU-TG723要求的语音质量，性能稳定。

缺点：声音质量一般应用领域：voip版税方式：Free备注：G.723语音编码器是一种用于多媒体通信，编码速率为5.3kbits/s和6.3kbit/s的双码率编码方案。

G.723标准是国际电信联盟（ITU）制定的多媒体通信标准中的一个组成部分，可以应用于IP电话等系统中。

其中，5.3kbits/s码率编码器采用多脉冲最大似然量化技术（MP－MLQ），6.3kbits/s码率编码器采用代数码激励线性预测技术。

G.723.1(双速率语音编码算法)类型：Audio制定者：ITU-T所需频宽：5.3Kbps(22.9)特性：能够对音乐和其他音频信号进行压缩和解压缩，但它对语音信号来说是最优的。

G.723.1采用了执行不连续传输的静音压缩，这就意味着在静音期间的比特流中加入了人为的噪声。

除了预留带宽之外，这种技术使发信机的调制解调器保持连续工作，并且避免了载波信号的时通时断。

优点：码率低，带宽要求较小。

并达到ITU-TG723要求的语音质量，性能稳定,避免了载波信号的时通时断。

缺点：语音质量一般应用领域：voip版税方式：Free备注：G.723.1算法是ITU-T建议的应用于低速率多媒体服务中语音或其它音频信号的压缩算法，其目标应用系统包括H.323、H.324等多媒体通信系统。

目前该算法已成为IP电话系统中的必选算法之一。

G.728类型：Audio制定者：ITU-T所需频宽：16Kbps/8Kbps特性：用于IP电话、卫星通信、语音存储等多个领域。

G.72 8是一种低时延编码器，但它比其它的编码器都复杂，这是因为在编码器中必须重复做50阶LPC分析。

G.728还采用了自适应后置滤波器来提高其性能。

优点：后向自适应，采用自适应后置滤波器来提高其性能缺点：比其它的编码器都复杂应用领域：voip版税方式：Free备注：G.728 16kb/s短延时码本激励线性预测编码（LD-CEL P）。

1996年ITU公布了G.728 8kb/s的CS－ACELP算法，可以用于IP电话、卫星通信、语音存储等多个领域。

16 kbps G.728低时延码激励线性预测。

G.728是低比特线性预测合成分析编码器（G.729和G.723.1）和后向ADPCM编码器的混合体。

G.728是LD-CELP编码器，它一次只处理5个样点。

对于低速率（56~128kbps）的综合业务数字网（I SDN）可视电话，G.728是一种建议采用的语音编码器。

由于其后向自适应特性，因此G.728是一种低时延编码器，但它比其它的编码器都复杂，这是因为在编码器中必须重复做50阶LPC分析。

G. 728还采用了自适应后置滤波器来提高其性能。

G.729类型：Audio制定者：ITU-T所需频宽：8Kbps特性：在良好的信道条件下要达到长话质量，在有随机比特误码、发生帧丢失和多次转接等情况下要有很好的稳健性等。

这种语音压缩算法可以应用在很广泛的领域中，包括ＩＰ电话、无线通信、数字卫星系统和数字专用线路。

G.729算法采用“共轭结构代数码本激励线性预测编码方案”（CS-ACELP）算法。

这种算法综合了波形编码和参数编码的优点，以自适应预测编码技术为基础，采用了矢量量化、合成分析和感觉加权等技术。

G.729编码器是为低时延应用设计的，它的帧长只有10ms，处理时延也是10ms，再加上5ms的前视，这就使得G.729产生的点到点的时延为25ms，比特率为8 kbps。

优点：语音质量良，应用领域很广泛，采用了矢量量化、合成分析和感觉加权，提供了对帧丢失和分组丢失的隐藏处理机制缺点：在处理随机比特错误方面性能不好。

应用领域：voip版税方式：Free备注：国际电信联盟（ITU-T）于1995年11月正式通过了G. 729。

ITU-T建议G.729也被称作“共轭结构代数码本激励线性预测编码方案”(CS-ACELP)，它是当前较新的一种语音压缩标准。

G. 729是由美国、法国、日本和加拿大的几家著名国际电信实体联合开发的。

G.729A类型：Audio制定者：ITU-T所需频宽：8Kbps(34.4)特性：复杂性较G.729低，性能较G.729差。

优点：语音质量良，降低了计算的复杂度以便于实时实现，提供了对帧丢失和分组丢失的隐藏处理机制缺点：性能较G.729差应用领域：voip版税方式：Free备注：96年ITU-T又制定了G.729的简化方案G.729A，主要降低了计算的复杂度以便于实时实现，因此目前使用的都是G.729 A。

GIPS类型：Audio制定者：瑞典Global IP Sound公司所需频宽：特性：GIPS技术可根据带宽状况自动调节编码码率，提供低码率高质量的音频。

GIPS的核心技术（网络自适应算法，丢包补偿算法和回声消除算法）可很好地解决语音延迟与回声问题，带来完美音质，提供比电话还清晰的语音通话效果。

优点：很好地解决语音延迟与回声问题，带来完美音质，提供比电话还清晰的语音通话效果缺点：不是Free应用领域：voip版税方式：每年支付一笔使用权费用备注：GIPS音频技术是由来自瑞典的全球顶尖的语音处理高科技公司--"GLOBAL IPSOUND"提供的专用于互联网的语音压缩引擎系统。

GIPS技术可根据带宽状况自动调节编码码率，提供低码率高质量的音频。

Apt-X类型：Audio制定者：Audio Processing Technology 公司所需频宽：10Hz to 22.5 kHz，56kbit/s to 576 kbit/s(16 bit 7.5 kHz mono to 24-bit, 22.5kHz stereo)特性：主要用于专业音频领域，提供高品质的音频。

其特点是：①采用4:1:4的压缩与放大方案；②硬件低复杂度；③极低的编码延迟；④由单芯片实现；⑤单声道或立体声编解码；⑥只需单设备即可实现22.5kHz的双通道立体声；⑦高达48kHz的采样频率；⑧容错性好；⑨完整的AUTOSYNC™编解码同步方案；⑩低功率消耗优点：高品质的音频，硬件复杂度低，设备要求低缺点：不是Free应用领域：voip版税方式：一次性付费备注：子带ADPCM（SB-ADPCM）技术NICAMNICAM(Near Instantaneous Companded Audio Multiplex 准瞬时压扩音频复用)类型：Audio制定者：英国BBC广播公司所需频宽：728Kbps特性：应用范围及其广泛，可用它进行立体声或双语广播优点：应用范围及其广泛，信噪比高，动态范围宽、音质同C D相媲美，故名丽音，因此NICAM又称为丽音缺点：不是Free，频宽要求高应用领域：voip版税方式：一次性付费备注：NICAM也称丽音，它是英文Near-Instantaneously Co mpanded Audio Multiplex的缩写，其含义为准瞬时压扩音频复用，是由英国BBC广播公司开发研究成功的。

通俗地说NICAM技术实际上就是双声道数字声技术，其应用范围及其广泛，最典型的应用便是电视广播附加双声道数字声技术，利用它进行立体声或双语广播，以充分利用电视频道的频谱资源。

这是在常规电视广播的基础上无需增加许多投资就可以实现的。

在进行立体声广播时，它提高了音频的信号质量，使其接近CD的质量。

而且还可以利用NICAM技术进行高速数据广播及其他数据传输的增殖服务，这在当今的信息化社会中似乎就显得尤为重要了！MPEG-1 audio layer 1类型：Audio制定者：MPEG所需频宽：384kbps（压缩4倍）特性：编码简单，用于数字盒式录音磁带，2声道，VCD中使用的音频压缩方案就是MPEG-1层Ⅰ。

优点：压缩方式相对时域压缩技术而言要复杂得多，同时编码效率、声音质量也大幅提高，编码延时相应增加。

可以达到“完全透明”的声音质量（EBU音质标准）缺点：频宽要求较高应用领域：voip版税方式：Free备注：MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准，它分为三个层次：--层1(Layer 1)：编码简单，用于数字盒式录音磁带--层2(Layer 2)：算法复杂度中等，用于数字音频广播(DAB)和VCD等--层3(Layer 3)：编码复杂，用于互联网上的高质量声音的传输，如MP3音乐压缩10倍MUSICAM(MPEG-1 audio layer 2,即MP2)类型：Audio制定者：MPEG所需频宽：256～192kbps（压缩6～8倍）特性：算法复杂度中等，用于数字音频广播(DAB)和VCD等，2声道，而MUSICAM由于其适当的复杂程度和优秀的声音质量，在数字演播室、DAB、DVB等数字节目的制作、交换、存储、传送中得到广泛应用。

e商务文档

语音编码分类及编解码标准解读

相关文档推荐：