当前位置：文档之家› 各种音频编码方式的对比

各种音频编码方式的对比

各种音频编码方式的对比————————————————————————————————作者: ————————————————————————————————日期：ﻩ各种音频编码方式的对比内容简介：文章介绍了ＰＣM编码、WMA编码、AＤPCM编码、LPC编码、ＭP3编码、ＡAC编码、CELＰ编码等，包括优缺点对比和主要应用领域。

PＣＭ编码(原始数字音频信号流）ﻫ类型:Aｕdｉo制定者:ＩTU-Ｔ所需频宽：１４11.２Kbpsﻫ特性：音源信息完整，但冗余度过大优点：音源信息保存完整,音质好缺点:信息量大，体积大，冗余度过大ﻫ应用领域:ｖoｉpﻫ版税方式:Ｆｒｅeﻫ备注：在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏,ＣＤ、DVD以及我们常见的ＷＡＶ文件中均有应用。

因此，PCM约定俗成了无损编码,因为PCＭ代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真，PＣM也只能做到最大程度的无限接近。

要算一个PCＭ音频流的码率是一件很轻松的事情，采样率值×采样大小值×声道数bps。

一个采样率为44.1ＫHｚ，采样大小为1６ｂｉt，双声道的PCＭ编码的WAV文件,它的数据速率则为４４.1K×16×2 =141１.2Kbｐs。

我们常见的Audio CD就采用了ＰＣM编码，一张光盘的容量只能容纳７２分钟的音乐信息。

WMA(Winｄows MediａAudio)类型：Ａudｉo制定者：微软公司所需频宽：32０～１１2kｂps(压缩１0～1２倍)特性：当Bｉtｒate小于12８K时,ＷＭA几乎在同级别的所有有损编码格式中表现得最出色,但似乎128k 是WＭＡ一个槛，当Bitrate再往上提升时，不会有太多的音质改变。

ﻫ优点:当Ｂitrate小于128K时,WMA 最为出色且编码后得到的音频文件很小。

ﻫ缺点:当Bitrate大于1２８K时,WMA音质损失过大。

WＭA标准不开放,由微软掌握。

ﻫ应用领域:voｉpﻫ版税方式：按个收取ﻫ备注：WMA的全称是WiｎdｏwsＭedia Audio，它是微软公司推出的与ＭP３格式齐名的一种新的音频格式。

由于WMA在压缩比和音质方面都超过了MP3，更是远胜于RA(Real Aｕｄｉo),即使在较低的采样频率下也能产生较好的音质，再加上WMA有微软的ＷiｎｄowｓＭeｄｉa Pｌaｙer做其强大的后盾,所以一经推出就赢得一片喝彩。

ADＰCＭ( 自适应差分PCM)ﻫ类型：Audｉｏ制定者:IＴＵ-Tﻫ所需频宽:３２Kｂpｓ特性：ADPＣM（adaptive ｄｉffｅrｅｎｃe pulｓe coｄe ｍoｄulation）综合了APCM的自适应特性和DPCM系统的差分特性，是一种性能比较好的波形编码。

ﻫ它的核心想法是：①利用自适应的思想改变量化阶的大小，即使用小的量化阶（sｔep－size)去编码小的差值,使用大的量化阶去编码大的差值；②使用过去的样本值估算下一个输入样本的预测值，使实际样本值和预测值之间的差值总是最小。

ﻫ优点:算法复杂度低,压缩比小(CD音质＞40０kbps）,编解码延时最短（相对其它技术)ﻫ缺点：声音质量一般ﻫ应用领域：ｖoip版税方式：Ｆｒeeﻫ备注:ＡDPCM (ＡＤPCM Adａptiｖe Ｄiｆferenｔiａl Pulse Cｏde Mｏdｕｌａtion),是一种针对16bit(或者更高?) 声音波形数据的一种有损压缩算法, 它将声音流中每次采样的16bｉt 数据以4biｔ存储, 所以压缩比1：4而压缩/解压缩算法非常的简单, 所以是一种低空间消耗,高质量声音获得的好途径。

ＬPC（Lｉnear PredｉctiｖeＣoｄiｎg，线性预测编码)ﻫ类型：Audio制定者:ﻫ所需频宽：２Kbpｓ-4.８Kｂｐs特性:压缩比大，计算量大，音质不高,廉价ﻫ优点：压缩比大,廉价缺点：计算量大,语音质量不是很好，自然度较低ﻫ应用领域：ｖｏipﻫ版税方式:Free备注:参数编码又称为声源编码，是将信源信号在频率域或其它正交变换域提取特征参数,并将其变换成数字代码进行传输。

译码为其反过程，将收到的数字序列经变换恢复特征参量,再根据特征参量重建语音信号。

具体说,参数编码是通过对语音信号特征参数的提取和编码,力图使重建语音信号具有尽可能高的准确性，但重建信号的波形同原语音信号的波形可能会有相当大的差别。

如：线性预测编码(LＰC)及其它各种改进型都属于参数编码。

该编码比特率可压缩到2Kbit/s-4．8Kbｉt/s,甚至更低，但语音质量只能达到中等，特别是自然度较低。

ＣEＬP(CoｄｅEｘcited LinearＰredｉctｉon码激励线性预测编码）类型：Audioﻫ制定者：欧洲通信标准协会（ETSI）ﻫ所需频宽：4～16Ｋｂps的速率ﻫ特性：改善语音的质量:①对误差信号进行感觉加权，利用人类听觉的掩蔽特性来提高语音的主观质量;②用分数延迟改进基音预测，使浊音的表达更为准确，尤其改善了女性语音的质量；ﻫ③使用修正的MSPE准则来寻找“最佳”的延迟，使得基音周期延迟的外形更为平滑；ﻫ④根据长时预测的效率，调整随机激励矢量的大小,提高语音的主观质量;⑤使用基于信道错误率估计的自适应平滑器,在信道误码率较高的情况下也能合成自然度较高的语音。

结论:①ＣEＬP算法在低速率编码环境下可以得到令人满意的压缩效果；ﻫ②使用快速算法,可以有效地降低CELP算法的复杂度，使它完全可以实时地实现;③ＣELP可以成功地对各种不同类型的语音信号进行编码,这种适应性对于真实环境，尤其是背景噪声存在时更为重要。

优点：用很低的带宽提供了较清晰的语音ﻫ缺点：-应用领域：voipﻫ版税方式:Frｅeﻫ备注：1999年欧洲通信标准协会(ＥＴＳI)推出了基于码激励线性预测编码(CEＬP)的第三代移动通信语音编码标准自适应多速率语音编码器（AMR)，其中最低速率为4.75ｋb/s,达到通信质量。

ＣELP码激励线性预测编码是Code Excitｅd Linear Prediｃtiｏｎ的缩写。

CＥLP 是近10年来最成功的语音编码算法。

ＣＥLP语音编码算法用线性预测提取声道参数，用一个包含许多典型的激励矢量的码本作为激励参数,每次编码时都在这个码本中搜索一个最佳的激励矢量,这个激励矢量的编码值就是这个序列的码本中的序号。

ＣEＬP已经被许多语音编码标准所采用,美国联邦标准FS１01６就是采用CELP的编码方法,主要用于高质量的窄带语音保密通信。

ＣEＬP(Codｅ-Exciｔed Linear Pｒeｄictｉｏn)这是一个简化的ＬP Ｃ算法,以其低比特率著称（４8０0-9600Ｋbｐs)，具有很清晰的语音品质和很高的背景噪音免疫性。

CＥLP是一种在中低速率上广泛使用的语音压缩编码方案。

MＰＥG-１ａuｄiｏlａyｅr 1类型:Audio制定者:MＰEGﻫ所需频宽：384ｋbｐs(压缩4倍)特性:编码简单,用于数字盒式录音磁带,２声道，VCD中使用的音频压缩方案就是MＰEG-1层Ⅰ。

优点:压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。

可以达到“完全透明”的声音质量（EBＵ音质标准)ﻫ缺点:频宽要求较高应用领域：ｖoiｐ版税方式:Free备注:MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准,它分为三个层次：ﻫ--层1(Laｙer １):编码简单,用于数字盒式录音磁带ﻫ--层２(Lａｙer2）:算法复杂度中等，用于数字音频广播(ＤAB）和VCD等-－层3(Layｅｒ３）:编码复杂，用于互联网上的高质量声音的传输，如MＰ３音乐压缩10倍MUＳIＣAＭ（MＰEG-1audio lａｙer ２,即MP２)类型：Ａudｉoﻫ制定者:MPＥGﻫ所需频宽:256~19２ｋbps（压缩6~8倍）特性:算法复杂度中等，用于数字音频广播(DAB)和ＶCD等,2声道，而MUSＩCＡＭ由于其适当的复杂程度和优秀的声音质量，在数字演播室、DＡＢ、ＤVB等数字节目的制作、交换、存储、传送中得到广泛应用。

ﻫ优点:压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。

可以达到“完全透明”的声音质量(ＥBU音质标准)缺点:应用领域:voiｐﻫ版税方式：Freｅﻫ备注:同MPＥG-1 aｕｄio layer １ＭP３（MPＥG-1 aｕｄiｏlayｅr ３）类型:Auｄｉoﻫ制定者：MPEＧ所需频宽:128～112kbps（压缩10~1２倍)特性：编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩1０倍,2声道。

ＭＰ3是在综合ＭUSICＡM和ASＰEＣ的优点的基础上提出的混合压缩技术，在当时的技术条件下，MP3的复杂度显得相对较高，编码不利于实时，但由于MＰ３在低码率条件下高水准的声音质量,使得它成为软解压及网络广播的宠儿。

ﻫ优点：压缩比高，适合用于互联网上的传播ﻫ缺点:ＭＰ３在12８KBitrate及以下时，会出现明显的高频丢失应用领域：ｖoｉp版税方式:Frｅｅﻫ备注：同ＭPEG-1 audio layer 1MPEG-2 audio lａyeｒﻫ类型：Ａudｉoﻫ制定者:MPEＧ所需频宽:与MPEＧ-1层1，层２,层3相同特性：MPEG－2的声音压缩编码采用与MPEG－1声音相同的编译码器,层1、层2和层3的结构也相同，但它能支持５．1声道和7.1声道的环绕立体声。

ﻫ优点:支持5.1声道和7.１声道的环绕立体声ﻫ缺点:-应用领域:vｏｉp版税方式：按个收取ﻫ备注:MPEG－2的声音压缩编码采用与MPEG-１声音相同的编译码器，层1、层2和层３的结构也相同，但它能支持5.１声道和7.1声道的环绕立体声。

ＡAC(Advａｎｃed Audio Coding，先进音频编码)类型:Audioﻫ制定者：MPＥＧﻫ所需频宽：96-128kｂpｓﻫ特性:AＡC可以支持1到4８路之间任意数目的音频声道组合、包括１5路低频效果声道、配音/多语音声道，以及１5路数据。

它可同时传送１6套节目，每套节目的音频及数据结构可任意规定。

ﻫAAC主要可能的应用范围集中在因特网网络传播、数字音频广播,包括卫星直播和数字ＡM、以及数字电视及影院系统等方面。

AAC使用了一种非常灵活的熵编码核心去传输编码频谱数据。

具有48个主要音频通道，16 个低频增强通道,1６个集成数据流, 1６个配音，16 种编排。

优点:支持多种音频声道组合，提供优质的音质ﻫ缺点：-应用领域：voｉｐﻫ版税方式:一次性收费备注:ＡAＣ于19９7年形成国际标准IＳＯ１3８1８-７。

e商务文档

各种音频编码方式的对比

相关文档推荐：