当前位置:文档之家› 视音频编解码技术及应用

视音频编解码技术及应用

工科类信息工程学院本科论文题目:视音频编解码技术及应用别系:信息工程学院专业:信息工程届次: 2012届学号: 2012041183姓名:焦杰指导教师:杨宇老师2014年9月28日视音频编解码技术及应用(——视音频编解码技术及应用焦杰【摘要】首先分析了在各个不同的历史阶段为满足不同的需求而提出的各种音频编解码器,讨论了最常见编解码器的特征和性能。

然后考虑了它们对当前和未来移动通信需求的适应性,比较了各种音频编解码器的性能。

最后给出了一些音频编解码器在移动通信系统中的应用。

【关键词】音频编解码器;增强的高效高级音频编码;增强的自适应多码率宽带音频编码;可变速率多模式宽带音频编码;谱带恢复。

1 引言当今,各种各样的音频编解码器广泛应用于Et常生活中。

选择哪种编解码器通常取决于以下因素:音频素材的内容类型、可用通信速率和收听场合对音质的要求。

可能影响编解码器选择的其它因素,还包括标准化情形、专利费和市场品牌。

尽管MP3格式已获得了很大的成功,但它不适合于移动设备。

近来,效率较高的编解码器(如AAC和AMR)已被提出,并为适应移动的音频应用而不断改进。

笔者将通过揭示音频编码和解码的技术原理、标准化情形以及涉及可用技术和市场需求的编解码器的适应性来评估最常见的音频编解码器,同时也考虑到移动通信领域在硬件和软件上的发展状况,分析现有和将来的音频应用,以阐明对移动音频的需求和期待。

2 音频编解码器的历史背景音频编解码器的简短历史可追溯到20世纪80年代中期,德国Fraunhofer 研究所首先开始从事高质量、低码率的音频编码研究。

他们的项目作为面向市场的尤里卡(Eureka)研究计划(EU一147)的一个部分得到了欧盟的财政资助。

1989年,Fraunhofer在德国获得了MP3的专利权。

后来,MP3递交给了国际标准化组织(ISO),于1992年成为正式的MPEG一1标准的一部分。

1995年1月,Fraunhofer 在美国也申请了MP3专利,并于1996年l1月获批。

使用MP3格式压缩的个人计算机用户能将一张普通的音乐CD (激光唱碟)的内容压缩到它原来大小的1/10,而在音质上只有很小的损伤。

这样,12个d,n,t的音乐可存储在一张可录制的激光唱碟上,而且可用一台MP3格式的CD播放器或一台普通的个人计算机来播放。

现今,市场上提供的移动设备从笔记本电脑、掌上型电脑到手机应有尽有,而且高速无线网络正在日益发展。

与此同时,宽带语音和高保真音频压缩编码技术在商业应用驱动下得到了迅速的发展。

电话语音、宽带语音和宽带音频信号不仅在带宽和动态范围上有所不同,而且在收听者对所提供的音质期待上也不相同。

宽带的使用不仅改善了语音的可懂度和自然度,也增加了面对面直接交流的感觉,更容易识别说话人。

目前,移动通信领域不断推出新的业务,包括流媒体、多媒体短信、广播和下载等。

流媒体业务包括听新闻、听音乐、运动比赛的监听、商业广告、交互式游戏等。

广播业务类似于流业务,此外还包括因特网的网上广播。

与下载的音频文件不同,流式音频文件无需存储在用户的硬盘上,但通过用户的音频播放器可像传统的收音机那样进行广播。

多媒体短信业务也与流业务类似,但由于受文件大小的限制,只包括商业单位与个人以及个人与个人之间的短信发送和接收。

下载业务包括网络上的音乐、书籍和连环图画的下载。

上述应用对音频编解码器提出的要求主要包括:(1)处理通用内容的能力;(2)在最低码率下保证有足够好且始终如一的音质;(3)在最低码率下要获得最好的音质;(4)可变码率要求下的高质量操作。

对于低资源设备(具有低的存储和计算资源),必须对音频编解码器进行优化。

目前,开发和标准化编解码器的工作主要由3GPP (The 3rd Generation Part —nership Project,第三代移动通信伙伴项目)负责。

3 音频编解码器的发展趋势及比较移动通信平台的硬件正在经历迅速的发展,因此,在未来的移动设备中期待出现新的软件和应用。

随着中央处理单元(CPU)处理能力的不断增强以及存储器价格的下降,可以推断出在不久的将来移动设备将会是怎样的。

无线信道也处在不断的发展之中,连接移动设备的带宽正在不断的增加,是否还需要像HE—AAC 那样能提供有效压缩的编解码器。

3.1 新式移动电话的特征硬件研究的主要目标是移动电话,因为移动电话的数量远远超过个人数字助理(PDA)的数量。

移动电话也是一个很好的低端移动设备平台的代表,因为对移动电话的主要设计要求是其尺寸和重量。

3G移动电话操作系统的主要制造商Symbian公司最近推出的Symbian操作系统OS 8,已用于像Nokia 6630这样的基于60系列、SDK2.0平台的3G移动电话上,能支持AMR,AMR—WB,MP3,AAC 和RealAudio等音频编解码器口01。

如Nokia 7710这样较高档的手机甚至能支持立体声的音频编解码器。

因此,在中、高档移动电话手机中,对音频和多媒体应用的硬件瓶颈已被打破。

然而,在低档的移动电话手机中,主要由于考虑到低价格的要求,对于音频的应用目前仍然存在一些硬件限制,但在不久的将来,相信这些硬件限制将不会存在。

3.2 移动通信网络的特征目前用于移动电话系统的基本GPRS(GeneralPacket Radio Services,通用分组无线业务)网络支持的通信速率为30-50 Kb/s。

EDGE (Enhanced Datarates for GSM Evolution,增强数据速率的GSM演进方案)或EGPRS(Enhanced GPRS,增强型GPRS)技术将终端用户的速率增加到了120~150 Kb/s,甚至更高。

如果手机中使用了最新的音频编解码器,则EGPRS的速率对于流式音频应用是足够的。

EGPRS可应用于大部分的中档手机甚至一些低档手机,但目前只能在大城市和市郊可用。

UMTS(Universal Mobil Telecommu.nication System,通用移动通信系统)提供的数据速率为384 Kb/s(TDD 模式)-2 Mb/s(TDD 模式),但到目前为止,UM 只应用于高档手机且仅在市区可用⋯。

3.3 音频编解码器的比较比较音频流质量的方法有许多种,其中一个方法是让听众来判断质量。

通常将EBU(European Broad—casting Union,欧洲广播联盟) 采用的一种测试MI JSHR A MIJhi Stimulus test with Hidden Referenceand Anchors作为评判的参考_l21。

它是由EBU 项目组B/AIM 开发并提议的一种先进的测试方法,现已提交给ITU进行标准化。

MUSHRA是一种主观测试方法,参加测试的一组听众来自欧盟的不同国家,他们使用各种不同类型的音频信号作为编码器的输入,将解码器的输出与一个参考信号进行比较,并按100分制进行评分。

如果给出的平均分在8l~100之间,则认为是“优”,6l~80则认为是“好”,41~60则认为“一般”,21~40则认为“差”,0~20则认为“坏”。

不同类型的音乐,例如古典音乐、民间音乐、爵士乐和流行音乐都要测试。

演播室和直播环境中的男、女声广播节目也被测试。

EBU公布的测试结果是:在码率为48 Kb/s的立体声情况下,HE—AAC的性能最好,音质几乎接近立体声的CD音质,获得了80分的最高分,其它依次是MP3 Pro (76分),MPEG一4 AAC,Real Audio 8,Win—dows Media Audio 8和MP3。

测试证实了SBR增强编解码器MP3 Pro和HE—AAC的优越性能。

EBU还没有报告AMR—WB+编解码器的MUSHRA测试结果。

对于分组交换流(PSS)、多媒体短信业务(MMS),3GPP已候选了2种码率范围的编解码方案:(1)当码率低于24 Kb/s时,AMR—WB+,HE—AAC以及EAAC+将作为候选方案;(2)当码率高于24 Kb/s时,HE-AAC和EAAC+将作为候选方案。

3GPP对AMR—WB+编解码器在48 Kb/s码率下进行了MUSHRA测试,得到83分。

对于低于24 Kb/s码率的立体声,3GPP的MUSHRA 测试结果表明AMR—wB+的性能稍好于EAAC+。

3.4 移动电话对最新音频编解码器的支持目前,在中、高档的手机中都已使用了像AAC,AMR—WB这样的编解码器,但还不支持使用SBR技术的最新编解码器。

这意味着HE—AAC(aacPlus)、EAAC+和AMR—WB+还不能应用在移动系统中。

但随着3GPP标准的推出,支持这些最新编解码器的产品不久就会上市。

Nokia已于2004年7月签署了aacPlus授权协议书,这意味着aacPlus很快将用在其手机上。

Ogg Vorbis开放编解码器在移动电话商业市场上似乎不那么成功。

他们通常不能作为标准而被支持,但是对此感兴趣的用户可以安装编码器和播放器。

目前一个称为OggPlay的免费播放器能在具有SymbianOS7或较新版操作系统的60系列手机上支持ogg,mp3及acc格式文件Windows Media在移动电话市场中还没有获得成功,无法取得像在PC市场中那样的地位。

然而,RealMedia Player已在移动电话中被使用,从而在移动通信市场中占有一席之地。

3.5 音频编解码器在移动设备中的应用下载音乐内容到手机的应用已经存在,目前至少有2个商业的播放器(MP3go和UltraMP3)支持MP3格式音乐的播放。

这些播放器也支持播放列表的创建和使用。

目前,其主要缺点是:对于高音质的MP3音乐,每首歌需要3~5 MB 的存储容量。

如果使用HE—AAC或AMR—WB,则每首歌所需的存储容量可压缩到l MB以下。

这就使得低档的手机有可能存储更多的音乐;在EGPRS网络中一首歌的下载时间也会从5 min减到1 min。

英国移动电话公司MMO2在2004年11月开通了一项下载音乐到移动电话手机的业务[161。

它使用了称做O2数字音乐播放器。

音乐文件以MPEG4 aac—Plus的格式进行编码,其大小约为l MB。

在GPRS 网络中一首歌的下载时间约90 S。

版权保护技术由瑞士的SDC(Secure Digital Container)公司提供。

移动电话上的流式应用已存在,手机上可享受音乐和视频。

例如,芬兰广播公司YLE在GPRS网络上以20~50Kb/s的流发送新闻。

选择这种码率,在芬兰的任何地方都能接收新闻。

目前最常见的格式是Real —Media,但在不久的将来,其它的格式也必将可用。

目前存在的一个问题是:由于GPRS网络的带宽有限而无法保证媒体内容的质量。

相关主题