期 末 论 文 题 目 关于数字音频技术发展的研究 学 生 年 级 2011级 专 业 教育技术学 系 别 教育技术学系 学 院 教育科学学院 学 号 **********
哈尔滨师范大学 2013年12月 浅谈数字音频技术发展 李雪 摘要:数字化时代对人类的发展产生了巨大的变化,我们亲身经历了数字技术的蓬勃发展,目睹了它以惊人的速度,渗透到社会与生活的方方面面。数字化技术已全面的进入到广播影视领域,正对我们的行业带来实质性的变革。清楚地把握数字音频技术的发展动向,对正确推进广播影视领域的数字化进程将有极其重要的意义。 关键词:数字音频技术 ;音频格式;虚拟音频系统
一、 模拟与数字音频技术的关系和互补性 把握数字音频技术发展的方向,我们必须对数字音频与模拟音频技术之间有一个科学的认识,并清楚这样一个概念:音频的数字化是指把模拟的音频信号转化为数字音频信号的过程。包括采样、量化、编码三个阶段。 1. 采样 指的是时间轴上连续的信号每隔一段时间间隔抽取出一个信号的幅度样本,把连续的模拟量用一个个离散的点来表示,使其成为时间上离散的脉冲序列。采样频率是每秒钟所抽取声波幅度值样本的次数,单位为kHz。一般来说,采样频率越高声音失真越小,但相应的存储数量也越大。因此需要根据不同的应用范围来选择采样频率。 2. 量化 模拟信号通过采样后变成一个时间上离散的脉冲样品序列,但在脉冲幅度上仍会在其动态范围内连续变化。量化就是把这些在时间上离散的模拟信号无限多的幅度值用有限多的量化电平来表示,使其变为数字信号。量化时,每个幅度值通常会用最接近的量化电平来采样,这个电平也称为量化等级。量化后,连续变化的电平幅值就会被有限个量化等级所取代。从信号质量方面考虑,量化级数越大则量化误差越小,量化后的信号越接近进原信号,但同时会造成信号数据量增大,因此量化比特数的选取要权衡各方面因素综合考虑。 3. 编码 指的是把量化后的信号转换成代码的过程,也就是将已经量化的信号幅值用二进制数码表示。编码后,每一组二进制数码代表一个采样的量化等级,然后把它们排列起来,得到由二进制脉冲组成的信息流。数码率又称比特率,是单位时间内传输的二进制序列的比特数,通常用kbps为单位。显然,采样频率越高,量化比特数越大,数码率就越高,所需要的传输带宽就越宽。常见的如电话质量的音频信号采用8kHz采样,8b量化,码率为64kbps;AM广播采用16kHz采样,14b量化,码率为224kbps;CD音频标准为48kHz、44.1kHz、32kHz采样,16b量化,每声道数码率为768-705.6kbps。数字化是一种手段,但我们始终离不开这个模拟的世界,所以我们要清楚模拟与数字音频技术的优势和弱点。 对音频的质量上来说,数字音频通过模数/数模转换后,越接近模拟音质就越好。但是,数字化技术在音频的编辑、合成、效果处理,存储、传输和网络化,以及在价格等方面,有极大的优势。半导体技术高速发展的今天,在专业音频领域,为了得到温暖的模拟音质,仍旧需要采用电子管器件,如电子管话筒、电子管前置放大器和压缩器,以及功率放大器。为了与数字化音频系统配合使用,不少最新的音频专业电子管产品带有了数字接口。所以,数字化时代的音频技术,并不是弃模变数,而是两者有机的结合,取长补短,用数字化技术去追求模拟的音质,用数字化手段来弥补传统音频设备的弱点。 电脑技术已将人们带入了一个虚拟世界。音频领域也不例外,音频工作站的发展已越来越成熟,人们已称它为虚拟录音棚。虚拟音频制作系统中,包括了录音机、调音台、周边信号发生器、非线性编辑和数据库等。这种虚拟系统不仅有价格的优势,而且功能齐全,符合数字化,网络化发展的要求,其音频的质量可与一些高级传统音频设备抗衡。它符合数字化、网络化的要求,其价格与传统设备相比,则更有优势。 近年来,虚拟音频制作系统对界面的外控操作上,正逐步向传统设备的操作概念发展。还与传统调音台有机结合。除Protools音频工作站已有了Pro Controls外控操作台外,索尼公司已将DMX-100调音台与Pyramix虚拟音频制作系统结合,DMX-100调音台的48路数字音频通道可通过MADI模数/数模转换器与Pyramix连接,Pyramix可通过DMX-100的24个电动马达推子实现外部自动化控制。另外SSL 9000J 系列高级模拟数控台也可与Pyramix虚拟音频制作系统配合使用,音频信号可通过PCM/MADI转换器或DSD转换器与Pyramix连接,SSL 9000J 系列调音台上的控制键钮和推子可通过索尼422协议与Pyramix连接。 上述种种可以看到,数字时代音频的发展,从音质上讲,数字与模拟的追求是一致的;从数字技术在音频领域的应用来看,它仍然依托着传统的模拟设备而向前发展。
二、 数字音频格式PCM和DSD的发展状况 PCM脉码调制数字音频格式是70年代末发展起来的,记录媒体之一的CD,80年代初由飞利浦和索尼公司共同推出。PCM的音频格式也被DVD-A所采用,它支持立体声和5.1环绕声,1999年由DVD讨论会发布和推出的。其发展过程大致经历了以下几个阶段: 1. 数字音频磁记录技术 这种技术是首先由数字磁带录音机(DAT)实现了实用化的。 2. 数字音频光盘存储技术 CD唱片(CD-DA格式)是最先实用化、商品化的数字音频光盘存储系统,目前此系统上存储的音频格式有CD-I、CD-Video、CD-Graphic、CD-Single、图像伴音MPEG-1音频,以及存储在CD数据盘中的wav、midi、mp3等多种文件格式数字音频。 3. 数字音频广播技术 即DAB(Digital Audio Broadcasting),指采用全数字方式进行音频播出的广播。 4. 数字音频计算机处理技术 5. 数字音频网络传输技术 PCM的比特率,从14-bit发展到16-bit、18-bit、20-bit直到24-bit;采样频率从44.1kHz发展到192kHz。到目前为止PCM这项技术可以改善和提高的方面则越来越来小。只是简单的增加PCM比特率和采样率,不能根本的改善它的根本问题。其原因是PCM的主要问题在于: 1)任何PCM数字音频系统需要在其输入端设置急剧升降的滤波器,仅让20 Hz - 22.05 kHz的频率通过(高端22.05 kHz是由于CD 44.1 kHz的一半频率而确定),这是一项非常困难的任务。2)在录音时采用多级或者串联抽选的数字滤波器(减低采样率),在重放时采用多级的内插的数字滤波器(提高采样率),为了控制小信号在编码时的失真,两者又都需要加入重复定量噪声。这样就限制了PCM技术在音频还原时的保真度。 为了全面改善PCM 数字音频技术,获得更好的声音质量,就需要有新的技术来替换。近年来飞利浦和索尼公司再次联手,共同推出一种称为直接流数字编码技术DSD的格式, 其记录媒体为超级音频CD即SACD,支持立体声和5.1环绕声。 DSD音频格式简化了信号流程,去掉了PCM使用的多级滤波器,将模拟音频直接以2.8224MHz的高采样频率,按1-bit的数字脉冲来记录。虽然DSD格式表示的声音信号是数字化数据,但是它又与真正的声波非常接近,可完整的记录当今最佳模拟系统的信息。最好的30ips半英寸模拟录音机能记录的频率能超过50KHz,而DSD格式的频率响应指标为从DC到100KHz。能覆盖高级模拟调音台的动态范围,通过其音频频段的剩余噪声功率,保持在-120dB。DSD的频率响应和动态范围,是任何数字和模拟的录音系统无法与之比拟的。从声音的质量上来说, 数字音频技术是为了接近模拟声音的质量。DSD音频格式的发展将更有利的与模拟音频系统配合。
三、 为何DSD音频格式是最好的数字音频格式
1. 2001年AES 110年会的报告指出DSD是最好的音频格式选择。 2.环球, EMI和Virgin也新加入了索尼和飞利浦的SACD/DSD的行列,除了华纳之外,几乎所有大唱片公司都支持SACD/DSD的格式。 3. 当前还没有真正的直接24/192kHz录音,仅仅是从24/48kHz录音转换的。真正的DVD-A出版非常少,目前还没有这种格式的市场。而在北美已超过400多版的SACD的出版,并且继续在发展。 4.对音乐存储媒体来说,74分钟的容量是十分重要的。4.7 GB 的SACD能存储74分钟DSD 8个通道( 2通道立体声和DSD 6通道的环绕声)。 采用了一种被称为直接流数字转换( Direct Stream Transfer)无损编码方式的飞利浦技术。这种无损编码可节省50%的存储空间。 DVD-A采用的是一种被称为MLP无损包装(Meridian Lossless Packing )的编码技术。4.7 GB 的DVD-A 能存储55分钟20 bit,192kHz PCM 6通道的环绕声。这种无损编码可节省35%-50%的存储空间。
四、 DSD的应用范围 1. DSD的脉冲序列可以直接下转为传统的PCM数字音频。目前在PCM和DSD共存的期,采用DSD下转运算技术,可以尽量保证音频信号的质量,消除内部重复量化错误,抑制波动,将混淆误差控制在最小。将DSD比特流下转为16-bit/44.1 kHz数字音频,直接记录在普通的CD上,可使16-bit的数字音频接近20到24-bit的精度,使得16-bit的CD尽可能的保持DSD的音质。 2. DSD选取2.8224 MHz高采样频率,其优势是可高精度的按整数的乘法和除法下转当前所有PCM采样频率。以DSD格式记录既能保证音频质量,又能通过下转满足不同的应用和要求。除了用于音乐录音外,也适用于影视的音频制作,最终合成的节目可通过下转,用来传输或记录在媒体上,如5.1的节目需要进行AC-3或DTS的编码。DSD音频格式与现有的音频设备配合,不仅仅可以改善当前节目的音频质量,而且对高清晰数字电影和高清晰数字电视的音频是一个极大的支持。 3. DSD是理想的节目素材存储格式,用于母版的保存或数据库的建立。DSD的采样频率是CD的64倍即2,822,400 Hz。但是DSD每个采样仅占用1 bit,因此每个通道每秒的比特率为1 x 2,822,400 Hz或 2,822,400 bits。而CD每个采样占用16 bits,因此每个通道每秒的比特率为16 x 44,100 Hz或705,600 bits。实际上,DSD总的数据流只大于普通CD的4倍,数据量可以被当前的磁带和硬盘容纳。 4. DSD也是保存节目的理想格式。各国音响资料馆都面临着一个共同的问题,磁带只有30年的保存期,而每种版权则有100年的保护。选择哪种方案可将原始资料较理想的保存下来?这个问题一直得不到解决的方案,而资料越积越多,部分老化的资料已无法恢复。直到SACD的出现,美国国会所属的国家档案馆首先决定采用。 5. DSD的录音制作与传统的录音制作,对设备和技术上没有重要的区别。需要增加的是DSD的模数/数模转换器和DSD录音编辑工作站,不少录音棚已经采用高级模拟调音台和现存的PCM录音设备成功的进行了DSD的录音。飞利浦发展了一种DSD录音技术的P3D的转换格式,即可以将64 DSD bits描述成3 x 24-bit AES-EBU数字节,有可能将一台24轨/24-bit 44.1 kHz PCM录音机改变成为一台8路的DSD录音机。