模拟音频与数字音频
现在我们来进行一个计算,看看一个数字音频文件的数据量到底有 多大。
假设我们采样,
即采样成标准的CD音质(也称作红皮书音频)。一秒钟的数字音频数据量
相当于多少个汉字? 分析: 一秒钟内采样44.1千次,每次的数据量是16×2=32bit, 一秒钟内的数据量便是44.1k×32bit 一个字节(Byte)含有8个位(Bit),一个汉字在电脑里占用两个字节, 那么44.1k×32bit的空间可以存储 (44.1k×32bit) /(2×8)=88200个汉 字,也就是说一秒钟的数字音频数据量与近九万个汉字(一部中篇小说)的数
据量相当。
常见音频文件类型 • APE格式:是一种无损压缩音频格式 • CD Audio 目前CD唱片所采用的格式,又叫“红皮书”格式, 记录的多是波形流。但缺点是无法编辑,文件长度太大。 • WAV 微软的标准声音格式。Windows本身存放数字声音的标 准格式,目前也成为通用性的数字声音文件格式。 WAVE文件是 以声音的波形来表示声音的,这种音频格式基本上不经过什么压 缩,所以体积较大。 • Ra/Rm/RMX RealNetworks公司开发的主要适用于网络实时数字 音频流技术的文件格式,它将音频文件大大压缩,所以在高保真 方面远不如MP3,不过体积小,适合实时收听是最大的优势。 • WMA 是微软公司针对Real公司(冤家路窄)开发的新一代网 上流式数字音频压缩技术。这种压缩技术的特点是以减少数据流 量但保持音质的方法来达到更高的压缩率目的,同时兼顾了保真 度和网络传输需求,所以具有一定的先进性,其压缩率一般可以 达到1:18。甚至慢慢开始侵蚀MP3的地盘了(相同音质,Wma文 件是Mp3文件大小的一半)此外,WMA还可以通过DRM(Digital Rights Management)方案加入防止拷贝,或者加入限制播放时间 和播放次数,甚至是限制播放的机器,可有力地防止盗版。
常见音频文件类型
• MIDI是Musical Instrument Digital Interface的缩写,又称作 乐器数字接口,是数字音乐/电子合成乐器的统一国际标 准。 它定义了计算机音乐程序、数字合成器及其它电子设备交 换音乐信号的方式,规定了不同厂家的电子乐器与计算机 连接的电缆和硬件及设备间数据传输的协议,可以模拟多 种乐器的声音。MIDI文件就是MIDI格式的文件,在MIDI 文件中存储的是一些指令。把这些指令发送给声卡,由声 卡按照指令将声音合成出来。 • DVD Audio 是新一代的数字音频格式,与DVD Video尺 寸以及容量相同,为音乐格式的DVD光碟,取样频率为 “48kHz/96kHz/192kHz”和“44.1kHz/88.2kHz/176.4kHz” 可选择,量化位数可以为16、20或24比特,它们之间可自 由地进行组合。低采样率的192kHz、176.4kHz虽然是2声 道重播专用,但它最多可收录到6声道。而以2声道 192kHz/24b或6声道96kHz/24b收录声音,可容纳74分钟以 上的录音,动态范围达144dB,整体效果出类拔萃。
音频、视频、图像信息的加工
一、基本概念 与 实例欣赏
(一)数字音频的采集和加工书P85~88
• 自然界中存在的各种声音,都是由于物体振动产 生的。物体振动使得空气产生振动波,再由人体 内耳接收,形成听觉。这种声音的波形变化是连 续的,称为模拟音频。 • 计算机中所存贮的任何信息,包括声音信息,都 是用二进制数值来表示的,我们把这类音频称为 数字音频。
音频的基本的知识:
什么是数字化音频技术? 模拟信号 数字信号
把模拟音频转成数字音频,在电脑音乐里就称作采样,其过
程所用到的主要硬件设备便是模拟/数字转换器(Analog to Digital Converter,即ADC)。采样的过程实际上是将通常的模拟音频信号的 电信号转换成许多称作“比特(Bit)”的二进制码0和1,这些0和1便 构成了数字音频文件。
常见音频文件类型
• MP3 MP3是MPEG-1 LAYER3的简写,是网上最为流 行的音乐存放、下载格式。 • MP4采用的是美国电话电报公司(AT&T)所研发的以“知 觉编码”为关键技术的a2b音乐压缩技术,由美国网络技 术公司(GMO)及RIAA联合公布的一种新的音乐格式。 MP4在文件中采用了保护版权的编码技术,只有特定的用 户才可以播放,有效地保证了音乐版权的合法性。另外 MP4的压缩比达到了1:15,体积较MP3更小,但音质却没 有下降。不过因为只有特定的用户才能播放这种文件,因 此其流传与MP3相比差距甚远。 • VOC文件,在DOS程序和游戏中常会遇到这种文件,它 是随声霸卡一起产生的数字声音文件,与WAV文件的结 构相似,可以通过一些工具软件方便地互相转换。
采样的频率、采样的位数、 比特率(位速率)
如下图,图中的正弦曲线代表原始音频曲线;填了颜色的方格代表
采样后得到的结果,二者越吻合说明采样结果越好。
Y : 轴 采 样 分 辨 率 X轴:采样频率
上图中的横坐标便是采样频率;纵坐标便是采样分辨率。
采样的频率越大则音质越有保证;同理,当纵坐标的采样的分 辨率越小则越有利于音质的提高,即采样的位数越大越好。 X轴:采样频率
• 采样的频率(采样率、采率 )是指录音设备在一 秒钟内对声音信号的采样次数,采样频率越高 声音的还原就越真实越自然。在当今的主流采 集卡上,采样频率一般共分为22.05KHz、 44.1KHz、48KHz三个等级。 • 采样位数:可以理解为采集卡处理声音的解析 度。这个数值越大,解析度就越高,录制和回 放的声音就越真实。 • 比特率(码率等):表示经过编码(压缩)后的音 频数据每秒钟需要用多少个比特来表示,换句 话说是指在一个数据流中每秒钟能通过的信息 量。比特率越高音质越好,但编码后的文件越 大;如果比特率越少则情况刚好相反。
采样频率一般共分为22.05khz、44.1khz、48khz三个等级。
22.05只能达到fm广播的声音品质,
44.1khz是cd音质, 48khz则是dvd audio或专业领域才会采用。 Y轴:采样分辨率 8位(8Bit)不是说把纵坐标分成8份,而是分成2^8=256份; 同理16位是把纵坐标分成2^16=65536份; 而24位则分成2^24=16777216份。