当前位置:
文档之家› 多媒体技术及应用第二章音频信息的获取与处理
多媒体技术及应用第二章音频信息的获取与处理
则可由 x(nT) 完全确定 x(t)。 当 fN = 1/(2T) 时,称 fN 为奈奎斯特频率
常用音频采样率:8kHz、11.025kHz、16kHz、22.05kHz、44.1kHz 及 48kHz
2.2.2 数字音频获取
● 量化
量化概念
通过采样得到的表示声音强弱的函数 x(nT) 是连续的,为把 x(nT) 存入计 算机,就必须将采样值离散化,即量化成一个有限个幅度值的集合 x(nT)
采样方法 语设音连信续号信频号谱x在(t)高的频频处谱迅为速x下(f)降,,以但采非样限间带隔。T应采用样时得只到对离一散定信频号率x范(nT围) 内如的果信满号足感:兴当趣|,f |就≥ 可fc (以fc对是经信滤号波高限端带截的止音频频率信)号时采,样有。这样,在采样 前,用一个锐截止模拟低通T滤≤波1/器(2f对c) 音或频fc信≤ 号1/(进2T行) 滤波。
音频数据大小
数字化文件数据量(字节/秒) = 采样频率(Hz)(量化位数(bit) / 8 )声道数
影响数据因素
数据的采样频率及量化位数。采样频率越高,量化位数越多,数据越大
2.2.3 数字音频音质与数据量
音质与数字音频参数的对应关系
采样频率 kHz 8.000 8.000 11.025 11.025 22.050 22.050 44.100 44,100
2.2.4 数字音频文件格式
MID ● MIDI 音频文件
● 定义:一种计算机数字音乐接口生成的数字描述音频文件,文件中包含 音符、定时和多达 16 个通道的乐器定义。
● 特点:文件不记载声音本身波形数据,用数字形式记录声音特征,演奏 MIDI 乐器或重放时,将数字描述与声音对位处理;数据量小。
● 应用:适合应用在对资源占用要求苛刻的场合,比如多媒体光盘、游戏 制作、背景音乐等。主要用于计算机声音的重放和处理。
采样过程
按固定间隔 采样声音波形
采样声音波 形之后的结果
2.2.2 数字音频获取
● 采样
采样定理 奈奎离斯散特信号( Nxy(qnuTs)t是) 从采连样续定信理号:只x(t要) 上采取样出频的率一大部于分或值者,等那于么信用号x中(n所T)包能 够含惟的一最地高恢频复率出的x两(t)倍吗;即当信号是最高频率时,每个周期至少采样两个 点,则理论上就可以完全恢复原来的信号。
2.2.4 数字音频文件格式
VOC ● 波形音频文件
● 定义:一种 Creative 公司研制的波形音频文件格式,也是声霸卡(Sound Blaster) 使用的音频文件格式。
● 特点:由文件头块和音频数据块组成。文件头包含一个标识、版本号和 一个指向数据块起始的指针;数据块分成各种类型的子块。
● 应用:利用声霸卡提供的软件可实现 VOC 和 WAV 转换:VOC2WAV 转换 VOC 到 WAV;WAV2VOC 转换 WAV 到 VOC。
扩展名为 RMI 的文件是 Microsoft 公司的 MIDI 文件格式,可包括图片、标记和文本
2.2.4 数字音频文件格式
MP3 ● 压缩音频文件
● 定义:采用 MPEG 标准音频数据压缩编码中层 Ⅲ 技术压缩之后的数字 音频文件。
● 特点:压缩比高、数据量小、音质好,压缩比例有 10 : 1、17 : 1,甚至 70 : 1;数据率可以是 64kbps,也可以是 320kbps。
实时
音频是多媒体的重要媒体之一
语音 言语
清音/浊音 爆破音
音频Audio
非语音 声音
乐音 杂音(音响)
认识声音
空气、液体、固体
声音是机械振动在弹性介质中传播的机械波 ,称为声波。
声音转换为电信号时,声音的电信号在时间 和幅度上都是连续的模拟信号。
● 声音特性
振幅
● 振幅 — 波的高低幅度,表示声音的强弱 ● 周期 — 两个相邻波之间的时间长度 ● 频率 — 每秒钟波振动的次数,单位是 Hz
音频数据大小
数字化文件数据量(字节/秒) = 采样频率(Hz)(量化位数(bit) / 8 )声道数
举例
如果采样频率为44.1kHz, 分辨率为16位,立体声,录 音时间为10s,符合CD音质的 声音文件的大小是多少?
计算数字音频文件大小
44100Hz×(16/8)×2 ×10s =1764KByte
多媒体技术及应用第二章音 频信息的获取与处理
● 主要知识点
2.1声音概述 2.2数字化音频 2.3音乐合成与 MIDI 2.4音频卡 2.5数字音频压缩标准
2.1.1 声音定义 ● 声音概念 ● 声音特性
2.1.2 声音基本特点 ● 声音传播 ● 声音频率 ● 声音传播方向 ● 声音三要素 ● 声音连续、相关及
实时性 声音具有实时性。对处理声音的计算机硬件和软件提出很高要求
2.2 数字化音频
转换
模拟信号
数字信号
音频数字化需要考虑的问题
采样、量化、编码
音频信号处理过程流程
结束 开始
音 频 信 号 频 率
采 样 频 率
采 样
量 化
保 存 为 声 音 文 件
2.2.2 数字音频获取
● 采样
采样概念
声波是连续信号, 或称连续时间函数 x(t)。 用计算机处理这些信号时应先 离散化,即按一定的时间间隔 (T) 取值,得到 x(nT) ( n为整数 ),T 称采样 周期,1/T 称采样频率 ( 每秒钟采样次数 ),x(nT) 称采样值 ( 或离散信号 )
影响音质因素
数据的采样频率及量化位数。采样频率越低,量化位数越少,音质越差
采样频率、采样精度和声道数对声音的音质和占用的 存储空间起着决定性作用,如下表所示:
采样频率、采样精度、声道数与存储容量关系
声音质量
电话音质 AM音质 FM音质 CD音质 DAT音质
采样频率 (KHZ) 8
11.025
22.05
44.1
48
采样精度 (bit) 8
8
16
16
16
单双声声道道/ 1 1 2 2 2
存储容量 (Mb/min)
0.46 0.63 5.05 10.09
10.99
2.2.3 数字音频音质与数据量
音质基本概念
音质是指声音的质量,与频率的范围成正比;频率范围越宽,音质越好
影响音质因素
数据的采样频率及量化位数。采样频率越低,量化位数越少,音质越差
2.2.4 数字音频文件格式
WAV ● 波形音频文件
● 定义:一种最直接的表达声音波形的数字音频文件,主要用于自然声音 的保存与重放。
● 特点:声音层次丰富、还原性好、表现力强;如果采样率高,其音质极 佳;但数据量大,与采样频率、量化位数、声道数成正比。
● 应用:电子幻灯片 PowerPoint 软件、各种算法语言及多媒体平台软件 可直接使用,适合多媒体系统、音乐光盘制作等。
声音的特色,主要影响因素是复音;复 音指具有不同频率和不同振幅的混合声 音,其中最低频率是 “基音”,是声音的 基调钢,琴其他频吉率他的声音小为号“谐音小(泛提音琴)”
声音的主要性质
连续性 声音具有连续性。在时间轴上是连续信号,具有连续性和过程性
相关性 声音具有相关性。构成声音的数据,前后之间具有强烈的相关性
● 应用:可以在个人计算机、MP3 半导体播放机和 MP3 激光播放机上进 行播放;适合用在国际互联网和各个领域。
MP3播放器Winamp MP3是Internet上流行的音乐格式
2.2.4 数字音频文件格式
WMA ● 流式音频文件
● 定义:Microsoft 研制的一种压缩离散文件或流式文件, 它提供了一个 MP3 之外的选择机会。
声音的频率范围
次声波 < 20 Hz
人耳可听域 20 ~ 20,000 Hz
超声波 > 20,000 Hz
男性语音
100 Hz ~ 9,000 Hz
女性语音 声
源
电话语音
150 Hz ~ 10,000 Hz 频
200 Hz ~ 3,400 Hz
带
种
调幅广播(AM)
50 Hz ~ 7,000 Hz
宽
2.2.4 数字音频文件格式
文件格式 WAV VOC MP3 MIDI WMA RA PCM
常见的声音文件格式
说明 Windows采用的波形声音文件存储格式
Creative公司波形音频文件格式 MPEG Layer III最常见的音乐压缩文件
Windows 的MIDI文件存储格式 流式音频文件
RealNetworks公司的流式声音文件格式 数字音频文件
● 声音从声源发出后,经过多次反射到达人类听觉器官的声音是 “反射声”
●声音的三要素
● 音调 —— (高低)
● 音强 —— (强弱) ● 音色 —— (特质)
代表声音的高低,与频率有关;使 用音频处理软件对声音的频率进行 调整时,(低其) 音调也会随之发(高生)变化
声音的强度 (响度或音量),与声波振幅成 正比;唱盘、CD 盘等声音载体中的音强 不变,通过播放设备的音量控制可改变聆 听时强(度弱);音频处理(强软)件可提高声(停源) 音强
● 特点:相对于 MP3 具有较高压缩率和良好音质。当小于 128kbps 时最为 出色且编码后音频文件很小;当大于 128kbps 时音质损失过大。
2.2.2 数字音频获取
● 编码
编码概念 音频模拟信号经过采样与量化之后,为把数字化音频存入计算机,需对 其编码,即用二进制数表示每个采样的量化值,完成整个模数转换过程
PCM 编码 一种最方便简单的编码方法是脉冲编码调制,常称为 PCM (Pulse Code Modulation) 编码。 它是一种未经压缩的数字音频信号,常作为一种参 考信号,以便其他编码方法与之比较,或在此基础上作进一步压缩编码