当前位置：文档之家› 多媒体技术及应用第二章音频信息的获取与处理

多媒体技术及应用第二章音频信息的获取与处理

则可由 x(nT) 完全确定 x(t)。当 fN = 1/(2T) 时，称 fN 为奈奎斯特频率
常用音频采样率：8kHz、11.025kHz、16kHz、22.05kHz、44.1kHz 及 48kHz
2.2.2 数字音频获取
● 量化
量化概念
通过采样得到的表示声音强弱的函数 x(nT) 是连续的，为把 x(nT) 存入计算机，就必须将采样值离散化，即量化成一个有限个幅度值的集合 x(nT)
采样方法语设音连信续号信频号谱x在(t)高的频频处谱迅为速x下(f)降，，以但采非样限间带隔。T应采用样时得只到对离一散定信频号率x范(nT围) 内如的果信满号足感：兴当趣|，f |就≥ 可fc (以fc对是经信滤号波高限端带截的止音频频率信)号时采，样有。这样，在采样前，用一个锐截止模拟低通T滤≤波1/器(2f对c) 音或频fc信≤ 号1/(进2T行) 滤波。
音频数据大小
数字化文件数据量(字节/秒) = 采样频率(Hz)(量化位数(bit) / 8 )声道数
影响数据因素
数据的采样频率及量化位数。采样频率越高，量化位数越多，数据越大
2.2.3 数字音频音质与数据量
音质与数字音频参数的对应关系
采样频率 kHz 8.000 8.000 11.025 11.025 22.050 22.050 44.100 44,100
2.2.4 数字音频文件格式
MID ● MIDI 音频文件
● 定义：一种计算机数字音乐接口生成的数字描述音频文件，文件中包含音符、定时和多达 16 个通道的乐器定义。
● 特点：文件不记载声音本身波形数据，用数字形式记录声音特征，演奏 MIDI 乐器或重放时，将数字描述与声音对位处理；数据量小。
● 应用：适合应用在对资源占用要求苛刻的场合，比如多媒体光盘、游戏制作、背景音乐等。主要用于计算机声音的重放和处理。
采样过程
按固定间隔采样声音波形
采样声音波形之后的结果
2.2.2 数字音频获取
● 采样
采样定理奈奎离斯散特信号( Nxy(qnuTs)t是) 从采连样续定信理号：只x(t要) 上采取样出频的率一大部于分或值者，等那于么信用号x中(n所T)包能够含惟的一最地高恢频复率出的x两(t)倍吗；即当信号是最高频率时，每个周期至少采样两个点，则理论上就可以完全恢复原来的信号。
2.2.4 数字音频文件格式
VOC ● 波形音频文件
● 定义：一种 Creative 公司研制的波形音频文件格式，也是声霸卡(Sound Blaster) 使用的音频文件格式。
● 特点：由文件头块和音频数据块组成。文件头包含一个标识、版本号和一个指向数据块起始的指针；数据块分成各种类型的子块。
● 应用：利用声霸卡提供的软件可实现 VOC 和 WAV 转换：VOC2WAV 转换 VOC 到 WAV；WAV2VOC 转换 WAV 到 VOC。
扩展名为 RMI 的文件是 Microsoft 公司的 MIDI 文件格式，可包括图片、标记和文本
2.2.4 数字音频文件格式
MP3 ● 压缩音频文件
● 定义：采用 MPEG 标准音频数据压缩编码中层 Ⅲ 技术压缩之后的数字音频文件。
● 特点：压缩比高、数据量小、音质好，压缩比例有 10 : 1、17 : 1，甚至 70 : 1；数据率可以是 64kbps，也可以是 320kbps。
实时
音频是多媒体的重要媒体之一
语音言语
清音/浊音爆破音
音频Audio
非语音声音
乐音杂音（音响）
认识声音
空气、液体、固体
声音是机械振动在弹性介质中传播的机械波，称为声波。
声音转换为电信号时，声音的电信号在时间和幅度上都是连续的模拟信号。
● 声音特性
振幅
● 振幅 — 波的高低幅度，表示声音的强弱 ● 周期 — 两个相邻波之间的时间长度 ● 频率 — 每秒钟波振动的次数，单位是 Hz
音频数据大小
数字化文件数据量(字节/秒) = 采样频率(Hz)(量化位数(bit) / 8 )声道数
举例
如果采样频率为44.1kHz，分辨率为16位，立体声，录音时间为10s，符合CD音质的声音文件的大小是多少？
计算数字音频文件大小
44100Hz×(16/8)×2 ×10s =1764KByte
多媒体技术及应用第二章音频信息的获取与处理
● 主要知识点
2.1声音概述 2.2数字化音频 2.3音乐合成与 MIDI 2.4音频卡 2.5数字音频压缩标准
2.1.1 声音定义 ● 声音概念 ● 声音特性
2.1.2 声音基本特点 ● 声音传播 ● 声音频率 ● 声音传播方向 ● 声音三要素 ● 声音连续、相关及
实时性声音具有实时性。对处理声音的计算机硬件和软件提出很高要求
2.2 数字化音频
转换
模拟信号
数字信号
音频数字化需要考虑的问题
采样、量化、编码
音频信号处理过程流程
结束开始
音频信号频率
采样频率
采样
量化
保存为声音文件
2.2.2 数字音频获取
● 采样
采样概念
声波是连续信号，或称连续时间函数 x(t)。用计算机处理这些信号时应先离散化，即按一定的时间间隔 (T) 取值，得到 x(nT) ( n为整数 )，T 称采样周期，1/T 称采样频率 ( 每秒钟采样次数 )，x(nT) 称采样值 ( 或离散信号 )
影响音质因素
数据的采样频率及量化位数。采样频率越低，量化位数越少，音质越差
采样频率、采样精度和声道数对声音的音质和占用的存储空间起着决定性作用，如下表所示：
采样频率、采样精度、声道数与存储容量关系
声音质量
电话音质 AM音质 FM音质 CD音质 DAT音质
采样频率 (KHZ) 8
11.025
22.05
44.1
48
采样精度 (bit) 8
8
16
16
16
单双声声道道/ 1 1 2 2 2
存储容量（Mb/min）
0.46 0.63 5.05 10.09
10.99
2.2.3 数字音频音质与数据量
音质基本概念
音质是指声音的质量，与频率的范围成正比；频率范围越宽，音质越好
影响音质因素
数据的采样频率及量化位数。采样频率越低，量化位数越少，音质越差
2.2.4 数字音频文件格式
WAV ● 波形音频文件
● 定义：一种最直接的表达声音波形的数字音频文件，主要用于自然声音的保存与重放。
● 特点：声音层次丰富、还原性好、表现力强；如果采样率高，其音质极佳；但数据量大，与采样频率、量化位数、声道数成正比。
● 应用：电子幻灯片 PowerPoint 软件、各种算法语言及多媒体平台软件可直接使用，适合多媒体系统、音乐光盘制作等。
声音的特色，主要影响因素是复音；复音指具有不同频率和不同振幅的混合声音，其中最低频率是 “基音”，是声音的基调钢，琴其他频吉率他的声音小为号“谐音小(泛提音琴)”
声音的主要性质
连续性声音具有连续性。在时间轴上是连续信号，具有连续性和过程性
相关性声音具有相关性。构成声音的数据，前后之间具有强烈的相关性
● 应用：可以在个人计算机、MP3 半导体播放机和 MP3 激光播放机上进行播放；适合用在国际互联网和各个领域。
MP3播放器Winamp MP3是Internet上流行的音乐格式
2.2.4 数字音频文件格式
WMA ● 流式音频文件
● 定义：Microsoft 研制的一种压缩离散文件或流式文件，它提供了一个 MP3 之外的选择机会。
声音的频率范围
次声波 < 20 Hz
人耳可听域 20 ~ 20,000 Hz
超声波 > 20,000 Hz
男性语音
100 Hz ~ 9,000 Hz
女性语音声
源
电话语音
150 Hz ~ 10,000 Hz 频
200 Hz ~ 3,400 Hz
带
种
调幅广播(AM)
50 Hz ~ 7,000 Hz
宽
2.2.4 数字音频文件格式
文件格式 WAV VOC MP3 MIDI WMA RA PCM
常见的声音文件格式
说明 Windows采用的波形声音文件存储格式
Creative公司波形音频文件格式 MPEG Layer III最常见的音乐压缩文件
Windows 的MIDI文件存储格式流式音频文件
RealNetworks公司的流式声音文件格式数字音频文件
● 声音从声源发出后，经过多次反射到达人类听觉器官的声音是 “反射声”
●声音的三要素
● 音调 —— (高低)
● 音强 —— (强弱) ● 音色 —— (特质)
代表声音的高低，与频率有关；使用音频处理软件对声音的频率进行调整时，(低其) 音调也会随之发(高生)变化
声音的强度 (响度或音量)，与声波振幅成正比；唱盘、CD 盘等声音载体中的音强不变，通过播放设备的音量控制可改变聆听时强(度弱)；音频处理(强软)件可提高声(停源) 音强
● 特点：相对于 MP3 具有较高压缩率和良好音质。当小于 128kbps 时最为出色且编码后音频文件很小；当大于 128kbps 时音质损失过大。
2.2.2 数字音频获取
● 编码
编码概念音频模拟信号经过采样与量化之后，为把数字化音频存入计算机，需对其编码，即用二进制数表示每个采样的量化值，完成整个模数转换过程
PCM 编码一种最方便简单的编码方法是脉冲编码调制，常称为 PCM (Pulse Code Modulation) 编码。它是一种未经压缩的数字音频信号，常作为一种参考信号，以便其他编码方法与之比较，或在此基础上作进一步压缩编码

e商务文档

多媒体技术及应用第二章音频信息的获取与处理

相关文档推荐：