当前位置:
文档之家› Cool Edit音频的采样和数字化
Cool Edit音频的采样和数字化
四、数字音频的文件格式
3、MIDI文件 、 文件 数字乐器接口标准 特点: 特点:midi文件中存储的是产生声音指令 文件中存储的是产生声音指令 数据量小 适用于: 适用于:需要播放长时间高质量音乐
四、数字音频的文件格式
3、MIDI文件 、 文件
四、数字音频的文件格式
3、MIDI文件 、 文件
三、音频的数字化(采样) 音频的数字化(采样)
奈奎斯特采样定理: 奈奎斯特采样定理:
设连续信号X(t)的最高频率分量为 ,以等间隔 (Ts 的最高频率分量为Fm,以等间隔Ts( 设连续信号 的最高频率分量为 称采样间隔, 称为采样频率 进行采样, 称采样间隔,fs=1/Ts称为采样频率)对X(t)进行采样,得到 称为采样频率) 进行采样 Xs(t)。如果Fs>=2Fm,则Xs(t)保留了 。如果 , 保留了X(t )的全部信息(从Xs(t) 的全部信息( 保留了 的全部信息 可以不失真地恢复出X(t))。 )。 可以不失真地恢复出
一、声音——三要素 声音 三要素
音强(volume) —> 响度,由振幅决定 音强 响度, 音调(pitch) 音调 音色 —> 由频率决定 —> 指声音频率组成成分
一、声音——分类 声音 分类
次音频信号<20HZ(人耳听不到 人耳听不到) 次音频信号 人耳听不到 音频信号20HZ~20kHZ(人能听到 人能听到) 音频信号 人能听到 超音频信号>20kHZ(人听不到,有很强的方向 超音频信号>20kHZ(人听不到,有很强的方向 人听不到 可以形成波束) 性,可以形成波束 可以形成波束
六、声音质量的度量
3、客观质量度量:动态范围 、客观质量度量: 声音的动态范围即声音从最弱变到最强的范围。 声音的动态范围即声音从最弱变到最强的范围。 声音的动态范围还与频率有关。 声音的动态范围还与频率有关。动态范围最大的频 率区间是1000-6000HZ,计量单位是分贝(dB)。 ,计量单位是分贝 率区间是 。 动态范围越大,信号强度的相对变化范围越大, 动态范围越大,信号强度的相对变化范围越大, 音响效果越好
字节数/秒 采样频率 采样频率( ) 量化位数( 字节数 秒=采样频率(HZ) * 量化位数(BIT)* 声道数/8 )
?
1分钟单声道,采样频率为11.025kHz,8位采样位数 分钟单声道,采样频率为 分钟单声道 , 位采样位数
四、数字音频的文件格式
2、MP3文件 、 文件 MPEG Audio Layer-3 特点:数据量较小,压缩率10:1—20:1 特点:数据量较小,压缩率 : : 音质较好 是目前最为流行的音频格式文件
六、声音质量的度量
3、客观质量度量:动态范围 、客观质量度量: 动态范围= × 信号的最大强度/信号的最小强 动态范围=20×log(信号的最大强度 信号的最小强 信号的最大强度 度)(dB)
六、声音质量的度量
4、主观质量度量:MOS分数 、主观质量度量: 分数
分数 5 4 3 2 1 质量级别 优 良 中 差 劣 Mean Opinian Score 失真级别 不觉察 刚刚觉察、 刚刚觉察、不讨厌 觉察、 觉察、有点讨厌 讨厌而不反感 极讨厌、令人反感 极讨厌、
三、音频的数字化(量化) 音频的数字化(量化)
量化过程:先将整个幅度划分成为有限个幅度(量化阶距) 量化过程:先将整个幅度划分成为有限个幅度(量化阶距) 的集合,把落入某个阶距内的样值归为一类,并赋予相同的 的集合,把落入某个阶距内的样值归为一类, 量化值。 量化值。
量化等级的划分
三、音频的数字化
只要采样频率高于信号中最高频率的2倍 只要采样频率高于信号中最高频率的 倍,就可 以从采样中完全恢复原始信号的波形。 以从采样中完全恢复原始信号的波形。
三、音频的数字化(量化) 音频的数字化(量化)
音频量化:将经采样后幅度上无限多个连续的样值 音频量化:将经采样后幅度上无限多个连续的样值 幅度 变为有限个离散值的过程
二、模拟音频与数字音频
模拟信号
数字信号
二、模拟音频与数字音频
模拟音频:在时间和幅度上都是连续变化的 模拟音频:在时间和幅度上都是连续变化的 音频 连续 数字音频:在时间和幅度上都是离散、不连续的 数字音频:在时间和幅度上都是离散、不连续的 音频 离散
三、音频的数字化
模拟音频
数字音频
采样、量化、编码 采样、量化、
四、数字音频的文件格式
1、WAV文件 、 文件 声音是随着时间连续变化的物理量, 声音是随着时间连续变化的物理量,并且是 一种能借助介质传播的波。 一种能借助介质传播的波。
四、数字音频的文件格式
1、WAV文件 、 文件 特点: 特点:数据量大 音质好 不适合网络传播或播放 文件数据量计算: 文件数据量计算:
五、音频文件的读取
标志符(RIFF) 数据大小 格式类型("WAVE") WAV文件结构 文件结构 "fmt" Sizeof(PCMWAVEFORMAT) PCMWAVEFORMAT "data" 声音数据大小 声音数据
数据体 文件头
五、音频文件的读取
五、音频文件的读取
例:sound.wav 44.1kHz 12.68秒 秒 16位 位 双声道
三、音频的数字化(采样) 音频的数字化(采样)
音频采样:当把模拟声音变成数字声音时, 音频采样:当把模拟声音变成数字声音时,需要每 隔一个时间间隔在模拟声音波形上取一个幅度值。 隔一个时间间隔在模拟声音波形上取一个幅度值。
信号转换示意图
三、音频的数字化(采样) 音频的数字化(采样)
采样: 采样: 将时间上连续的取值变为有限个离散取值的过程 时间上连续的取值变为有限个离散取值的过程
模拟信号
采样 量化 编码
三、音频的数字化
A/D转换中,影响质量及数据量的主要因素: 转换中,影响质量及数据量的主要因素: 转换中 •每秒钟需要采集多少个声音样本即采样频率 每秒钟需要采集多少个声音样本即采样频率 每秒钟需要采集多少个声音样本即 •每个声音样本的位数 每个声音样本的位数(bps)应该是多少即量化位数 应该是多少即量化位数 每个声音样本的位数 应该是多少即 例子:每个声音样本用 位表示 例子 每个声音样本用16位表示 测得声音样本值 每个声音样本用 位表示,测得声音样本值 是在0~65536的范围里 它的精度就是输入信号的 的范围里,它的精度就是输入信号的 是在 的范围里 1/65536
2236752字节数据量 字节数据量
五、音频文件的读取
00h:52 49 46 46
RIFF标志 标志
82 21 22 00
总数据块大小 字节 2236802字节
57 41 56 45
格式类型 WAVE
66 6D 74 20
fmt标志 标志
10h:12 00 00 00
01 00 02 00
四、数字音频的文件格式
6、AIF、AU文件 、 、 文件 Apple公司开发的音频文件格式 公司开发的音频文件格式
四、数字音频的文件格式
7、CD-DA 、 数字音频光盘 44.1khz、16Bit量化位数、双声道 、 量化位数、 量化位数
四、数字音频的文件格式
8、MD 、 Mini Disc Sony推出的便携式音乐格式 推出的便携式音乐格式 MD汽车音响、随身听 汽车音响、 汽车音响
六、声音质量的度量
2、客观质量度量:带宽 、客观质量度量:
200—3.4KHz 50—7KHz 20—15KHz 10—20KHz 电话声音范围 调幅广播声音范围 调频广播声音范围 高保真立体声音范围
六、声音质量的度量
2、客观质量度量:带宽 、客观质量度量: 音频信号的频带越宽, 音频信号的频带越宽,所包含的音频信号分 量越丰富, 量越丰富,音质越好
三、音频的数字化
声音质量与数据率
质量 电话 AM FM CD DAT 采样频率 kHz 8 11.025 22.050 44.1 48 立体 样本精度 单/立体 (b/s) 声 8 单道声 8 16 16 16 单道声 立体声 立体声 立体声 数据率 (kB/s) 8 11 88.2 176.4 192.0 频率范围 200~3400 20~15000 50~7000 20~2000 20~2000
四、数字音频的文件格式
4、ASF、WMA文件 、 、 文件 微软开发的网上流式数字音频文件格式 微软开发的网上流式数字音频文件格式 网上流式 特点:音质好 特点: 数据量小 适合网络流式传输 适合网络流式传输
四、数字音频的文件格式
5、RAM、RA文件 、 、 文件 RealNetworks开发的网上流式数字音频文件格式 开发的网上流式数字音频文件格式 开发的网上流式 特点:能随带宽的不同而改变音质,在保证大多 特点:能随带宽的不同而改变音质, 数人听到流畅声音的前提下, 数人听到流畅声音的前提下,带宽宽裕的听众获 得较好的音质 适合低网速的实时传输 适合低网速的实时传输
44 AC 00 00
采样频率 44.1kHz
10 B1 02 00
每秒数据量 176400
音频格式数据块大小 编码格式 双声道 18 waveformatPCM
20h:04 00 10 00
00 00 66 61
63 74 04 00
00 00 54 88
区块对齐单位 量化位数 4 16位 位
30h:08 00 64 61
74 61 50 21
22 00 00 00
00 00 FF FF
data标志 标志
声音裸数据长度 2236752字节 字节
声音数据内容
40h:00 00 FE FF
FE FF 00 00
00 00 FE FF
FE FF 01 00