第二章音频的数字化
三、音频的数字化(采样) 音频的数字化(采样)
音频采样:当把模拟声音变成数字声音时, 音频采样:当把模拟声音变成数字声音时,需要每 隔一个时间间隔在模拟声音波形上取一个幅度值。 隔一个时间间隔在模拟声音波形上取一个幅度值。
信号转换示意图
三、音频的数字化(采样) 音频的数字化(采样)
采样: 采样: 将时间上连续的取值变为有限个离散取值的过程 时间上连续的取值变为有限个离散取值的过程
模拟信号
采样 量化 编码
三、音频的数字化
A/D转换中,影响质量及数据量的主要因素: 转换中,影响质量及数据量的主要因素: 转换中 •每秒钟需要采集多少个声音样本即采样频率 每秒钟需要采集多少个声音样本即采样频率 每秒钟需要采集多少个声音样本即 •每个声音样本的位数 每个声音样本的位数(bps)应该是多少即量化位数 应该是多少即量化位数 每个声音样本的位数 应该是多少即 例子:每个声音样本用 位表示 例子 每个声音样本用16位表示 测得声音样本值 每个声音样本用 位表示,测得声音样本值 是在0~65536的范围里 它的精度就是输入信号的 的范围里,它的精度就是输入信号的 是在 的范围里 1/65536
四、数字音频的文件格式
3、MIDI文件 、 文件 数字乐器接口标准 特点: 特点:midi文件中存储的是产生声音指令 文件中存储的是产生声音指令 数据量小 适用于: 适用于:需要播放长时间高质量音乐
四、数字音频的文件格式
3、MIDI文件 、 文件
四、数字音频的文件格式
3、MIDI文件 、 文件
2236752字节数据量 字节数据量
五、音频文件的读取
00h:52 49 46 46
RIFF标志 标志
82 21 22 00
总数据块大小 2236802字节 2236802字节
57 41 56 45
格式类型 WAVE
66 6D 74 20
fmt标志 标志
10h:12 00 00 00
01 00 02 00
字节数/秒 采样频率 采样频率( ) 量化位数( 字节数 秒=采样频率(HZ) * 量化位数(BIT)* 声道数/8 )
?
1分钟单声道,采样频率为11.025kHz,8位采样位数 分钟单声道,采样频率为 分钟单声道 , 位采样位数
四、数字音频的文件格式
2、MP3文件 、 文件 MPEG Audio Layer-3 特点:数据量较小,压缩率10:1—20:1 特点:数据量较小,压缩率 : : 音质较好 是目前最为流行的音频格式文件
六、声音质量的度量
3、客观质量度量:动态范围 、客观质量度量: 声音的动态范围即声音从最弱变到最强的范围。 声音的动态范围即声音从最弱变到最强的范围。 声音的动态范围还与频率有关。 声音的动态范围还与频率有关。动态范围最大的频 率区间是1000-6000HZ,计量单位是分贝(dB)。 ,计量单位是分贝 率区间是 。 动态范围越大,信号强度的相对变化范围越大, 动态范围越大,信号强度的相对变化范围越大, 音响效果越好
五、音频文件的读取
标志符(RIFF) 数据大小 格式类型("WAVE") WAV文件结构 文件结构 "fmt" Sizeof(PCMWAVEFORMAT) PCMWAVEFORMAT "data" 声音数据大小 声音数据
数据体 文件头
五、音频文件的读取
五、音频文件的读取
例:sound.wav 44.1kHz 12.68秒 秒 16位 位 双声道
只要采样频率高于信号中最高频率的2倍 只要采样频率高于信号中最高频率的 倍,就可 以从采样中完全恢复原始信号的波形。 以从采样中完全恢复原始信号的波形。
三、音频的数字化(量化) 音频的数字化(量化)
音频量化:将经采样后幅度上无限多个连续的样值 音频量化:将经采样后幅度上无限多个连续的样值 幅度 变为有限个离散值的过程
二、模拟音频与数字音频
模拟信号
数字信号
二、模拟音频与数字音频
模拟音频:在时间和幅度上都是连续变化的 模拟音频:在时间和幅度上都是连续变化的 音频 连续 数字音频:在时间和幅度上都是离散、不连续的 数字音频:在时间和幅度上都是离散、不连续的 音频 离散
三、音频的数字化
模拟音频
数字音频
采样、量化、编码 采样、量化、
44 AC 00 00
采样频率 44.1kHz
10 B1 02 00
每秒数据量 176400
音频格式数据块大小 编码格式 双声道 18 waveformatPCM
20h:04 00 10 00
00 00 66 61
63 74 04 00
00 00 54 88
区块对齐单位 量化位数 4 16位 位
30h:08 00 64 61
三、音频的数字化(量化) 音频的数字化(量化)
量化过程:先将整个幅度划分成为有限个幅度(量化阶距) 量化过程:先将整个幅度划分成为有限个幅度(量化阶距) 的集合,把落入某个阶距内的样值归为一类,并赋予相同的 的集合,把落入某个阶距内的样值归为一类, 量化值。 量化值。
量化等级的划分
三、音频的数字化
一、声音
声音是通过空气传播的一种连续的波,叫声波。 声音是通过空气传播的一种连续的波,叫声波。 声音的强弱体现在声波压力的大小上 音调的高低体现在声音的频率上
一、声音——有关概念 声音 有关概念
复合信号: 复合信号:声音信号由许多频率不同的信号组成 分量信号: 分量信号:单一频率的信号 带宽:描述组成复合信号的频率范围。 带宽:描述组成复合信号的频率范围。如: 高保真声音的频率范围为10 高保真声音的频率范围为 Hz~20K Hz,它的带宽 , 约为20K Hz。 约为 。
一、声音——三要素 声音 三要素
音强(volume) —> 响度,由振幅决定 音强 响度, 音调(pitch) 音调 音色 —> 由频率决定 —> 指声音频率组成成分
一、声音——分类 声音 分类
次音频信号<20HZ(人耳听不到 人耳听不到) 次音频信号 人耳听不到 音频信号20HZ~20kHZ(人能听到 人能听到) 音频信号 人能听到 超音频信号>20kHZ(人听不到,有很强的方向 超音频信号>20kHZ(人听不到,有很强的方向 人听不到 可以形成波束) 性,可以形成波束 可以形成波束
六、声音质量的z 50—7KHz 20—15KHz 10—20KHz 电话声音范围 调幅广播声音范围 调频广播声音范围 高保真立体声音范围
六、声音质量的度量
2、客观质量度量:带宽 、客观质量度量: 音频信号的频带越宽, 音频信号的频带越宽,所包含的音频信号分 量越丰富, 量越丰富,音质越好
74 61 50 21
22 00 00 00
00 00 FF FF
data标志 标志
声音裸数据长度 2236752字节 字节
声音数据内容
40h:00 00 FE FF
FE FF 00 00
00 00 FE FF
FE FF 01 00
六、声音质量的度量
1、客观质量度量:信噪比 、客观质量度量: 信噪比SNR(Signal to Noise Ratio)是有用信 信噪比 ( ) 号与噪声之比的简称。 号与噪声之比的简称。 噪音可分为环境噪音和设备 噪音。信噪比越大,声音质量越好。 噪音。信噪比越大,声音质量越好。
五、音频文件的读取
工具: 工具:
UltraEdit Debug 其他反汇编软件
五、音频文件的读取
WAVE文件作为多媒体中使用的声波文件格式之一, WAVE文件作为多媒体中使用的声波文件格式之一,它 文件作为多媒体中使用的声波文件格式之一 是以RIFF格式为标准的。 RIFF格式为标准的 是以RIFF格式为标准的。 RIFF是英文Resource Format( RIFF是英文Resource Interchange File Format(资 是英文 的缩写,每个WAVE WAVE文件的头四个字 源互换文件格式 )的缩写,每个WAVE文件的头四个字 节便是“RIFF” 对应的十六进制是52 46。 节便是“RIFF”。对应的十六进制是52 49 46 46。 RIFF/WAV文件标识段 RIFF/WAV文件标识段 WAVE文件 WAVE文件 文件头 声音数据格式说明段 数据体
四、数字音频的文件格式
1、WAV文件 、 文件 声音是随着时间连续变化的物理量, 声音是随着时间连续变化的物理量,并且是 一种能借助介质传播的波。 一种能借助介质传播的波。
四、数字音频的文件格式
1、WAV文件 、 文件 特点: 特点:数据量大 音质好 不适合网络传播或播放 文件数据量计算: 文件数据量计算:
四、数字音频的文件格式
4、ASF、WMA文件 、 、 文件 微软开发的网上流式数字音频文件格式 微软开发的网上流式数字音频文件格式 网上流式 特点:音质好 特点: 数据量小 适合网络流式传输 适合网络流式传输
四、数字音频的文件格式
5、RAM、RA文件 、 、 文件 RealNetworks开发的网上流式数字音频文件格式 开发的网上流式数字音频文件格式 开发的网上流式 特点:能随带宽的不同而改变音质,在保证大多 特点:能随带宽的不同而改变音质, 数人听到流畅声音的前提下, 数人听到流畅声音的前提下,带宽宽裕的听众获 得较好的音质 适合低网速的实时传输 适合低网速的实时传输
作业
1、你认为多媒体技术发展的八大技术基础中哪 、 一个是最重要的技术基础?并说明原因。 一个是最重要的技术基础?并说明原因。 2、请简述音频数字化过程。 、请简述音频数字化过程。 3、计算: 、计算: 三分钟的采样频率为22.05kHz,量化位数为 位 ,量化位数为16位 三分钟的采样频率为 的立体声音频数据量为多少? 的立体声音频数据量为多少?