当前位置：文档之家› 第二章音频的数字化

第二章音频的数字化

三、音频的数字化（采样）音频的数字化（采样）
音频采样：当把模拟声音变成数字声音时，音频采样：当把模拟声音变成数字声音时，需要每隔一个时间间隔在模拟声音波形上取一个幅度值。隔一个时间间隔在模拟声音波形上取一个幅度值。
信号转换示意图
三、音频的数字化（采样）音频的数字化（采样）
采样：采样：将时间上连续的取值变为有限个离散取值的过程时间上连续的取值变为有限个离散取值的过程
模拟信号
采样量化编码
三、音频的数字化
A/D转换中，影响质量及数据量的主要因素：转换中，影响质量及数据量的主要因素：转换中 •每秒钟需要采集多少个声音样本即采样频率每秒钟需要采集多少个声音样本即采样频率每秒钟需要采集多少个声音样本即 •每个声音样本的位数每个声音样本的位数(bps)应该是多少即量化位数应该是多少即量化位数每个声音样本的位数应该是多少即例子:每个声音样本用位表示例子每个声音样本用16位表示测得声音样本值每个声音样本用位表示,测得声音样本值是在0~65536的范围里它的精度就是输入信号的的范围里,它的精度就是输入信号的是在的范围里 1/65536
四、数字音频的文件格式
3、MIDI文件、文件数字乐器接口标准特点：特点：midi文件中存储的是产生声音指令文件中存储的是产生声音指令数据量小适用于：适用于：需要播放长时间高质量音乐
四、数字音频的文件格式
3、MIDI文件、文件
四、数字音频的文件格式
3、MIDI文件、文件
2236752字节数据量字节数据量
五、音频文件的读取
00h：52 49 46 46
RIFF标志标志
82 21 22 00
总数据块大小 2236802字节 2236802字节
57 41 56 45
格式类型 WAVE
66 6D 74 20
fmt标志标志
10h：12 00 00 00
01 00 02 00
字节数/秒采样频率采样频率（）量化位数（字节数秒=采样频率（HZ） * 量化位数（BIT）* 声道数/8 ）
?
1分钟单声道，采样频率为11.025kHz，8位采样位数分钟单声道，采样频率为分钟单声道，位采样位数
四、数字音频的文件格式
2、MP3文件、文件 MPEG Audio Layer-3 特点：数据量较小，压缩率10：1—20：1 特点：数据量较小，压缩率：：音质较好是目前最为流行的音频格式文件
六、声音质量的度量
3、客观质量度量：动态范围、客观质量度量：声音的动态范围即声音从最弱变到最强的范围。声音的动态范围即声音从最弱变到最强的范围。声音的动态范围还与频率有关。声音的动态范围还与频率有关。动态范围最大的频率区间是1000-6000HZ，计量单位是分贝(dB)。，计量单位是分贝率区间是。动态范围越大，信号强度的相对变化范围越大，动态范围越大，信号强度的相对变化范围越大，音响效果越好
五、音频文件的读取
标志符（RIFF）数据大小格式类型（"WAVE"） WAV文件结构文件结构 "fmt" Sizeof(PCMWAVEFORMAT) PCMWAVEFORMAT "data" 声音数据大小声音数据
数据体文件头
五、音频文件的读取
五、音频文件的读取
例：sound.wav 44.1kHz 12.68秒秒 16位位双声道
只要采样频率高于信号中最高频率的2倍只要采样频率高于信号中最高频率的倍，就可以从采样中完全恢复原始信号的波形。以从采样中完全恢复原始信号的波形。
三、音频的数字化（量化）音频的数字化（量化）
音频量化：将经采样后幅度上无限多个连续的样值音频量化：将经采样后幅度上无限多个连续的样值幅度变为有限个离散值的过程
二、模拟音频与数字音频
模拟信号
数字信号
二、模拟音频与数字音频
模拟音频：在时间和幅度上都是连续变化的模拟音频：在时间和幅度上都是连续变化的音频连续数字音频：在时间和幅度上都是离散、不连续的数字音频：在时间和幅度上都是离散、不连续的音频离散
三、音频的数字化
模拟音频
数字音频
采样、量化、编码采样、量化、
44 AC 00 00
采样频率 44.1kHz
10 B1 02 00
每秒数据量 176400
音频格式数据块大小编码格式双声道 18 waveformatPCM
20h：04 00 10 00
00 00 66 61
63 74 04 00
00 00 54 88
区块对齐单位量化位数 4 16位位
30h：08 00 64 61
三、音频的数字化（量化）音频的数字化（量化）
量化过程：先将整个幅度划分成为有限个幅度（量化阶距）量化过程：先将整个幅度划分成为有限个幅度（量化阶距）的集合，把落入某个阶距内的样值归为一类，并赋予相同的的集合，把落入某个阶距内的样值归为一类，量化值。量化值。
量化等级的划分
三、音频的数字化
一、声音
声音是通过空气传播的一种连续的波，叫声波。声音是通过空气传播的一种连续的波，叫声波。声音的强弱体现在声波压力的大小上音调的高低体现在声音的频率上
一、声音——有关概念声音有关概念
复合信号：复合信号：声音信号由许多频率不同的信号组成分量信号：分量信号：单一频率的信号带宽：描述组成复合信号的频率范围。带宽：描述组成复合信号的频率范围。如：高保真声音的频率范围为10 高保真声音的频率范围为 Hz~20K Hz，它的带宽，约为20K Hz。约为。
一、声音——三要素声音三要素
音强(volume) —> 响度，由振幅决定音强响度，音调(pitch) 音调音色 —> 由频率决定 —> 指声音频率组成成分
一、声音——分类声音分类
次音频信号<20HZ(人耳听不到人耳听不到) 次音频信号人耳听不到音频信号20HZ~20kHZ(人能听到人能听到) 音频信号人能听到超音频信号>20kHZ(人听不到,有很强的方向超音频信号>20kHZ(人听不到,有很强的方向人听不到可以形成波束) 性,可以形成波束可以形成波束
六、声音质量的z 50—7KHz 20—15KHz 10—20KHz 电话声音范围调幅广播声音范围调频广播声音范围高保真立体声音范围
六、声音质量的度量
2、客观质量度量：带宽、客观质量度量：音频信号的频带越宽，音频信号的频带越宽，所包含的音频信号分量越丰富，量越丰富，音质越好
74 61 50 21
22 00 00 00
00 00 FF FF
data标志标志
声音裸数据长度 2236752字节字节
声音数据内容
40h：00 00 FE FF
FE FF 00 00
00 00 FE FF
FE FF 01 00
六、声音质量的度量
1、客观质量度量：信噪比、客观质量度量：信噪比SNR（Signal to Noise Ratio）是有用信信噪比（）号与噪声之比的简称。号与噪声之比的简称。噪音可分为环境噪音和设备噪音。信噪比越大，声音质量越好。噪音。信噪比越大，声音质量越好。
五、音频文件的读取
工具：工具：
UltraEdit Debug 其他反汇编软件
五、音频文件的读取
WAVE文件作为多媒体中使用的声波文件格式之一， WAVE文件作为多媒体中使用的声波文件格式之一，它文件作为多媒体中使用的声波文件格式之一是以RIFF格式为标准的。 RIFF格式为标准的是以RIFF格式为标准的。 RIFF是英文Resource Format（ RIFF是英文Resource Interchange File Format（资是英文的缩写，每个WAVE WAVE文件的头四个字源互换文件格式）的缩写，每个WAVE文件的头四个字节便是“RIFF” 对应的十六进制是52 46。节便是“RIFF”。对应的十六进制是52 49 46 46。 RIFF／WAV文件标识段 RIFF／WAV文件标识段 WAVE文件 WAVE文件文件头声音数据格式说明段数据体
四、数字音频的文件格式
1、WAV文件、文件声音是随着时间连续变化的物理量，声音是随着时间连续变化的物理量，并且是一种能借助介质传播的波。一种能借助介质传播的波。
四、数字音频的文件格式
1、WAV文件、文件特点：特点：数据量大音质好不适合网络传播或播放文件数据量计算：文件数据量计算：
四、数字音频的文件格式
4、ASF、WMA文件、、文件微软开发的网上流式数字音频文件格式微软开发的网上流式数字音频文件格式网上流式特点：音质好特点：数据量小适合网络流式传输适合网络流式传输
四、数字音频的文件格式
5、RAM、RA文件、、文件 RealNetworks开发的网上流式数字音频文件格式开发的网上流式数字音频文件格式开发的网上流式特点：能随带宽的不同而改变音质，在保证大多特点：能随带宽的不同而改变音质，数人听到流畅声音的前提下，数人听到流畅声音的前提下，带宽宽裕的听众获得较好的音质适合低网速的实时传输适合低网速的实时传输
作业
1、你认为多媒体技术发展的八大技术基础中哪、一个是最重要的技术基础？并说明原因。一个是最重要的技术基础？并说明原因。 2、请简述音频数字化过程。、请简述音频数字化过程。 3、计算：、计算：三分钟的采样频率为22.05kHz，量化位数为位，量化位数为16位三分钟的采样频率为的立体声音频数据量为多少？的立体声音频数据量为多少？

e商务文档

第二章音频的数字化

相关文档推荐：