当前位置:文档之家› 音频信息的获取与处理 (2)

音频信息的获取与处理 (2)

(1) 人与计算机通信(接收音频信号) 音频获取;语音识别与理解。 (2) 计算机与人通信(输出音频) 音频合成; 声音定位;音频/视频同步。 (3) 人—计算机—别人通信
可编辑ppt
14
2-10 音频卡的主要功能(教材P28)
音频的录制与播放、编辑与合成、MIDI接口、 文语转换、CD-ROM接口及游戏接口等。
可编辑ppt
6
2-3 量化:
在数字音频技术中,把采样得到的表 示声音强弱的模拟电压用数字表示。模拟 电压的幅值仍然是连续的,而用数字表示 音频幅度时,只能把无穷多个电压幅度用 有限个数字表示,即把某一幅度范围内的 电压用一个数字表示,这称之为量化。
可编辑ppt
7
2-4.奈奎斯特采样定理 1927年,奈奎斯特确定了如果对某一带宽的
有限时间连续信号(模拟信号)进行抽样,且在 抽样率达到一定数值时,根据这些抽样值可以在 接收端准确地恢复原信号。为不使原波形产生 “半波损失”,采样率至少应为信号最高频率的 两倍,这就是著名的奈奎斯特采样定理。奈奎斯 特1928年发表了《电报传输理论的一定论题》。
常用的音频采样率有: 8kHz、11.025kHz 、 22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz。
可编辑ppt
8
均匀量化:就是将输入数据的振幅进行等值均分, 优点是计算处理简单,缺点是量化误差大;
非均匀量化:就是将输入数据的振幅,按照其变化 曲线的曲率大小进行不等值划分。优点是量化误差 大,缺点是计算处理复杂,需要较多的比特数。
自适应量化:就是按照输入数据的变化曲线的局部 区域的特点,自适应地修改和调整量化器的箱宽。 优点是量化误差小,缺点是计算处理复杂。
4
2-1 数字音频:
在计算机内,所有的信息均以数字表 示。各种命令是不同的数字,各种幅度的 物理量也是不同的数字。音频信号也用一 系列数字表示,称之为数字音频。数字音 频的特点是保真度好,动态范围大。
可编辑ppt
5
2-2 采样:
模拟声音在时间上是连续的,而数字 音频是一个数字序列,在时间上只能是断 续的。因此当把模拟声音变成数字声音时, 需要每隔一个时间间隔在模拟声音波形上 取一个幅度值,称之为采样,采样的时间 间隔称为采样周期。
第二章 音频信息的获取与处理
音频(Audio)指人说话的声音频率。
(音频是个专业术语,人类能够听到的所有声音都称之为音频 )
定义:20HZ~20KHZ的音频范围 分类:波形声音、语音、音乐 声音三要素:音调、音强、音色
可编辑ppt
1
考核目的:
考核学生对数字音频获取与处理的基本 原理、采样量化的基本原理、音频卡的 组成及工作原理、音频编码标准以及音 乐合成原理的理解和掌握。
可编辑ppt
10
2-6 WAV文件储存容量计算(教材24)
WAV文件的字节数/每秒=采样频率(Hz)× 量化位数(位) ×声道数/8
S 采( H 样 ) 量 z频 ( 位 化 ) 声 率 位 时 道 ( s ) 数 间 数 ( M ) 8 1 0 12 04 24
可编辑ppt
112-8 音频信号处理的特点(教材P26)
(1) 音频信号是时间依赖的连续媒体。 (2) 理想的合成声音应是立体声。 (3) 对语音信号的处理,要抽取语意等其 它信息,如可能会涉及到语言学、社会学、 声学等。
可编辑ppt
13
2-9 从人与计算机交互的角度来看音频信 号相应的处理如下:
可编辑ppt
15
2-11 音频卡的分类
音频卡的分类主要根据数据采样量化的位 数来分,通常分为8位、16位和32位等几类。 位数越高,量化精度越高,音质就越好。
可编辑ppt
16
2-12 音频卡的工作原理(教材P33-55)
音频卡的组成平面图(图2.2)
音频卡的工作原理框图(图2.5)
(1)声音的合成与处理:这部分是音 频卡的核心,一般由数字声音处理器、FM音 乐合成器及MIDI控制器组成。
可编辑ppt
2
考核的知识点:
什么是数字音频、数字音频采样和量化 的基本原理、音频卡的工作原理、音频 编码标准和音乐合成的原理。
可编辑ppt
3
考核要求:
掌握:数字音频信息的获取与处理的原 理过程、音频卡的工作原理。
理解:数字音频采样量化的原理过程、 音乐合成的原理。
了解:数字音频编码的标准。
可编辑ppt
(3)计算机总线接口和控制器:总线接口 和控制器是由数据总线双向驱动器、总 线接口控制逻辑、总线中断逻辑及DMA (直接存储器存取)控制逻辑组成。
可编辑ppt
18
2-13音频卡硬件的安装步骤:
(1)将电脑电源关闭,拔下供电电源和所有外接线 插头;
(2)打开机箱外壳,选择一个空闲的16位扩展槽并
将声卡插入扩展槽,声卡一般应尽可能远离显示卡, 以防两者互相干扰;
(3)连接来自CD-ROM驱动器的音频线及声卡的输入/ 输出线和游戏棒等;
(4)如果需要,将CD-ROM驱动器的接口电缆插在卡
可编辑ppt
9
2-5 数字音频的文件格式
.WAV Microsoft公司的波形音频文件格式。 .MID MIDI文件格式。 .VOC Creative公司的波形音频文件格式。 .SND NeXT计算机的波形音频文件格式。 .AIF Apple计算机的波形音频文件格式。 .RMI Microsoft公司的MIDI文件格式。它可 以包括图片、标记和文本。
它的主要任务是完成声波信号的 模/数、 数/模转换,利用调频技术控制声音的音调、 音色、和幅度。
可编辑ppt
17
(2)混合信号处理器及功率放大器:内置 数字/模拟混音器,混音器的声源可以是 MIDI信号、CD音频、线输入、话筒和PC 的扬声器等,可以选择输入一个声源或 将几个不同的声源进行混合录音。
由于MIDI文件记录的是一系列的计算 指令而不是数据化后的波形数据,因此占 用的存储空间比WAV文件要小很多。所以预 装MIDI文件比装入WAV文件要容易很多。这 为设计多媒体应用系统和指何时播放音乐 带来很大的灵活性。但是MIDI文件的录制 比较复杂,这要学习一些使用MIDI创作并 改编作品的专业知识,并且还必须有专门 工具,如键盘合成器等。
相关主题