当前位置:文档之家› 多媒体技术应用教程之音频处理技术

多媒体技术应用教程之音频处理技术

2.3音频处理软件Audition 2.3.1功能介绍 2.3.2编辑环境 2.3.3基本操作
2.4 音频实验 2.4.1音频处理实验 2.4.2录制歌曲实验
第二章 音频处理技术
2.1 音频基本原理
2.1.1 人类听觉特性 2.1.2 数字音频 2.1.3 声音 2.1.4 语音
近十年来,随着计算机技术的高速发展,以及能同 时满足数字信号的高压缩率和数字信号的高保真 透明重放质量的压缩算法及标准得到大量开发与 使用,数字音频已经广泛应用于因特网、多媒体 及无线通信系统,CD品质的数字音频已经从根本 上替代了模拟音频。因此,人们对音频信号数字 化处理提出了越来越高的要求,相应软硬件实现 手段的效率也在不断提高。
➢ 2.1.1 人类听觉特性
音频信号的感知过程与人耳的听觉系统密不可分。 对于人类听力感知的研究,其范围从人耳的生理 设计到大脑对听觉信息的解释。当前,大部分感 知音频的编码算法都是基于心理声学模型的。
➢ 2.1.1 人类听觉特性
1.听阈与听域 2.音调 3.响度和响度级 4.绝对听觉门限 5.临界频带 6.同时掩蔽 7.异时掩蔽 8.感知熵
若掩蔽声音出现之前的一段时间内发生掩蔽效应, 则称为超前掩蔽,否则称为滞后掩蔽。
➢ 2.1.1 人类听觉特性
8.感知熵
感知熵(Perceptual Entropy)指利用心理声学的掩 蔽现象和信号能量化原理来测量音频信号中感知 相关的信息。一般以位(bit)作为单位,实际上 表示了音频信号压缩的理论极限。
对声音波形采样的频率直接影响声音的质量,采样频率越高, 声音保真度越好,但所要求的数据存储量也越大。
根据采样定理,当采样频率大于信号最高频率的两倍时,在 采样过程中就不会丢失信息,并且可以用采样后的信号重 构原始信号,从而不失真地还原出原始的声音信号。
对于音频,最常用的采样频率有三种:44.1kHz、22.05 kHz 和11.025 kHz,其中44.1kHz采样频率是最常用的。
图2-1 听阈-频率曲线
➢ 2.1.1 人类听觉特性
2.音调
音调(Pitch)在物理学中是指声音的高低,实际上 就是指人耳对不同频率声音的一种主观感受。音 调主要由声音的频率决定,同时也与声音强度有 关。频率高的声音,人感觉其音调也较高,反之 ,人感知音调低的声音其频率也低。
对音调可以进行定量的判断,其度量单位为美( Mel),定义一个声压级为40dB,频率为1kHz的 纯音的音调为1000Mel。
➢ 2.1.2 数字音频
音频信号是时间和幅度都连续变化的一维模拟信号, 要想在计算机中对它进行处理,就要将它变成时 间和幅度都是离散的数字信号,所以数字音频是 指音频信号经过离散化处理后再用一系列的数字 来表示的信号,其特点是保真度好,动态范围大。
数字音频可分为波形声音、语音和音乐。波形声音 实际上包含了所有的声音形式,因此数字音频有 时也泛称为声音。
➢ 2.1.1 人类听觉特性
1.听阈与听域
听阈(Auditory Threshold)就是指人能听到的最低 声压级(Sound Power Level,SPL)。
听域(Audible Area)是指人能感知的声音的范围, 正常人耳能够感知的频率范围大致是20Hz~ 20kHz;正常人能感知声音的声压级范围是0~ 128dB。
2.1.2 数字音频
用计算机来处理音频信号必须将模拟音频信号转换 成有限个数字表示的离散序列,过程为:选择采 样频率,即进行采样;选择分辨率,即进行量化 ;最后编码形成声音文件。声音的采样与量化如 图所示。
➢ 2.1.2 数字音频 1.采样
采样(Sampling)指把模拟信号在时域上以固定的时间间隔 对波形的值进行抽取,再用若干位二进制数表示。
图2-2 人耳可听最小响度曲线
➢ 2.1.1 人类听觉特性
4.绝对听觉门限
绝对听觉门限(Absolute Threshold of Hearing, ATH)指一个人在没有噪声的环境下,能够产生 听觉,感知到一个纯音信号(某频率点)的最小 能量幅度。
绝对听觉门限用声压级表示,静音为0dB,痛阈为 140dB。
声道数是声音通道的个数,指一次采样的声音波形个数。
➢ 2.1.2 数字音频 2.量化
量化(Quantity)的目的是将采样后的信号波形的 幅度值(样本)进行离散化处理,样本从模拟量 转化成了数字量。
量化位数越多,所得到的量化值越接近原始波形的 采样值。
量化方式有三种:零记忆量化、分组量化和序列量 化。
多媒体技术应用教程
陈永强,张聪主编 胡兵,崔树芹,苏勇参编
电子工业出版社 2011.8
第二章 音频处理技术
2.1 音频基本原理 2.1.1 人类听觉特性 2.1.2 数字音频 2.1.3 声音 2.1.4 语音
2.2常用音频压缩标准 2.2.1音频压缩基础 2.2.2常用音频压缩标准 2.2.3音频文件格式
6.同时掩蔽
掩蔽效应是指当两个响度不等的声音作用于 人耳时,响度较高的频率成分的存在会影 响到对响度较低的频率成分的感知。
当两个或更多的音频信号到达人内耳时,掩 蔽声与被掩蔽声同时作用发生掩蔽效应, 就称同时掩蔽。
பைடு நூலகம் ➢ 2.1.1 人类听觉特性
7.异时掩蔽
指掩蔽效应发生在掩蔽声与被掩蔽声不同时出现的 情况下。
图2-3 绝对听觉门限曲线
➢ 2.1.1 人类听觉特性
5.临界频带
指一个纯音可以被以它为中心频率,并且具有一定 频带宽度的连续噪声所掩蔽,在这一频带内噪声 功率等于该纯音的功率。使该纯音处于刚能被听 到的临界状态,即称这一带宽为临界频带宽度。 临界频带的单位为巴克(Bark)。
➢ 2.1.1 人类听觉特性
➢ 2.1.1 人类听觉特性
3.响度和响度级
响度(Loudness)是人耳感受声音强弱的主观感觉 程度,这种感觉与音强、频率和波形都有关系, 其度量单位为宋(Sone),定义一个声压级为 40dB,频率为1kHz的纯音的响度为1Sone。
响度级(Loudness Level)是指某响度与基准响度相 比的等级,其度量单位为方(Phon),定义1kHz 纯音的响度级为1Phon。
相关主题