当前位置:文档之家› 音频编辑与处理要点

音频编辑与处理要点

二、声音的三要素
2、音色
声音听觉理论
音色是人耳听觉的一种感受特性,代表人耳 区别相同响度和音调的两类不同声音的主观感觉。 人耳对音色的感觉决定于声音中泛音各分量的数 量、相对强度关系和分布。
当许多不同乐器同奏一曲时,尽管它们所发 出声音的基频频率相同,人们还是能分辨出各种 乐器的不同声音特色,这正是由于其它频率分量 的多少和大小比例不同的缘故。音色与声音信号 的频谱相对应。每一种声音都有一基本频率,称 为基频或基音,同时还有与基频成倍数关系的许 多不同倍频的频率,称为谐波或泛音。基本频率 决定了声音的音调,而谐波成分则决定着声音的 音色。
示例:单声道
双声道
第二节
数字音频原理
由于音频信号是一种连续变化的模拟信 号,而计算机只能处理和记录二进制的数字 信号,因此,由自然音源而得的音频信号必 须经过一定的变化和处理,变成二进制数据 后才能送到计算机进行再编辑和存贮。
第二节
一、PCM编码原理
数字音频原理
把模拟信号转换成数字信号的过程称为模/数转换,它主要 包括: 采样:在时间轴上对信号数字化;
第一节
二、声音的三要素
1、音调
声音听觉理论
音调是人耳对声音调子高低的主观感受。人耳 的音调感觉与声音的频率相对应。频率高,音调高, 声音听起来“尖”;频率低,音调低,声音听起来 “低沉”。在复合音中,音调决定于基频频率。但 是,音调的高低感觉与声音频率之间不存在线性的 对应关系,而是呈一种对数曲线的对应关系。
5、编码算法数据文件格式
编码的作用其一是采用一定的格式来记录数字数据, 其二是采用一定的算法来压缩数字数据以减少存贮空间和 提高传输效率。压缩算法包括有损压缩和无损压缩;有损 压缩指解压后数据不能完全复原,要丢失一部分信息。压 缩编码的基本指标之一就是压缩比,它通常小于1。压缩 越多,信息丢失越多、信号还原后失真越大。根据不同的 应用,应该选用不同的压缩编码算法。
音色是由混入基音的泛音所决定的,高次谐 波越丰富,音色就越有明亮感和穿透力。不同的谐 波具有不同的幅值An和相位偏移ψn,由此产生 各种音色效果。
示例1:不同乐器
示例2:正常
改变
第一节
二、声音的三要素
3、响度
声音听觉理论
人耳对声音强弱的主观感觉称为响度,主要 取决于声波振幅的大小,但并非是线性关系。人 耳可以听到的声强范围最小和最大之间的差别可 达1013倍。声音的响度一般用声压与基准声压比 值的对数值(称为声压级),单位是分贝(dB)。 (声压级=20lgP/P。,一般以1kHz纯音为准进行 测量,人耳刚能听到的声压为0dB)
声源种类 男性语音 女性语音 电话语音 调幅广播 调频广播 专业音响
频率范围 下限频率 上限频率 100HZ 9000HZ 150HZ 10000HZ 200HZ 3 400HZ 50HZ 7 000HZ 20HZ 15 000HZ 10HZ 40 000HZ
第一节
声音听觉理论
三、音频信号的指标
根据该采样理论,CD 激光唱盘采样频率为 44KHz,可记录的最高音频为22KHz,这样的音 质与原始声音相差无几,也就是我们常说的超级 高保真音质。采样的三个标准频率分别为: 44.1KHz,22.05KHz和11.025KHz。
第二节
数字音频原理
二、数字音频的技术指标
2、量化位数
量化位是对模拟音频信号的幅度轴进行数字化,它决 定了模拟信号数字化以后的动态范围。由于计算机按字节 运算,一般的量化位数为8位和16位。量化位越高,信号 的动态范围越大,数字化后的音频信号就越可能接近原始 信号,但所需要的存贮空间也越大。
音频信号的压缩编码算法
一、PCM编码
这是一种最通用的无压缩编码。特点是保真度 高,解码速度快,但编码后的数据量大。CD-DA就是 采用的这种编码方式。
音频信号的压缩编码算法
二、ADPCM编码
ADPCM(Adaptive Differential Pulse Code Modulation),称为自适应差分脉冲编码。这是一种有 损压缩,它丢掉了部分信息。由于人耳对声音的不敏感 性,适当的有损压缩对视听播放效果影响不大。ADPCM 记录的量化值不是每个采样点的幅值,而是该点的幅值 与前一个采样点幅值之差。这样,每个采样点的量化位 就不需要16 bit,由此可减少信号的容量。可选的幅度 差的量化比特位为8 bit、4 bit和2 bit。SB16的ADPCM 编码采用4 bit 量化位,对 CD音质信号压缩,其压缩 比为1:4,压缩后基本上分辨不出失真。
2、动态范围 动态范围越大,信号强度的相对变化范围越大, 音响效果越好。
动态范围=20×log(信号的最大强度 / 信号 的最小强度)
第一节
声音听觉理论
三、音频信号的指标
3、信噪比 信噪比SNR(Signal to Noise Ratio)是有 用信号与噪声之比的简称。 噪音可分为环境噪音 和设备噪音。信噪比越大,声音质量越好。
音频信号的压缩编码算法
四、Real Audio编码
Real Audio时Real networks推出的一种音乐压缩 格式,它的压缩比可达到1:96,因此在网上比较流行。 经过压缩的音乐文件可以在通过速率为14.4kbps的 Modem上网的计算机中流畅回放,其最大特点是可以实 现网上实时回访,也就是说边下载边播放。
声音听觉理论
声音是以声波的形式进行传递和存在的。
声波是一种机械波,具有纵波一般的波动特性, 例如,反射、折射、绕射、干涉等。 声波在传播中遇到障碍物时,它的能量一部分 会被障碍物吸收,另一部分会被反射回来。若在 一个封闭的室内,产生的反射声波会被周围的墙 壁、天花板和其它障碍物所吸收和反射,形成一 系列逐渐衰减的反射声波 。
音乐中音阶的划分是在频率的对数坐标 (20×log)上取等分而得的:
C 1 D 2 E 3 F 4 G 5 A 6 B 7
音阶 简谱符号
频率(Hz)
频率(对数)
261
48.3
293
49.3
330
50.3
349
50.8
392
51.8
440
52.8
494
53.8
示例1:不同音调
示例2:正常
改变
第一节
音频编辑与处理
学习参考书
《数字音频原理及应用》 机械工业出版社 卢官明主著 《MIDI技巧与数字音频》 清华大学出版社 颜东成主编 《多媒体技术基础》 清华大学出版社 林福 宗编著 《音频视频编缉与制作》中国水利水电出版 社 韩雪涛主编
第一章 音频理论基础知识
第一节
一、声波传播特点
L=lgI/I0 (贝尔) I和I0分别表示待测声强和标准声强,L表示人耳感 觉到的声音大小,I0是人耳能听到的最小声强,为 10-23瓦/米2。
第一节
声音听觉理论
三、音频信号的指标
1、频带宽度 频带宽度或称为带宽,它是描述组成复合信 号的频率范围。音频信号的频带越宽,所包含的 音频信号分量越丰富,音质越好。 在自然界声音的频率范围很宽,有些是人类 听不见的。
第一节
一、声波传播特点
声音听觉理论
从声音的发出到衰减60分贝(至原来的百万分之 一)所需要的时间称为混响时间。一般,常用混响 时间的长短来表明封闭室的混响衰减速度。房间混 响时间的长短对听音效果有很大影响。
第一节
二、声音的三要素
声音听觉理论
自然界里,几乎所有声源发出的声音都不是只 有一种频率和强度的“纯音”,而是包含了许多频 率不同、强度不等的声音分量,组合成的复合音响, 而且在发声过程中,其频率和强度不断地变化着。 在音响中,频率最低的分量称为基音或基频,其它 频率中,凡比基频高的分量统称泛音。在很多情况 下,泛音的频率呈基音频率的整数倍形式,所以泛 音也称为高次谐波分量或谐音。
第一节
声音听觉理论
四、听觉的方位感和立体声
2、立体声系统
双声道的立体声系统是最基本的能给人的双耳造成立 体声像的系统。在双声道立体声系统中,为了正确重现真 实声源的方位,录音时必须用两只配对的传声器,信号传 输通道也需独立分开,而且每条信道的放大率、频响特性 等都必须相同,任何差异都会明显改变声像的位置,影响 立体声效果。
数据率=采样频率(Hz)×量化位数(bit)×声道数 (bit/s)
采样率 (KHz) 11.025 22.05 44.1
量化位 (bit) 8 16 16
声道数 单 双 双
容量 等效音质 (MB/min) 0.66 5.292 10.584 语音 FM广播 CD唱盘
第二节
数字音频原理
二、数字音频的技术指标
音频信号的压缩编码算法
五、Mpeg压缩编码
MPEG提供三种音频压缩编码的等级,分别为I,II和III级 (Level I、Level II、Level III)。I级最简单,其目标是压缩 后每声道位数据率为192Kb/s。II级比I级精度高一些,压缩后每声 道位数据率为128Kb/s。III级增加了不定长编码、霍夫曼编码等一 些先进的算法,可获得非常低的数据率和较高的保真度,压缩后每 声道的位数据率为64Kb/s。如果要获得每声道64Kb/s的数据率,采 用III级编码比采样II级编码的保真度好;要获得每声道128Kb/s的 数据率,采用III级和II级编码的效果类似,但III级和II级都比I 级的效果好。每声道128Kb/s的数据率或双声道256Kb/s的数据率可 以提供优质的保真度,因此采用II级压缩编码对高保真、立体声音 频足矣。
量化:在幅度轴上对信号数字化;
编码:按一定格式记录采样和量化后的数字数据。
脉冲编码调制PCM(Pulse Code Modulation)是一 种模数转换的最基本编码方法。CD--DA采用的就是这种 编码方式。
相关主题