当前位置:文档之家› 音频处理技术

音频处理技术

ห้องสมุดไป่ตู้
• 高保真立体声级:20Hz-20kHz • 调幅广播级:50Hz-7kHz • 电话语音级:300Hz-3.4kHz
• 2.2.2 采样位数 • 采样位数可以理解为采集卡处理声音的 解析度。这个数值越大,解析度就越高, 录制和回放的声音就越真实。采集卡的 位客观地反映了数字声音信号对输入声 音信号描述的准确程度。8位代表2的8次 方--256,16位则代表2的16次方--64K。 比较一下,一段相同的音乐信息,16位 声卡能把它分为64K个精度单位进行处理, 而8位声卡只能处理256个精度单位,造 成了较大的信号损失,最终的采样效果 自然是无法相提并论的。
flvc(Free Lossless Audio Codec) 几乎兼容所有平台
• 而数字化音频的获得是通过每隔一定 时间间隔测一次模拟音频的值(如电 压)并将其数字化,这一过程称为采 样,每秒钟采样的次数称为采样率。 一般地。采样率越高,记录的声音越 自然,反之,将失去声音的自然特性, 这一现象称为失真。由模拟量转变为 数字量的过程称为模—数转换(A/D)
• 由上可知,数字音频是离散的,而 模拟音频是连续的,数字音频的好 坏与采样率密切相关
2.声音信号的数字化
• 2.1模拟音频与数字音频的区别 • 自然声音是连续变化的,人类最早 记录声音的技术是利用一些机械的、 电的或磁的参数随着声波引起空气 压力的连续变化而变化来模拟和记 录自然的声音。
• 例如麦克风,当人对着麦克风讲话时, 麦克风能根据它周围空气压力的不同变 化而输出相应的连续变化的压力值,这 种变化的电压值便是一种对人类讲话声 音的模拟,称为模拟音频。它把声音的 压力变化转变为电压信号,当输出连续 变化的电压值到录音机时,通过相应的 设备将它转换成对应的电磁信号记录在 录音磁带上,因而便记录了声音
• 2.5 重构 • 数字化声音若要重新播放还必须经 过解码、D/A转换和插值 • 解码是编码的逆过程 • D/A转换是将数字量转换为模拟量 便于扬声器发音 • 插值是为了弥补采样过程中引起的 语音信号失真而采取的弥补措施
3.音频信号压缩技术
• 常用压缩技术
自适应脉冲编 码调制 脉冲编码调制 差分脉冲编码 调制
• 2.3 量化 将采样后的音效信息数字化的过程称为量 化 量化精度:表示每个声音样本值采用的二 进制数反映了度量声音波形幅度的精度。 例如:每个声音样本用16位表示,测得的 声音样本值为0~65536,它的精度就是 1/65536。样本位数的大小影响到声音的质 量,位数越多,声音的质量越高,而存储 所需的空间越多。
2.声音信号的数字化
• 由上节可知,自然界的声音是一种 模拟的音频信号,是连续量,而计 算机只能处理离散的数字量,这就 要求必须将声音数字化
• 数字化声音优点: • 一、传播时抗干扰能力强,存储时 重放性能好 • 二、易处理、能进行数据压缩 • 三、可纠错、容易混合
• 音频信号数字化的关键步骤是采样、量化和 编码 • 2.2采样 • 把模拟音频转成数字音频的过程,就称作采 样,所用到的主要设备便是模拟/数字转换器 (Analog to Digital Converter,即ADC,与 之对应的是数/模转换器,即DAC)。采样的 过程实际上是将通常的模拟音频信号的电信 号转换成二进制码0和1,这些0和1便构成了 数字音频文件。
自适应差分脉 冲编码调制
增量调制
自适应增量调 制
3.音频信号压缩技术
• 3.1 脉冲编码调制(PCM)
• 3.1.1均匀量化
• 3.1.2非均匀量化
• 3.2增量调制(DM)
• 3.3自适应增量调制(ADM)
• 3.4自适应脉冲编码调制(APCM)
• 3.4差分脉冲编码调制(DPCM)
• 超声波(高于20000Hz)和正常声波 (20Hz - 20000Hz)遇到障碍物后会向原传 播方向的反方向传播,而部分次声波(低 于20Hz)可以穿透障碍物,俄罗斯在北冰 洋进行的核试验产生的次声波曾经环绕地 球6圈。超低频率次声波比其他声波(10Hz 以上的声波)更具对人的破坏力,一部分 可引起人体血管破裂导致死亡,但是这类 声波的产生条件极为苛刻,能让人遇上的 几率很低。
• 2.4 编码 • 数字化的波形声音是一种使用二进 制表示的比特流,它遵循一定的标 准或规范进行编码。由于声音的数 字化,将有大量的数据需要计算机 存储,如果不对这些数据进行压缩, 则很难在计算机上实现多媒体功能
• 例如:10分钟44.1KHz,16位,双 声道立体声需要()MB, • 数据之所以可以压缩是因为原始信 源数据有很大冗余度,人类的生理 特性决定只能听到20Hz~20KHz范 围内的声音,因而可以实现高压缩 比
• 3.5自适应差分脉冲调制(ADPCM)
4.常用音频存储格式
文件扩展名 说明
au
aiff snd wav wma(Windows Media Audio) mp3
r m(real media) r a(real sound) ape
Sun和Next公司的声音文件格式,主要用在 UNIX工作站上
• (二)音调(pitch):声音的高低(高音、 低音),由“频率”(frequency)决定, 频率越高音调越高(频率单位Hz(hertz), 赫兹 • 正常人能够听见20Hz到20000Hz的声音, 而老年人的高频声音减少到10000Hz(或可 以低到6000Hz)左右。人们把频率高于 20000Hz的声音称为超声波,低于20Hz的 称为次声波。
• 人的发声频率在100Hz(男低音)到 10000Hz(女高音)范围内。
• (三)音色(music quality是指声音的感觉 特性。不同的发声体由于材料、结构不同, 发出声音的音色也不同,这样我们就可以 通过音色的不同去分辨不同的发声体音色 是声音的特色,根据不同的音色,即使在 同一音高和同一声音强度的情况下,也能 区分出是不同乐器或人发出的。同样的音 量和音调上不同的音色就好比同样色度和 亮度配上不同的色相的感觉一样。) •
1.声音的基本概念
• 1.1什么是声音 • 声音是由物体振动产生,正在发声的 物体叫声源。声音以声波的形式传播。 声音只是声波通过固体或液体、气体 传播形成的运动。声波振动内耳的听 小骨,这些振动被转化为微小的电子 脑波,它就是我们觉察到的声音。
• 1.2声音特性 • (一)响度(loudness):人主观 上感觉声音的大小(俗称音量),由 “振幅”(amplitude)和人离声源的 距离决定,振幅越大响度越大,人和 声源的距离越小,响度越大。(单位: 分贝dB) •
音频处理技术
知识点
• 1.声音的基本概念 • 2.音频数值化过程 • 3.常用音频压缩技术 • 4.常用的音频存储格式
课后作业
• 1.什么是声音?声音三要素是什么? • 2.声音数字化的三个步骤是——、——、— — • 3.什么是采样频率? • 4.采样的量化位数与音频质量成反比,与存 储空间成正比,这句话正确吗?为什么? • 5.常用的音频压缩技术有哪些?
• 2.2.1 采样频率 • 每秒钟的采样样本数叫做采样频率。 • 采样频率越高,数字化后声波就越 接近于原来的波形,即声音的保真 度越高,但量化后声音信息量的存 储量也越大。
• 采样频率与声音频率之间的关系: • 根据采样定理,只有当采样频率高于 声音信号最高频率的两倍时,才能把 离散模拟信号表示的声音信号唯一地 还原成原来的声音。 • 目前在多媒体系统中捕获声音的标准 采样频率定为44.1kHz、22.05kHz和 11.025kHz三种。分别对应
Apple计算机、SGI工作站上的声音文件格式 Apple计算机、SGI工作站上的声音文件格式 Window采用的波形文件存储格式 微软公司推出的与MP3格式齐名的一种新的音 频格式 MEPG Layer III
RealNetworks公司的流式声音文件格式 RealNetworks公司的流式声音文件格式 无损音频压缩格式
相关主题