当前位置:文档之家› 数字音频原理及应用第3章 数字音频压缩编码

数字音频原理及应用第3章 数字音频压缩编码


3.1.3 音频编/解码器的性能指标
1、重建音频质量及其评价方法
用于评价重建音频质量的方法可分为:主观评价和客观评
价两类。
主观评价方法又分为:
客观评价方法又分为:
可懂度评价方法
时域测度评价方法
判断韵字测试(DRT)
信噪比
改进的韵字测试
加权信噪比
音质的评价方法
平均分段信噪比
第3章 数字音频压缩编码
3.1 数字音频编码概述 3.2 常用数字音频编码技术 3.3 MPEG-1音频编码标准 3.4 MPEG-2 音频编码标准 3.5 MPEG-4 音频编码标准 3.6 Enhanced aacPlus编码技术 3.7 中国制定的音频编码标准 3.8 新一代环绕多声道音频编码格式
频更敏感 人耳对语音信号的相位不敏感 凡是人耳感觉不到的成分,即对人耳辨别声音的强度、音
调、方位没有贡献的成分,称为与听觉无关的“不相关” (Irrelevance)部分,都可视为是冗余的,可以将它们压 缩掉。
数字音频压缩编码的目的
数字音频压缩编码的目的,是在保证重构 声音质量一定的前提下,以尽量少的比特数来 表征音频信息,或者是在给定的数码率下,使 得解码恢复出的重构声音的质量尽可能高。
50Hz ~ 7 000Hz 20Hz ~ 15 000Hz 10Hz ~ 20 000Hz
3.1.2 数字音频压缩编码的机理
■数字音频压缩的必要性
1秒钟声音文件的数据量(不压缩): 采样频率(Hz) 量化精度(比特数)声道数 (MB) 8 1024 1024
例:计算1分钟双声道、16bit量化精度、44.1kHz采 样频率声音的不压缩的数据量是多少?
次声波 <20Hz
音频信号 20~20 000Hz
超声波 >20 000Hz
3.1.1 音频信号的分类
声音的质量与它所占 用的频带宽度有关。
男性语音 女性语音 电话语音 调幅广播(AM) 调频广播(FM) 高保真音响
100Hz ~ 9 000Hz 150Hz ~ 10 000Hz 200Hz ~ 3 400Hz
整个谱也随频率增加而递减。 功率谱的细节以基音频率为基础,形成高次谐波结构。
音频信号的短时功率谱
浊音
清音
音频信号的听觉冗余
人耳的听觉感知机理
人耳的听觉具有掩蔽效应( Masking Effect ),利用掩 蔽效应来掩盖量化失真
人耳对音频信号的幅度、频率的分辨能力是有限的 人耳对不同频段声音的敏感程度不同,通常对低频比对高
本章学习目标
熟悉数字音频压缩编码的机理。 了解音频编解码器的性能指标和重建音频质量的评价方法。 熟悉数字音频编码的基本方法及分类。 掌握感知音频编码的基本原理,理解子带编码的基本思想。 重点掌握MPEG-1、MPEG-2 AAC的音频编解码原理。 了解AVS音频立体声编解码的原理和DRA多声道数字音频编
3.1.3 音频编/解码器的性能指标
3、算法的复杂度
一般而言,在音频质量相同的情况下,数码率越低,算法复 杂度越高。编/解码算法的复杂度与硬件的实现有很密切关 系,它决定了硬件实现的复杂程度、功耗和成本。
从频域考察音频信号的功率谱密度: 非均匀的长时间功率谱密度
长时间功率谱呈现强烈的非平坦性,高频能量较低 时域上相邻样本相关。
语音特有的短时功率谱密度
语音的短时功率谱,在某些频率出现峰值(该频率称 为共振峰频率),在另外一些频率上出现谷值。
出现共振峰的频率不止一个,最主要的是前两个,决 定了不同的语音特征。
时域冗余 频域冗余 听觉冗余
去除冗余实现压缩编码。
音频信号的时域冗余
幅度分布的非均匀性
小幅度样本出现的频率高
样值之间的相关性
当采样频率为 8kHz 时,相邻样本间的相关系数大于 0.85;
周期之间的相关性
在特定瞬间,某段声音往往只是总频带 300~3400Hz 的少数几个频率 分量在起作用象某些振荡波一样,在周期与周期之间存在一定的相 关性
3.1.3 音频编/解码器的性能指标
2、数码率(比特速率)
降低数码率往往是语音编码的首要目标。数码率越低,压缩效率越高。 语音编码器分成两类:固定速率编码器和可变速率编码器。 现有大部分编码标准都是固定速率编码,其范围为0.8kbit/s ~64kbit/s。
可变速率编码是近年来出现的新技术:两方通话大约只有40%的时间是真 正有声音的,因此可采用通/断二状态编码。 通状态对应有声期,采用固定速率编码;断状态对应无声期,传送极低比 特速率信息(如背景噪声特征等),甚至不传送任何信息。
平均意见得分(MOS) 频域测度评价方法
判断满意度测量(DAM) 巴克谱失真测度
MUSHRA
美尔谱失真测度
……
评价方法
主观评价
客观评价
可懂度评价
音质评价
平均意见得分 (MOS)

判断满意度测量 (DAM)
计算较简单,但没有 考虑实际情况,故适 用于高数码率语音编 码质量的评价
基音之间的相关性
男声基音周期为 5~20ms,而典型的浊音持续 100ms
静止系数(话音间隙)
全双工话路的典型效率约为 40%(静止系数为 0.6)
长时自相关性
如几十秒内的相关性
例: 语音信号的时域冗余
‘1’
‘2’
一 个 单 音 ‘1’ 基音周期(音调周期)
音频信号的频域冗余
解码的原理。 了解新一代环绕多声道音频编码格式。
3.1 数字音频编码概述
3.1.1 音频信号的分类 3.1.2 数字音频压缩编码的机理 3.1.3 音频编解码器的性能指标 3.1.4 数字音频编码技术的分类 3.1.5 数字音频编码标准概述
3.1.1 音频信号的分类
声音信号按频率划分:
S 44.1103 16 2 60 10.09(MB) 81024 1024
3.1.2 数字音频压缩编码的机理
从信息保持的角度讲,只有当信源本身具有冗余度, 才能对其进行压缩。
信号一部分可由另一部分重建或可用另外表达形 式简单说明,称为信号有冗余。
音频信号存在着多种形式的冗余。
相关主题