当前位置:文档之家› 语音信号处理第4章

语音信号处理第4章

标量量化可以说是K=1的矢量量化。矢量量化过 程和标量量化过程相似。将K维无限空间划分为M 个区域边界,然后将输入矢量与这些边界进行比较, 并被量化为“距离”最小的区域边界的中心矢量值。
矢量量化的定义
将信号序列{ yi }的每K个连续样点分成一 组,形成K维欧式空间中的一个矢量,矢 量量化就是把这个K维输入矢量X映射成另 一个K维量化矢量。其中量化矢量构成的 集合{Yi } 称为码书或码本,码书中的每个
❖ 采用矢量量化技术对信号波形或参数进行压 缩处理,可以获得很好的效益,使存储要求、 传输比特率需求或和计算量需求降低.
采用矢量量化的效果优于标量量化的原因?
矢量量化能有效的应用矢量中各分量之 间的四种相互关联性质来消除数据中的冗 余度。这四种相互关联的性质是线性依赖 (相关性)、非线性依赖(统计不独立)、概 率密度函数的形状和矢量量化的维数,而 标量量化仅能利用线性依赖和概率密度函 数的形状来消除冗余度。
方法是:将大量欲处理的信号的矢量进行统计划分, 进一步确定这些划分边界的中心矢量值来得到码书。
二、如何确定两矢量在进行比较时的测度。
这个测度就是两矢量间的距离,或以其中某一矢量 为基准时的失真度。它描述了当输入矢量用码书所 对应的矢量来表征时所付出的代价。
图7-2 矢量量化系统的组成工作过程:❖ 在编码端,输入矢量Xi与码书中的每一个码字进行 比较,分别计算出它们的失真。搜索到失真最小的 码字 Yjmin的序号 (或j 该码字所在码书中的地址), 这些序号就作为传输或存储的参数。
❖ 在恢复时,根据此序号从恢复端的码书中找出相应 的码字 Yjmin。由于两本码书完全相同,此时失真最 小,所以 Y就jmi是n 输入矢量Xi的重构矢量。
特点: ➢ 传输存储的不是矢量本身而是其序号,所以 据有高保密性能 ➢ 收发两端没有反馈回路,因此比较稳定 ➢ 矢量量化器的关键是编码器的设计,译码器 只是简单的的查表过程。
易于硬件实现
失真测度主要有均方误差失真测度(即欧氏距 离)、加权的均方误差失真测度、板仓-斋藤 (Itakura-Saito)距离,似然比失真测度等,还 有人提出的所谓的“主观的”失真测度。
通常这些代表值Yi称为量化矢量。 对一个矢量X进行量化,首先选择一个合适的失真 测度,然后用最小失真原理,分别计算用量化矢量 Yi替代X所带来的失真。 其中最小失真值所对应的那个量化矢量,就是矢量 X的重构矢量(或恢复矢量)。
所有M个量化矢量构成的集合 Y称i 为码书或
码本; 把码书中的每个量化矢量Yi(i=1,2….M)
矢量Yi 称为码字或者码矢。
Y {Y1,Y2 , YN Yi RK }
以K=2进行说明:
当K=2时,所得到的是二维矢量。所有可能 的二维矢量就形成了一个平面。
记为(a1,a2),所有可能的(a1,a2) 就是一个二维空间。如图7-1(a)所示
图7-1 矢量量化概念示意图
矢量量化就是将这个平面划分为M块S1,S2,…, Si…SM,然后从每一块中找出代表值Yi(i=1, 2….M),这就构成一个有M个区间的二维矢量量 化器。图7-1(b)所示的是一个7区间的二维矢量 量化器,即K=2,M=7。
7.3 失真测度
前面我们讲过设计矢量量化器的关键是编 码器的设计。而在编码的过程中,就需要 引入失真测度的概念。
失真测度(距离测度):是将输入矢量Xi用码本 重构矢量Yi来表征时所产生的误差或失真的度量方 法,它可以描述两个或多个模型矢量间的相似程度。
[1]p84
失真测度是矢量量化和模式识别中一个十 分重要的问题,选择合适与否直接影响系统 的性能。
矢量量化的性能指标除了码书的大小M以外 还有由于量化而产生的平均信噪比。
矢量量化的准则:在给定码本大小K时使量 化所造成的失真最小。
矢量量化的设计:从大量信号样本中训练出 好的码书,从实际效果出发寻找最好的失真测 度定义公式,设计出最佳的矢量量化系统,以 便用最少的搜索和计算失真的计算量,来实现 最大可能的平均信噪比。
失真是将输入信号矢量用码书的重构矢量来表征时 的误差或所付出的代价。这种代价的统计平均值(平 均失真)描述了矢量量化器的工作性。
失真度选择必须具备的特性
必须在主观评价上有意义,即小的失真应该对应于 好的主观语音质量;
必须是易于处理的,即在数学上易于实现,这样可 以用于实际的矢量量化器的设计;
平均失真存在并且可以计算;
称为码字或码矢。 不同的划分或不同的量化矢量选取就可以构成
不同的矢量量化器。 注:根据仙农信息论,矢量越长越好。实际中 码书是不完备的,即矢量数是有限的,而对于 任何一个实际应用来说,矢量通常是无限的。 在实际运用中,输入矢量和码书中码字不匹配 的情况下,这种失真是允许的。
存在的问题
一、如何划分M个区域边界。
❖ 量化分为两类:
* 标量量化:将取样后的信号值逐个地进行量化。
* 矢量量化:将若干取样信号分成一组,即构成一个 矢量,然后对此矢量一次进行量化。
❖ 凡是要用量化的地方都可以采用矢量量化。
❖ 矢量量化是实现数据压缩的一种有效方法, 早在50和60年代就被用于语音压缩编码。直 到70年代线性预测技术被引入语音编码后, 矢量量化技术才活跃起来。80年代初,矢量 量化技术的理论和应用研究得到迅速发展。
矢量量化研究的目的?
针对特定的信息源和矢量维数,设计 出一种最优化的量化器,在R(量化速率) 一定的情况下,给出的量化失真尽可能 接近D(R)(最小量化失真)。
7.2 矢量量化的基本原理
标量量化是对信号的单个样本或参数的幅度进行量 化;标量是指被量化的变量,为一维变量。
矢量量化的过程是将语音信号波形的K个样点的每 一帧,或有K个参数的每一参数帧构成K维空间的一 个矢量,然后对这个矢量进行量化。
7.1概述 7.2矢量量化的基本原理 7.3失真测度 7.4最佳矢量量化器和码本设计 7.5降低复杂度的矢量量化系统 7.6语音参数的矢量量化
7.1 概述
❖ 矢量量化(VQ,即Vector Quantization)是一 种极其重要的信号压缩方法。VQ在语音信号处理中 占十分重要的地位。广泛应用于语音编码、语音识 别和语音合成等领域。
相关主题