小波变换在语音压缩中的应用
摘要
本文介绍了小波变换在语音压缩中两种新技术。
第一种技术是消除了低于某一阈值与能量值小波分解高频系数的零小波变换。
第二种技术是平均零小波变换,它除了履行第一种技术所要达到的目标之外,它平均分解的小波近似系数。
这些系数几乎不变,是较高层次的分解转化。
然后,小波系数在传输前,用Lloyd量化的算法和编码和熵编码技术,在接收端,接收信号进行解码,然后才处理减少量化。
1引言
信号压缩在语言交际系统中起着重要的作用。
它产生一个紧凑的数据表示,允许有效的存储和资料传送。
在参考【一】中,据报道,语音信号采样量化的8位/样本,在64千位/秒的水平,即在8kHz被压缩到2.4千比特/有足够的清晰度,但缺乏一些自然性。
在某些应用中,例如音频会议和互联网,语音压缩质量应该比电话质量更好。
本文中提出了两种新的压缩技术。
每一种技术都在后来被证明,不仅产生了一个更高的压缩比,而且实现了在较高信噪比条件段的质量的提高和平均意见得分值测试比率的提高。
本文中所讨论的语音压缩技术是基于离散小波传输。
提出的这种技术比现有的技术更加简单而有效。
语音信号分为成段长度为20毫秒时域,每个部分转化利用离散小波
变换。
小波变换系数的能量值低于某一临界值是由零改为水平,
从而定义了一个新的小波变换技术,它被称为零小波变换。
利用小波变换在语音信号和分解的策略,得出两种详细而近似的系数。
已经注意到,近似系数的小波分解在高水平下几乎不变。
因此,只需发送此常数的值再加上信号段时间长度。
这建议使用另一种被称为平均零小波变换的技术。
小波变换系数进行量化用劳埃德优化的算法,并利用熵编码后的编码方法。
在接收端,信号压缩重建,将在后面介绍。
重建信号的压缩比和质量指标方面的评估,是为了将两个新的技术和现有如传统的离散余弦变换和离散小波变换的进行比较。
本文在第二节中简要讨论小波变换和压缩技术。
第三节将专门为计算机仿真,它是适用于零小波传输和平均零小波传输的一个阿拉伯文和英文语音数据集。
本文报道了一系列主观和客观音质用Matlab 和C语言编写的程序进行的结果。
第四节包括结论以及后续工作。
2小波变换和压缩技术
2.1 小波变换
小波变换被广泛的应用与多个领域,尤其是在信号的压缩和编码方面。
在【4】【5】【6】【7】中引进了许多优秀的小波理论。
离散小波变换想法的背后是代表作为一个基础功能上设置一个带权的总和信号即被缩放和时间移动的单个母板的小波x(t。
2.2 压缩技术
最有效的压缩方案涉及改变输入数据,通过投影功能的基础上,再设
置它的编码产生的变换系数。
最近,使用最广泛的转化一直是块离散余弦变换【6】。
因此,离散小波变换在已收到的语音压缩领域的语音质量得到了极大关注。
语音信号可分为表示(如脉冲列车)和清音(如噪音)激发九,其中的语音压缩的根本目的是减少传输的位,同时保持一个可接受的语音质量。
这是通过消除言论无声的一部分,被迫零之后,离散小波变换的低能量。
离散变换可以通过一个八度频带滤波器组扩展【6】,其中信号拆分通过两通道滤波器组首先计算。
然后,低通再次使用的版本是分裂低通/高通滤波和向下采样等。
如果是双通道滤波器组正交,那么它实现了一个离散正交变换。
信号的两个较低分辨率版本,一个低通(或粗分辨率)和高通(或罚款分辨率)和本从一个低通输出过程递归应用版本,分裂是称为多分辨率分解。
这都说明了多分辨率分解图1,图2与建议的技术的其他区块。
由于准平稳的语音信号,他们及时可以使用分割处理。
各段语音数据转化利用离散小波变换。
此转换将产生一个数据加上被称为近似和细节尺度的波动系数几个当地平均水平,分别为CA和CD. 这些系数具有高能量低频率,低能量高频率【12】。
因此,低频系数和高频部分系数,取决于能源阈的选择,需要重建言语。
低于阈值的其他系数将被设置为零,一个特殊的字符将在这些系数传输时负责确定其位置和长度。
这种被成为零小波变换的技术将导致一个好的重建语音质量非常低的比特率。
因此,有一个良好的特定的语音压缩特性的变换,
具有大量的系数为零。
此外,在高层次的小波分解中,值得注意的是CA的系数几乎不变。
因此,只需要发送一个数据,代表此常数的值,以及这些系数各自的长度。
这种压缩技术被称为平均零小波变换。
以上所描述的各种小波变换技术都是遵循劳埃德最优量化算法和熵编码【2】和【3】。
图1和图2显示的离散小波变换的分解和反离散小波变换的两个步骤与建议技术改造来实现所建议的零小波变换的语音信号压缩方案的重建。
在图1,一块电磁意味着在输出小波系数的能量措施。
从这个块输出分为两路。
一个路径通过一定的阈值水平(BT)以下的系数与能源而另一个路径通过其余的系数。
这些系数分别表示为(BT)的SC和CDi,其中SC代表一个特殊字符,我表示分解的水平。
如图1所示的交换机SW,允许使用SC或CDI 的系数取决于要处理上述能量阈值确定的标准。
图2显示了一个框图说明了语音信号的分解重构反离散小波变换。
插入指定的DC块零组件的地方系数能量低于阈值水平BT,经检测到特殊字符;SC。
否则,CDi 系数允许在正常情况下通过。
图一表示零小波变换的分解。
图二分解重构反离散小波变换
4 结论
本文提出两种语音信号压缩技术零小波变换和平均零小波变换。
这两种技术都被证明比现有的技术提高了性能和产量,离散余弦变换和离散小波变换在为SEGSNR和增强压缩比增加值计算。
据设想,本文所提出的两个语音压缩技术在处理与减少比特率和高质量的语
音信息中扮演者着非常实用的角色。
,。