当前位置:文档之家› 小波和多尺度简介

小波和多尺度简介

在众多的信号处理应用中,人们希望找到一种稀疏的数据表示,用稀疏逼近取代原始数据表示可从实质上降低信号处理的成本,提高压缩效率。

传统的信号表示理论基于正交线性变换,但许多信号是各种自然现象的混合体,这些混合信号在单一的正交基变换中不能非常有效地表现出来。

例如,一个含有脉冲和正弦波形的混合信号,既不能用单一的脉冲基函数,也不能用单一的正弦基函数有效地表示。

在这个例子中,有两种结构类型同时出现在信号里,但它们却完全不同,其中哪一个都不能有效地模拟另一个。

所以,人们希望寻找一种能够同时建立在两种基函数之上的信号表示,其结果应该比采用其中任一种基函数有效得多。

在图像和视频处理方面,常用的信号分解方式通常是非冗余的正交变换,例如离散余弦变换、小波变换等。

离散余弦变换其基函数缺乏时间/空间分辨率,因而不能有效地提取具有时频局部化特性的信号特征。

小波分析在处理一维和二维的具有点状奇异性的对象时,表现出良好的性能,但图像边缘的不连续性是按空间分布的,小波分析在处理这种线状奇异性时效果并不是很好。

因而说,小波分析对于多维信号来说并不是最优的,不能稀疏地捕捉到图像结构的轮廓特征,因此在图像和多维编码方面的新突破,必定取决于信号表好似的深刻变革。

最近几年,研究人员在改变传统信号表示方面取得了很大的进展。

新的信号表示理论的基本思想就是:基函数用称之为字典的超完备的冗余函数系统取代,字典的选择尽可能好地符合被逼近信号的结构,其构成可以没有任何限制,字典中的元素被称为原子。

从字典中找到具有最佳线性组合的m项原子来表示一个信号,称作信号的稀疏逼近或高度非线性逼近。

从非线性逼近的角度来讲,高度非线性逼近包含两个层面:一是根据目标函数从一个给定的基库中挑选好的或最好的基;二是从这个好的基中拣选最好的m项组合。

利用贪婪算法和自适应追踪,从一个冗余函数系统中进行m项逼近方法的理解只是些零星的片段,用高度非线性方法以指定的逼近速率来描述函数仍然是一个富有挑战的问题。

从基函数的形成来讲,在图像表示方面体现为多尺度几何分析,无论是曲波(curvelets)、带波(bandlets),还是仿形波(coutourlets),都要求基函数应具备下述特点:(i)多分辨率分析,(ii)时频定位能力,(iii)全角度分析(方向性),(iv)各向异性的尺度变换。

这些新的冗余函数系统的不断涌现,使信号稀疏表示的方法更加成为研究的热点。

超完备信号稀疏表示方法肇始于20世纪90年代。

1993年Mallat和Zhang首次提出了应用超完备冗余字典对信号进行稀疏分解的思想,并引入了匹配追踪(marching pursuit, MP)算法。

在这篇文献中,作者用自然语言表述浅显的类比,说明超完备冗余字典对信号表示的必要性,同时强调字典的构成应较好地复合信号本身所固有的特性,以实现MP算法的自适应分解。

新思想的提出引起人们极大的关注,但由于算法所涉及的计算量十分繁重,因而早期研究的焦点集中在如何实现算法的快速计算,降低算法的复杂度,以及选择何种类型原子构造合适的字典两方面。

这期间,许多音视频信号处理方面的实验都对MP算法作出了有利的支持,尤其在甚低码率视频编码方面,MP算法更显示出极大的优越性.1999年Donoho等人又另辟蹊径,提出了基追踪(basis pursuit, BP)算法,并从实验的角度举证了MP,MOF,和BOB算法各自的优劣。

稍后,又在2001年发表的另一篇重要文章中,给出了基于BP算法的稀疏表示具有唯一解的边界条件,并提出了字典的互不相干性的概念。

注:摘自《基于冗余字典的信号超完备表示与稀疏分解》自1807年Fourier 提出任意一个周期为2π的函数都可以表示成一系列三角函数的代数和,到今天蓬勃发展的小波分析,科学家们的研究目的是对不同的函数空间提供一种直接、简便的分析方式,即寻求函数在某一特定空间下,在某种基下的最优逼近。

逼近的误差体现了用此基表示函数的稀疏程度或是分解系数的能量集中程度。

Fourier分析的思想是将函数表示为具有不同频率的谐波函数的线性叠加,即将函数用一簇三角基展开,将原函数在时域中的讨论转换为对这个叠加权系数的讨论,即Fourier 变换在频域中的研究。

这种三角体系展开方式的局限性促使人们去寻找其他的正交体系——小波分析。

小波分析的地位在数学界是独一无二的,它较精确的时频定位特性,成为处理非平稳信号的有利工具;也证明了小波分析比Fourier 分析更能稀疏地表示一段分段光滑或有界变差函数。

这是小波分析成功的一个关键原因。

但是,由于张量积小波只具有有限方向数,它主要适合表示一维奇异性的对象,当它在处理二维或更高维奇异性时,就显得无能为力。

小波在表示这些函数时并不是最优的或者最稀疏的表示方法。

为了更好地处理高维奇异性,一类带有方向性的稀疏表示方法——多尺度几何分析应运而生。

它的产生符合人类视觉皮层对图像有效表示的要求,即局部性、方向性和多尺度性。

它的目的就是为具有面奇异或线奇异的高维函数找到最优或最稀疏的表示方法。

目前,已有的多尺度几何分析方法有Emmanuel J Candès等人提出的脊波变换(ridgelet transform)、单尺度脊波变换(monoscale ridgelet transform)、curvelet变换(curvelet transform),E. Le Pennec等人提出的bandelet变换,以及M.N.Do 等人提出的contourlet变换。

另外,还有一些多尺度分析方法,如David Donoho 提出的wedgelet、beamlet等。

本文根据以上方法出现的时间顺序来讨论其逼近性能的异同。

在图像处理方面,图像的稀疏表示在对图像数据的存储、传输中得到了广泛的应用。

由于余弦基和小波基能够用较少的系数达到图像较精确的非线性逼近,成为图像稀疏表示的重要方法。

如今,多尺度几何分析的出现,又为图像的稀疏表示提供了一个全新而又有效的方法。

1奇异性分析本文称无限次可导的函数是光滑的或没有奇异性的。

若函数在某处有间断或某阶导数不连续,则称该函数在此处有奇异性。

图像的奇异性或非正则结构通常包含了图像的本质信息。

例如图像亮度的不连续性表示景物中的边缘部分,这是认识图中最重要的部分。

图像的奇异性是常见的,也是重要的。

在自然界中光滑物体的边界往往体现为沿光滑曲线的奇异性,并不仅是点的奇异性。

在数学上,通常用Lipschitz指数刻画信号的奇异性大小[8]。

3多尺度几何分析3.1脊波变换脊波理论的基本框架是由E.J Candès 建立,并与D.L.Donoho等人在其后续工作中[12]逐步拓展和完善。

脊波变换是一种非自适应的高维函数表示方法,对含直线奇异的多变量函数能够达到最优的逼近阶。

脊波理论的提出在多尺度几何分析史上产生了深远的影响,具有不可估量的价值。

脊波变换的核心主要是经过radon变换把线状奇异性变换成点状奇异性。

小波变换能有效地处理在radon域的点状奇异性。

其本质就是通过对小波基函数添加一个表征方向的参数得到的,所以它不但与小波一样有局部时频分析的能力,还具有很强的方向选择和辨识能力,可以非常有效地表示信号中具有方向性的奇异特征。

这是小波方法所不能得到的。

3.1.2数字脊波的实现在实际应用中,脊波变换的离散化及其算法实现是一个具有挑战性的问题。

由于脊波的径向性质,对连续公式直接离散实现时要在极坐标中进行插值。

这样的变换结果或者是冗余的,或者不能完全重构。

脊波变换数字实现的优劣很大程度上取决于其中radon变换数字实现的重构精度。

为此,人们提出了各种各样的方法,大体上可分为在Fourier域利用投影切片定理的方法[13~15]、多尺度方法[16,17]和代数方法[18]三类。

近似脊波变换建立在所谓的伪极坐标网格基础上。

首先对n×n的离散点列作二维FFT,并对得到的包含n×n个点的频域点列作径向划分;然后估计各个径向直线方向上n个数据点的值。

在每个径向方向都有n个节点,再对这n个点列作一维IFFT,从而得到对应于图像域的2n 2个点列,对这些点列作均匀化插值和重组就得到一次radon变换的结果。

根据图1即可实现脊波变换[19]。

但其有两点不足:在实现频率平面中直角坐标向极坐标变换的过程中引入误差是明显的;它具有总数为四倍的数据冗余性。

因此这种脊波变换不适合图像编码压缩。

M.N.Donoho等人[20]提出另一种数字脊波实现方法,称为有限脊波变换(FRIT)。

首先用有限radon变换将一幅图像变换到FRAT域中,再对每一个投影序列进行离散小波变换(DWT),r k[0],r k,…,r k[p-1]。

其中方向k是固定的。

这种方法可以同时做到可逆性与非冗余性,并且是完全重构的。

但由于有限脊波变换是基于有限radon变换构造的,有限radon变换在表达直线时有折叠效应,有限脊波变换在几何上不是真实的。

Donoho和Flesia[21]为了克服有限脊波变换的折叠效应,构造了一种数字脊波变换。

它能用真实的脊函数进行分解和合成,并且具有精确重构和框架性质。

这种脊波变换采用的radon变换,称做fast slant stack[13]。

首先进行fast slant stack运算,然后进行二维快速小波变换。

这种构造使得离散物体(离散脊波、离散radon变换、离散伪极坐标Fourier域)具有与连续脊波理论平行的内在联系(脊波、radon变换、极坐标Fourier域)。

Donoho构造的脊波变换在几何上是真实的,即在此处radon变换的确是沿直线积分的,从而避免了折叠效应。

在创建系数矩阵时,它将一个n×n的矩阵变换为2n×2n的矩阵,因此冗余因子为4。

这在一定程度上影响了运算速度。

这种脊波变换在实现上的缺点是正交脊波系数衰减速度相对较慢。

3.1.3脊波逼近能力定理4设f是C r的函数,沿某一直线是不连续的,除此之外均为r阶连续。

从脊波级数中选取对应于前M个最大系数的项,对f所作的非线性逼近误差为即逼近误差显示似乎不存在间断,这个结果对任意r阶光滑都是成立的。

该方法的显著特点是无须知道间断的位置。

类似地,一维小波变换也无须先验地知道点奇异的位置。

因而对于具有直线奇异的函数,脊波的表示是最优的。

3.1.4小结与展望从上面的分析可知,脊波在分析直线奇异的分段光滑的高维函数方面是优秀的[36],脊波已经成功应用于数学中的函数逼近、信号检测、特征提取、目标识别,以及图像恢复、去噪、增强等方面。

在脊波分析的框架下,结合二进小波变换的局部脊波变换,用于检测直线的方法,应用于方向性较强的图像获得了良好的检测效果。

但是必须看到,对于自然物体而言,奇异的边界是曲线的,经过radon 变换后仍然为曲线,而小波对曲线不具备稀疏表示的能力。

相关主题