当前位置:文档之家› 数字图像处理技术应用课程报告

数字图像处理技术应用课程报告

集中稀疏表示的图像恢复董伟胜中国西安电子科技大学电子工程学院wsdong@张磊香港理工大学计算机系cslzhang@.hk石光明中国西安电子科技大学电子工程学院gmshi@摘要本文对于图像恢复任务提出了一种新的称为集中稀疏表示(CSR)的稀疏表示模型。

为了重建高还原度的图像,通过给定的字典,退化图像的稀疏编码系数预计应该尽可能接近那些未知的原始图像。

然而,由于可用的数据是原始图像的退化版本(如噪声、模糊和/或者低采样率),正如许多现有的稀疏表示模型一样,如果只考虑局部的稀疏图像,稀疏编码系数往往不够准确。

为了使稀疏编码更加准确,通过利用非局部图像统计,引入一个集中的稀疏性约束。

为了优化,局部稀疏和非局部稀疏统一到一个变化的框架内。

大量的图像恢复实验验证了我们的CSR模型在以前最先进的方法之上取得了令人信服的改进。

1、介绍图像恢复(IR)目的是为了从,比如说通过一个低端摄像头或者在有限条件下得到图像的图像退化版本(例如噪声、模糊和/或者低采样率),来恢复一副高质量的图像。

对于观察的图像y,IR问题可以表示成:y = Hx + v (1)其中H是一个退化矩阵,x是原始图像的矢量,v是噪声矢量。

由于IR的病态特性,尝试把观察模型和所需解决方案的先验知识合并到一个变分公式的正则化技术,已经被广泛地研究。

对于正则方法,对自然图像适当的先验知识进行寻找和建模是最重要的关注点之一,因此学习自然图像先验知识的各种方法已经被提出来了【25,5,6,12】。

近年来,对于图像恢复基于建模的稀疏表示已经被证明是一种很有前途的模型【9,5,13,20,16,21,27,15,14】。

在人类视觉系统【23,24】的研究中,已经发现细胞感受区域使用少量的从一个超完备的编码集中稀疏选出的结构化基元来编码自然图像。

在数学上,一个x ∈ R N的信号可以表示为一个字典Φ中的几个原子的线性组合,例如,X ≈Φα,用|0 最小化:αx = argmin ||α||0, s.t.||x −Φα||2< ε, (2)α其中||⋅||0 对α中的非零系数进行统计,ε是一个很小的平衡稀疏性和近似误差的常数。

在实践中,为了高效的凸优化【13,9】,|0范数通常被|1 范数所替代。

另一方面,对照分析设计字典(比如小波字典)、学习字典【1,21,19】,例如图像分块可以更好地适应信号x和描述图像结构特征。

在IR的方案中,我们有原始图像x的一些退化观察值y,即y = Hx + v。

为了从y中重建x,首先y通过求解下列最小化问题从Φ进行稀疏编码:αy = argmin ||α||1, s.t.||y −HΦα||2< ε, (3)α然后重构的x,由xˆ表示,得到xˆ=Φαy。

显然,式(3)中的αy预期上与αx非常接近,所以估算的图像xˆ可以与真实图像x非常接近。

不幸的是,因为y受噪声干扰,是模糊和不完整的,式(3)中的编码矢量αy可能与所需矢量αx偏差很大,导致图像x的恢复不准确。

换句话说,模型式(3)可以确保式αy是稀疏的,但不能确保αy 与αx无限接近。

在本文中,我们介绍稀疏噪音编码(SCN)的概念来方便问题讨论。

y的SCN定义为:V a = αx - αy, (4)我们可以看到在给定的字典Φ中,IR的结果取决于SCN V a的水平,因为图像重建误差V x=xˆ-x≈Φαy-Φαx=ΦV a。

SCN V a的定义还表明了一种提高IR质量的方法,即降低V a的水平。

常规的稀疏表示模型,比如在式(2)或式(3)中的,主要利用了自然图像(基于分块)的局部稀疏性。

每一个图像块独立编码,不考虑其他块。

尽管如此,稀疏编码系数α不是随机分布的,因为图像局部分块是非局部相关的。

非局部平均值(NLM)方法,其目的是利用图像非局部冗余,已经成功地运用在许多图像处理应用中,特别是在去噪方面【6】。

这意味着可以利用图像的非局部相似性来减少SCN,因此,复原图像的质量可以得到改善。

事实上,最近的一些研究工作,比如【10】和【20】,都是基于这样的考虑的。

例如,在【20】中提出了一组能够同时编码相似的块的稀疏编码方案,并取得了很好的去噪效果。

在本文中,我们提出了一个能够有效减少SCN的集中系数表示(CSR)模型,从而提高了基于稀疏的IR性能。

其基本思想是将图像的局部稀疏约束(即一个局部块可以被一些从一个字典稀疏选择的原子进行编码)和集中稀疏约束(即稀疏编码系数应该接近其平均值)整合到一个统一的变化的优化框架中。

具体而言,除了要求每个局部块的编码系数是稀疏的之外,我们也通过利用非局部相似性引起的稀疏性来强制让稀疏编码系数具有小的SCN,这一点可以用|1 范数来表示其特征。

通过进行大量的IR实验,实验结果表明,所推荐的CSR算法明显优于许多最顶尖的IR方法。

2、集中稀疏表示模型2.1 图像恢复的稀疏编码噪音按照【16】中所用的符号,我们用x∈R N表示原始图像,用x i=x R i表示在一个大小为n×n的图像块中位置为i,其中R i在i位置上的从x提取的矩阵块x i,给定一个字典Φ∈R n×M,n<M,通过使用一些稀疏编码算法【13,9】,每个块可以被稀疏编码成X≈Φα这样的格式。

然后整个图像x可以用稀疏编码集合{αi}稀疏表示。

如果块允许重叠,我们得到一个非常冗余的基于块的图像表示。

然后从稀疏代码集{αi}重建x是一个超定体系,一个简单明了的最小二乘解是【16】:其中αx表示所有αi的连接。

上面的公式只是说明整体图像已经通过平均x i的每一个重建块完成了重建。

(a)(b)(c) (d)图1. Lena 图像(a )是有噪音和模糊时的SCN 分布;(b )是低采样率时的。

(c )和(d )分别表示在log 域中的(a )和(b )的相同分布。

在IR 的应用中,x 是不能编码的,我们所有的只是观察的退化的y=Hx + v 。

x 的稀疏编码是基于y 通过最小化αy = argmin { || y - H Φ◦α ||2 2 + λ|| α||1 }, (6) α然后图像就被重建成x ˆ =Φ◦αy 。

正如我们在式(4)中所定义和讨论的,系数αy 将偏离αx ,并且稀疏编码噪声(SCN )V a = αy-αx 决定了xˆ的图像恢复质量。

在此我们进行了一些实验来调查SCN V a 的统计。

我们使用Lena 图像作为例子。

原始图像x 首先被模糊(用一个标准差为1.6的高斯模糊内核),再加上一个标准差为2的高斯白噪声来获得一个有噪声和模糊的图像y 。

然后我们分别通过最小化αx = argmin { || x -Φ◦α ||22 + λ || α||1 }, (7) α和式(6)计算αx 和αy 。

DCT 字典在这个实验被采用。

然后通过V a=αy-αx 计算SCN 。

在图1(a )中,我们绘出对应字典中的第四个原子(其他原子的分布类似)对应的V a 分布。

在图1(b )中,当观察的数据y 刚开始模糊(由一个标准差为1.6的高斯模糊内核)然后采样后绘出V a 分布。

我们可以看到SCN V a 的实验分布在零处达到最高值,拉普拉斯算子函数可以很好地表示其特点,但高斯函数有很多更大的拟合误差。

在图1(c )和(d )中我们log 域显示这些分布以便更好地观察拟合的尾巴。

这个观察促使我们使用之前的拉普拉斯算子来对SCN 建模,这些将在第三节介绍。

2.2 集中稀疏表示很明显,抑制SCN V a 有助于改善IR 的输出xˆ,然而困难在于系数矢量αx 是未知的,所以不能直接测量V a 。

但是,如果我们能进行一些对αx 的合理估计,用αˆ x 表示,然后就可以用αy − αˆ x 表示αx 的一个近似值。

直观的说,为了抑制αx 和提高αy 的精确度,有一个新的稀疏编码模型:其中γ 是一个常数,l p (p 可以是1或2)范数用来测量α与αˆ x 间的距离。

与式(6)相比,式(8)使αy 接近αˆ x (因此SCN V a 能被抑制)从而使αy 是稀疏的,因此致使稀疏编码比通过求解式(6)得来的更为可取。

如果αˆ x =0并且p=1,式(8)的模型将简化为式(6)的常规模型。

现在问题转化为如何找到一个未知矢量αx 的合理估计。

通过将αx 看做一个随机变矢量,αx 的一个很好的无偏估计自然是它的平均值;也就是说,我们可以令αˆ x =E[αx ]。

事实上,我么可以通过假设SCN 的V a 几乎是零均值(请参阅2.1节中的经验观察值)来由E[αy ]近似E[αx ],并有αˆ x =E[αx ]≈E[αy ]。

然后式(8)可以转化为我们把上面的模型称为集中稀疏表示(CSR ),因为它使稀疏编码系数α强制接近其分布中心(即平均值)。

对于每一个图像块i 的稀疏编码αi ,如果我们有足够的αi 的样本,E[αi ]是可以近似计算的。

幸运的是,给定的块i 在自然图像中通常有许多非局部相似块。

然后E[αi ]可以通过与块i 相关的非局部相似块(包括块i )的那些稀疏编码矢量的加权平均数来计算。

为此,我们可以对每一个块i 通过块匹配而形成一个簇,用C i 表示,然后计算每个簇里稀疏编码的平均值。

用αi,j 表示找到的与块i 相似的块j 的稀疏编码。

然后我们用所有αi,j 的加权平均值来近似于E[αi ],即μ i =j i ja wC j i ,i,∈∑ (10)其中w i,j 是权重。

与非局部平均方法【6】中相似,w i,j 可以被设置成与块i 与块j 间距离成反比:w i,j = exp( - || x ˆi - x ˆi,j ||2 2/h) / W , (11)其中xˆi = Φαˆi和xˆi,j = Φαˆi,j 是块i和块j的估计,W是一个归一化因数,h是一个预定的标量。

通过用μ i 作为E[αi]的估计,式(9)中的CSR模型可以写成:从式(12)中我们可以更清楚地看到CSR模型结合局部稀疏性(即||α||1)和非局部相似性诱导稀疏性(即||αi-μi||l p)到一个统一的变化公式。

通过利用局部和非局部的冗余,更好的IR结果是可以预期的。

实际上式(12)表明了一个CSR模型的迭代最小化方法。

我们初始化μ i为0,即μ i(-1) =0。

然后从一些初始的稀疏编码结果,表示为αy(0),我们可以得到x的初始估计,表示为x(0),通过x(0)=Φ◦αy(0)。

在x(0)的基础上,我们可以找到每一个局部块i的相似块,并因此每个块的非局部平均编码矢量,即μi,就可以根据αy(0)通过式(10)和式(11)来更新。

更新后的平均值由μi(0)表示,将会在CSR模型的下一轮稀疏编码处理中用到。

这个步骤被重复使用直到收敛为止。

相关主题