杭州电子科技大学毕业设计(论文)文献综述毕业设计题目SIFT特征研究及应用文献综述题目图像配准算法综述学院生命信息及仪器工程学院专业电子信息技术及仪器姓名班级学号指导教师图像配准算法综述一.前言图像配准是指找出场景中同一物体表面的结构点在不同图像上的投影像素点之间的对应关系,是图像信息处理领域中一项非常重要的技术,同时也是其它一些图像分析技术,如立体视觉、运动分析、数据融合等的基础。
目前图像配准广泛应用于虚拟现实、视频压缩、图像复原、图像数据库检索等技术中。
图像配准的研究是计算机视觉中最困难也是最重要的任务之一。
不同的图像配准方法总是对应于某种适用的图像变换模型,其核心问题是提高配准的速度、精度和算法的稳健度。
随着科学技术的发展现在约40%的机器视觉应用中都会使用图像匹配技术,所涉及的领域有:工业检测,导弹的地形匹配,光学和雷达的图像跟踪,交通管理,工业流水线的自动监控、工业仪表的自动监控,医疗诊断,资源分析,气象预报,文字识别以及图像检索等。
图像匹配研究按其处理步骤可以分为样本采集、样本预处理、样本分割、样本的特征提取等,并且与计算机视觉、多维信号处理和数值计算方法等紧密结合。
它也是其它一些图像分析技术,如立休视觉、运动分析、数据融合等的基础。
正因为其应用的广泛性,新的应用和新的要求逐步产生,使得匹配算法的研究逐步走向深入,出现了快速、稳定、鲁棒性好的匹配算法。
因此,研究图像的匹配算法对于如何提高实际工程中的图像处理质量和识别精度具有非常重要的意义。
本文主要分析图像匹配常用方法的优点和不足之处,讨论了图像匹配中需要进一步研究和解决的问题。
二.图像配准算法的研究现状图像配准是立体视觉、运动分析、数掘融合等实用技术的基础,在导航、地图与地形配准、自然资源分析、天气预报、环境监测、生理病变研究等许多领域有重要的应用价值。
国内外学者针对不同的图像配准应用问题进行了大量的研究工作,早在1992年英国剑桥大学的Lisa Gottesfeld Brown在文献[1]习中就总结了图像配准的主要理论及图像配准在各个领域的应用。
当时他讨论的图像配准技术主要还是著眼于医学图像处理、遥感图像处理等传统应用领域。
图像配准是图像镶嵌技术的核心问题。
微软研究院的Richard Szeliski在1996年SIGGRAPH上提出了基于运动模型的全景图拼接算法[7]。
Szeliski采用了非线性优化的方法来最小化像素两幅图像的亮度差以确定变换参数。
该方法使用了全部像素进行优化处理,所以配准精度较高,但是计算速度较慢,且稳健性不佳。
国内的赵向阳。
杜立民在2004年提出了一种基于特征点匹配的图像自动拼接算法[2],其中使用了Harris算法[3]提取角点并进行匹配。
赵的算法采用了鲁棒变换估计技术,在一定程度上提高配准算法的稳健性,但是计算速度依然较慢,且无法配准重叠区域较小、运动物体较多的图像。
M.Brown 在2003年ICCV 大会上发表了一篇名为Recognising Panoramas 的文章[4],文中使用了基于不变量技术[5]的SIFT 算法[6]进行图像配准,算法完全自动完成且效果较好。
M.Brown 的大会发言再次掀起了全景图拼接技术研究的热潮。
另外,B.Reddy 和B.Chatterji [7]中提出了一种基于FFT 的图像配准方法,可以处理包含平移、缩放和尺度变化在内的图像配准问题;李忠新等在2004年提出了一种基于频域相关的柱面全景图拼接技术[8]。
这些方法都是在变换域进行图像配准的例子。
下面就介绍几种常见的图像配准算法:1.基于像素灰度的匹配[9]的序贯相似性检测法(SSDA)SSDA 算法是一种快速图像匹配算法,它使用式(1)作为相似性度量∑∑==-=m i n j Xij ij b a Y mn b a D 11),(1),((1)SSDA 随机选取位置),(l i 上的像素,但选取不能重复,求和时并不计算所有的像素,只要其和超过设定的阀值,则说明当前位段为非匹配位置,停止本次计算,否则进行下一位置的测试,直至找到匹配点为止。
2.归一化积相关灰度匹配归一化积相关具有不受比例因子误差影响和抗白噪声干扰能力强等优点,其度量定义如式(2)∑∑∑∑∑∑=======m i n j m i n j m i nj ijb a Y il X ij b a XijY b a R 1111112),(2),(),((2)比较参考图像与输入图像在各个位置的相关系数值最大的点就是最佳匹配位置。
刘煜李言俊等在文献[10]中提到了一种解决几何形变所带来的模板匹配误差的方法。
根据单像素的偏移将导致相关性的骤降,而多像素的偏移会使相关性缓慢减少的特性,采用多像素边缘匹配方法,克服了当实时图与基准图之间存在局部变形时,单像素边缘匹配方法将会影响实时图与它在基准图真实位置的相关性的缺点,使之仍能保证整体上较大的相似性,减小了相关算法受边缘变形等的影响。
2.1图像匹配的三要素(1)特征空间特征空间是由参与匹配的图像特征构成的,特征可以是灰度值,也可以是边界、轮廓、表面、显著特征、统计特征、高层结构描述与句法描述等。
选择合理的特征可以提高匹配性,降低搜索空间、减小噪声等不确定性因素对算法的影响,提高适应性;(2)相似性度量相似性度量指用什么来确定待匹配特征之间的相似性,它通常是某种代价函数或者是距离函数的形式,经典的相似性度量包括相关函数和Minkowski距离,最近人们又提出了Hausdorff距离、互信息作为匹配度量;(3)搜索策略搜索策略是用合适的搜索方法在搜索空间中找出平移、旋转等变换参数的最优估计,使得图像之间经过变换后的相似性最大。
搜索策略有穷尽搜索、分层搜索、模拟退火算法、Powell方向加速法、动态规划法、遗传算法和神经网络法等。
2.2算法分类及优缺点图像匹配的算法很多,但基本原则是不变的:有效性,稳定性以及实时性。
本文将匹配算法分为基于区域的匹配方法、基于特征的匹配方法、基于模型的匹配和基于变换域的匹配。
基于区域的匹配方法又称为基于图像灰度的配准方法,通常直接利用整幅图像的灰度信息,建立两幅图像之间的相似性度量,然后采用某种搜索方法,寻找使相似性度量值最大或最小的变换模型的参数值。
基于图像灰度的配准方法不需要对图像做特征提取,而是直接利用全部可用的图像灰度信息,因此能提高估计的精度和鲁棒性[11]。
但是它计算量大,难以达到实时性要求,而且一旦进入信息贫乏的区域,会导致误匹配率的上升。
基于图像特征的配准方法[12]需要对图像进行预处理,然后提取图像中保持不变的特征,如边缘点、闭区域的中心、线特征、面特征、矩特征等,作为两幅图像配准的参考信息。
这类方法的主要优点是它提取了图像的显著特征,大大压缩了图像的信息量,使得计算量小,速度较快,而且它对图像灰度的变化不敏感。
但另一方面,正是由于其不依赖于图像的灰度信息,这种方法对特征提取和特征匹配的错误十分敏感,匹配性能依赖于特征提取的质量,需要可靠的特征提取和鲁棒的特征一致性,匹配精度低于基于灰度的匹配方法。
基于模型的匹配方法在计算机视觉领域中的应用非常广泛,它可以分为刚体形状匹配和变形模板匹配[13]两大类。
Kass提出的Snake主动轮廓模型是比较典型的自由式变形模板模型。
由于不受全局结构的限制,所以Snake模型能表示任意的形状,但是该模型对于模板的初始位置和噪声比较敏感,对于凹边缘的收敛性较差,而且容易陷入局部最小值。
基于变换域的匹配的方法有基于傅立叶变换、基于Gabor变换和基于小波变换的匹配,这些匹配方法对噪声不敏感,检测结果不受照度变化影响,可以较好的处理图像之间的旋转和尺度变化。
三.总结目前对于彩色图像的匹配研究最多的是基于颜色特征的图像检索,而对其在形状、纹理、轮廓或者多种特征的组合匹配到目前引入学习机制(监督学习、非监督学习、Bayes学习、SVM动态学习、相关反馈等)用于图像高层语义的图像匹配方法的研究甚少,因此这也是一个值得研究的问题。
各种匹配算法各有其特点及应用范围。
使其相互借鉴、渗透及融合,以克服单个算法的局限性,提高匹配的适应性。
图像匹配研究作为计算机视觉和图像处理中的主要内容,有着重要的理论和实践意义。
由于成像过程中各种不可预知因素的影响,该问题至今尚未得到很好的解决,但已经取得了很大的进展。
四.参考文献[1]Lisa Gottesfcld Brown.A survey of image registration techni ques[J].ACMComputing Surveys.V01.24,No,4,December1992:p325-376[2]赵向阳,杜立民.一种全自动稳健的图像自动拼接融合算法田.中国图象图形学报;Z004,9(4):p417-422[3] C.Harris,M.Stephens.A combined comer and edge detector[C].The4thVisionConference,147-151,1988[4]M.Brown and DG Lowe.Re.ognising Panoramas[C].Proceedings of IEEE InternationalConference OR ComputerVision2003.page(s):1218·1225v01.2[5]M.Brown and D.Lowe.Invariant Features from Interem Point Groups[C].In Proe ofthe13th British Machine Vision Conference,P253-262,Cardiif,2002.[6]K.Mikolajczyk,C.Schmid.Scale&Affine invariant interest point detectors[C].InLiCV1(60):63-86,2004.[7] B.Reddy and B.Chatterji.A FFT-Based Technique for Translation,Rotation,andScale Invariant Image Registration[J].IEEE Trans.Pattern Analysis and Machine Intelligence,v01,5(8),PP.1266-127l,1996.[8]李忠新,茅耀斌,王执铨.一种基于频域相关技术的柱面全景图生成方法[J].计算机工程与应用.2004V01.40No.11pp81-82,145[9]黄诚,王国营.一种基于颜色聚合向量的图像检索方法[J].计算机工程,2006,32(2):194-199.[10]刘煌,李言俊.飞行器下视景像边缘提取和定位方法研究[J]中国图象图形学报,2008,13(11).[11]沈振康,孙仲康.数字图像处理及应用[M].北京:国防工业出版社.1983.[12]郑南宁.计算机视觉与模式识剐[M].北京:国防工业出版社.1998.[13]施鹏飞.图像匹配算法及其应用[D].上海交通大学硕士论文.2000.。