1 前言该课题要求用边缘检测来实现对文字的识别。
文字图像信息是人类获取外界信息的主要来源,在近代科学研究、军事技术、工农业生产、医学、气象及天文学等领域中,人们越来越多的利用图像信息来识别和判断事物,解决实际问题。
通过学习MATLAB软件的应用,了解边缘检测处理对文字图像的理论基础和过程,用MATLAB 软件对文字图像进行边缘检测。
在模式识别系统中,图像边缘提取占据着重要的地位,它位于系统的最底层,为其他模块所依赖。
图像边缘提取作为计算机视觉领域最经典的的研究课题长期受到人们的重视。
2 正文图像的边缘检测有着很长的研究历史,学术思想非常活跃,新理论、新方法不断涌现,一直是国内外图像处理领域研究的热点,目前为止已经提出了许多方法和理论,这一方面是由于边缘检测本身的重要性,另一方面也反映了边缘检测课题的深度和难度。
图像的边缘是图像的基本特征,所谓边缘是指其周围像素灰度的阶跃变化活屋顶变化的那些像素的集合。
边缘广泛存在于物体与背景之间、物体与物体之间、基元与基元之间。
从本质上说,边缘是图像局部特性不连续性的反映,它标志着一个区域的终结和另一个区域的开始,由于噪声和模糊的存在,检测到的边界可能会变宽或在某些点处发生间断,因此边缘提取的首要任务是要检测出图像局部特性的不连续性,然后剔出某些边界点或补充间断点,并将这些边缘像素连成完备的边界[1] 。
至今提出的关于边缘检测的方法和理论尚存在不足之处,在某些具体情况下仍然无法很好的检测出目标物体的边缘,难以找到一种普遍适应性的边缘检测方法。
因此,根据具体的应用要求设计新的边缘检测方法,或对现有的方法进行改进以得到满意的边缘检测结果,这些依然是研究的主流方向。
现有的边缘检测方法大致有以下几类[2]:1.微分法传统的图像边缘检测方法大多归结为图像高频分量的增强过程,微分运算自然就成了边缘检测与提取的主要手段。
基于边缘点往往对应于一阶微分幅值大的点,研究者最早提出了一些基于梯度的边缘检测算子[3],例如Roberts算子、Prewitt算子、Sobel 算子、Kirsch算子等。
基于梯度的边缘检测算子是现在应用比较广泛的方法,它们运算量小,操作简单。
但是由于基于梯度的边缘检测算子通常在图像边缘附近的区域内产生较宽的响应,所以采用上述算子检测的边缘一般需要作细化处理,这就影响了边缘定位的精度。
一阶微分的局部最大值对应着二阶微分的过零点,这意味着在图像边缘点处有一阶微分的峰值同样会有二阶微分的零交叉点,因此人们也提出了二阶微分算子进行边缘检测,例如拉普拉斯算子。
与基于梯度的边缘检测算子相比,拉普拉斯算子对噪声更加敏感,增强了噪声对图像的影响。
实际应用中使用基于梯度和二阶微分的边缘检测算子时,通常需要先对图像进行滤波平滑处理。
2.最优算子法最优算子是在经典边缘检测算子的基础上发展起来的,这类方法的目的是根据信噪比求得检测边缘的最优滤波器。
Marr- Hildreth算子[4],也被称LOG( Laplacian of Gaussian)算子,它先用高斯函数对图像进行平滑,再采用拉普拉斯算子根据二阶导数过零点检测边缘。
数学上已经证明[5]。
LOG算子是按照二阶导数零交叉点检测阶跃型边缘的最佳算子。
3.基于小波的边缘检测通过小波多尺度提取图像边缘是一种非常有效的方法。
由于小波变换具有的多尺度特性,图像的每个尺度的小波变换都提供了一定的边缘信息。
当尺度小时, 图像的边缘细节信息较为丰富,边缘定位精度较高,但易受到噪声的干扰;大尺度时,图像的边缘稳定,抗噪性好,但定位精度差。
将各尺度的边缘图像的结果综合起来,发挥大小尺度的优势,就能得到精确的图像。
多尺度边缘检测的基本思想就是沿梯度方向,分别用几个不同尺度的边缘检测算子在相应点上检测模极大值的变换情况,并通过对阈值的选取,再在不同尺度上进行综合,得到最终边缘图像,可以较好的解决噪声和定位精度之间的矛盾。
4.基于形态学的边缘检测数学形态学是一种非线性滤波方法,在图像处理中已获得了广泛的应用。
形态学运算是物体形状集合与结构元素之间的相互作用,对边缘方向不敏感,并能在很大程度上抑制噪声和探测真正的边缘。
同时数学形态学在图像处理方面还具有直观上的简单性和数学上的严谨性,在描述图像中物体形状特征上具有独特的优势。
因此,将数学形态学用于边缘检测,既能有效地滤除噪声,又可保留图像中的原有细节信息,具有较好的边缘检测效果。
用数学形态学运算进行边缘检测也存在着一定的不足,比如结构元素单一的问题。
它对与结构元素同方向的边缘敏感,而与其不同方向的边缘或噪声会被平滑掉,即边缘的方向可以由结构元素的形状确定。
但如果采用对称的结构元素,又会减弱对图像边缘的方向敏感性。
所以在边缘检测中,可以考虑用多方位的形态结构元素,运用不同的结构元素的逻辑组合检测出不同方向的边缘。
梁勇等人构造的8个方向的多方位形态学结构元素,应用基本形态运算,得到8个方向的边缘检测结果,再把这些结果进行归一化运算、加权求和,得到最终的图像边缘。
该算法在保持图像细节特征和平滑边缘等方面,取得了很好的效果。
将模糊集合理论用于数学形态学就形成了模糊形态学。
模糊形态学是传统形态学从二值逻辑向模糊逻辑的推广,与传统数学形态学有相似的计算结果和相似的代数特性。
Todd 和Hirohisa 将模糊形态学推广到了边缘检测领域。
目前,数学形态学在理论上已趋于完备,与实际应用相结合,使之能用于实时处理将是今后发展的一个重要方向。
5.基于分形理论的边缘检测任意一幅图像都是有灰度的、非严格自相似的,不具有整体与局部的自相似,但却存在局部之间的自相似,即从局部上存在一定程度近似的分形结构。
正是由于存在局部之间的相似性,就可以构造图像的迭代函数。
分形几何中的压缩映射定理,可以保证局部迭代函数的收敛,而分形几何中的拼贴定理,就允许一个完整图像分成若干个分形结构,即构成一个迭代函数系统。
有了这个迭代函数系统,就必然决定了唯一的分形图形。
这个图形被称为迭代函数系统的吸引子。
因此压缩映射定理和拼贴定理,构成了分形在图像处理中的核心部分。
对于给定的一幅图像,寻找一个迭代函数系统,使它的吸引子与原图像尽量地吻合,因为迭代函数系统的吸引子与原图像间必然存在着差异,图像中的每个子图分形结构也不同程度上存在差异,因此子图的分形失真度大小不一,处在边缘区的子图的分形失真度比较大,而处在平坦区或纹理区子图的分形失真度相对比较小。
因此,就可以利用图像边缘在分形中的这一性质来提取图像的边缘。
在检测图像边缘时,采用某种度量方法( 如最小二乘法) 测量子块与最佳匹配父块的失真度,当计算的失真度值越大时,对应的边缘块越强,否则,对应的边缘块越弱。
设定某一阈值,作为区分边缘块的界限,与最佳匹配父块的失真度大于阈值的子块,就被划为边缘块。
6.基于模糊学的边缘检测80 年代中期,Pal和King 等人提出了一种图像边缘检测模糊算法[6],首次将模糊集理论引入到图像的边缘检测算法中,能有效地将物体从背景中分离出来,并在模式识别和医疗图像处理中获得了良好的应用。
该算法的思想是首先用隶属度函数G 将图像映射成一个模糊隶属度矩阵,然后对该矩阵进行多次非线性变换,以增强边缘信息,削弱非边缘信息,再对模糊隶属度矩阵进行G-1变换,易得到经过增强的图像,最后用”min”和”max”算子[7]提取边缘。
该算法也存在一些缺陷,比如损失了一些低灰度值边缘信息,并且运算复杂。
7.基于人工智能的边缘检测人工神经网络是进行模式识别的一种重要工具和方法。
它需要的输入知识较少,也比较适合于并行实现。
近年来, 人工神经网络正广泛地被用于模式识别、信号与图像处理、人工智能及自动控制等领域。
神经网络的主要问题是输入与输出层的设计问题、网络数据的准备问题、网络权值的准备及确定问题、隐层数及结点的问题、网络的训练问题。
在各种神经网络模型中,应用最广泛的一类是前馈神经网络,用于训练前馈网络的最常用的学习方法是BP 算法。
目前已有了很多基于BP 网络的边缘检测算法,但是BP 网络收敛速度很慢, 容易收敛于局部极小点,且数值稳定性差,参数难以调整,很难满足实际应用的要求。
Chua 和Yang提出用细胞神经网络来检测图像边缘,这种方法与传统方法完全不同,首先将图像映射为一个神经网络,每个像素点是一个神经元,然后通过动态方程引导神经元的状态向神经网络所定义的最低能量方向变化,来实现边缘提取。
小波变换的边缘检测方法及实现自从1882年傅立叶发表”热传导解析理论”以来,傅立叶变换[8]一直是信号处理领域中最完美、应用最广泛、效果最好的一种分析手段。
但是傅立叶变换只是一种纯频域的分析方法,它在频域的定位性是完全准确的(即频域分辨率高),而在时域无任何定位性(或分辨能力),即傅立叶变换所反映的是整个信号全部时间下的整体频域特征,而不能提供任何局部时间段上的频率信息。
相反,当一个函数用δ函数展开时,它在时间域的定位是完全准确的,而在频域却无任何定位性(或分辨能力),也即δ函数分析所反应的只是信号在全部频率上的整体时域特征,而不能提供任何频率段所对应的时间信息。
为了研究信号在局部时间范围的频域特征,1946年Gabor提出了著名的Gabor变换[9],之后又进一步发展为短时傅立叶变换。
目前,短时傅立叶变换已在许多领域获得了广泛的应用。
小波分析[10]来源于人们对时频分析和多分辨率分析的研究。
长期以来,人们力图寻求一种函数系,它可以对任意函数进行分解,并且拥有良好的时间局部性和频率局部性。
3 结论图像边缘是图像最基本的特征之一,携带了一幅图像的大部分信息。
而边缘存在于信号的奇异点或突变点处,也存在于图像的不规则结构和不平稳现象中,这些点给出了图像轮廓的位置,这些轮廓则常常是我们在图像处理时所需要的非常重要的一些特征条件,这就需要我们对一幅图像检测和提取出它的边缘图像.而边缘检测算法则是图像处理问题中的经典技术难题之一,它的解决对于我们进行高层次的特征描述、识别和理解等有着重大的影响。
笔者认为,进一步的工作应该考虑到如下几个方面:如何提高边缘检测算子的抗噪性能,以便可以精确地检测出带噪图像的边缘,从而提高算法的实用性。
在边缘检测中,对于大量的图像,如何构造边缘检测的阀值,使得尽可能检测出图像的真实边缘,又使检测出的伪边缘尽可能的少。
在灰度图像边缘研究的基础上,结合彩色图像的特点,开展彩色图像边缘检测的研究。
毕业设计(论文)文献综述。