当前位置：文档之家› 图像识别技术综述

图像识别技术综述

图像处理与识别技术综述摘要：本文简要介绍了图像处理与识别技术的相关知识，介绍了图像识别过程中的判别函数和判别规则，特征提取和选择的方法。

设计一个基于16位处理器MC9S12XS128的图像识别系统在实际中的具体硬件实现。

关键词：图像识别特征提取MC9S12XS128 数字摄像头An Overview of Image Recognition And Identifying TechnologyAbstract：This paper introduces some knowledge of image recognition and identifying technology，introduces the discriminant function discriminant rule in the image identifying progress, feature extraction and selection method. Designed an image identifying system based on 16-bit controller MC9S12XS128,and it has specific hardware implementation in fact.Key words: image identifying discriminaut rule MC9S12XS128 digital cameral1 引言图像是与视觉相关的最贴近生活的信息，它是客观世界的物体直接或间接作用于人眼而产生视知觉的实体。

传统的图像处理技术就是对图像进行保存、处理、压缩、传输和重现。

随着信息时代的到来，用于计算机处理的各种信息的需求越来越多，多媒体信息处理技术已经成为日常生活各个领域的迫切需要。

人们更希望利用计算机技术处理人类视觉问题，如：人脸、指纹识别技术实现处理与个人有关的一切事物，利用视觉自动监视系统监视环境中发生的非常事件，利用字符识别技术实现文档图像的自动录入与处理。

因此把传统的图像处理技术与模式识别处理技术相结合是图像处理的新趋势。

2 传统的图像处理技术图像处理技术始于20世纪50年代，1964年美国喷射推进实验室（JPL）使用计算机对太空船送回的大批月球照片处理后得到了清晰逼真的图像，这是这门技术发展的里程碑，此后这门技术得到了广泛的发展。

传统图像处理技术包含图像的获取、变换、增强、编码、分割等方面的内容。

2.1 图像获取图像可以根据其形式或产生方法来分类。

图1 图像的分类图像的获取[4]是指将其变为计算机可识别的信息。

通常是数字化的过程，及扫描、采样、量化三个步骤。

经过数字化过程后就得到了一幅图的数字表示，即数字图像。

一般这个过程由摄像头等设备完成。

反过来还可将数字图像进行显示。

2.2 图像变换图像变换[6]广泛应用于图像滤波[2]、统计滤波[5]、图像数据压缩以及图像描述等。

图像变换是将N×N维空间图像数据变换成另外一组基向量（通常是正交向量空间）的坐标参数，我们希望这些离散图像信号坐标参数更集中代表了图像中的有效信息，或者是更便于达到某种处理目的。

通常采用的方法有：傅里叶变换、相关分析、小波变换[7]、离散余弦变换（DCT）、正弦变换、沃尔什-哈达玛变换、K-L 变换[13][14][15]（主成分分析法）等。

着重介绍K-L 变换在实际中的应用算法SIMCA 。

SIMCA （Soft Independentt Modeling of Class Analog ）方法是一种有监督模式识别方法。

该方法是对训练集中每一类样本的量测数据矩阵分别进行主成分分析[10][11][12] （PCA ），建立每一类的主成分分析数学模型，然后在此基础上对未知样本进行分类，即分别试探将该未知样本与各类样本数学模型进行拟合，以确定其属于哪一类或不属于任何一类。

基本的SIMCA 方法有两个主要步骤，第一步先建立每一类的主成分分析模型，第二步以未知样本逐一去拟合各类的主成分模型，从而进行判别归类。

主成分提取的原理是对高维的原变量空间进行降维，以消除众多化学信息中相互重叠的信息部分，使数目较少的主成分（新变量）成为原变量的线性组合，而且新变量应最大限度地表征原变量的数据结构特征而不丢失信息。

其方法是将光谱数据向均方差最大方向投影。

通过对主成分个数的合理选取，去掉代表干扰组分和干扰因素的主成分，新变量最大限度地反映了被测样品的组成和结构信息，而最小限度地包含噪音。

另外，主成分之间相互正交，能够克服原变量多重相关性造成的信息重叠。

这样有助于从样品的测量光谱中最大限度地提取有用的化学信息，建立优秀的数学模型。

PCA 方法是把光谱矩阵分解为两个维数较小的矩阵的乘积：E P T A p f f m p m +⋅=⨯⨯⨯其中错误!未找到引用源。

为光谱矩阵，错误!未找到引用源。

为得分矩阵，错误!未找到引用源。

为载荷矩阵，E 为光谱残差，维数与错误!未找到引用源。

相同。

m 为样品数目，p 为波长数目，f 为 PCA 主成分个数。

主成分与原变量之间的相关系数称为载荷（Loading ）。

载荷表征原始变量与新变量之间的相关性。

样本在新变量下的坐标值称为得分（score ）。

经过主成分分析后，常用聚类分析[8]来分析图像。

2.3 图像增强图像增强[9]就是增强图像中的有用信息，其目的主要有两个：一是改善图像的视觉效果，提高图像成分的清晰度；二是使图像变得更有利于计算机处理。

图像增强的方法一般分为空间域和变换域两大类。

空间域方法直接对图像像素的灰度进行处理。

变换域方法在图像的某个变换域中对变换系数进行处理，然后通过逆变换获得增强图像。

常用的图像增强方法包括：空间域单点增强（灰度级修正）、图像平滑、图像锐化、图像滤波与彩色增强等。

2.4 图像编码图像信息已经成为通信和计算机系统中的重要处理对象。

与文字信息不同的是，图像信息占据大量的存储容量，所用传输信道也较宽。

因此对图像数据的压缩成了迫切需求。

由于图像本身固有的冗余性和相关性，使得将一个大的图像数据文件转换成较小的图像数据文件成为可能。

图像压缩[17]不能丢失原始图像的重要信息，衡量压缩性能的指标是客观保真度和主观保真度。

常用的客观保真度可以采用图像的均方根误差e ms 、信噪比SNR 与峰值信噪比PSNR 表示。

在相同的压缩比下，均方误差e ms 越小，性能越好。

在相同均方根误差e ms 下，压缩比越大，性能越好。

常用的数据编码方法有：统计编码、预测编码、变换编码、轮廓编码等。

2.5 图像分割[16]在对图像的研究和应用中，人们往往仅对图像中的某些部分感兴趣。

这些部分常称为目标或前景（其他部分称为背景），它们一般对应图像中特定的、具有独特性质的区域。

为了辨识和分析目标，需要将这些有关区域分离或提取出来，在此基础上才有可能对目标进一步利用，如进行特征提取和测量。

图像分割就是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程。

这些特征可以是灰度、颜色、纹理或几何性质等，目标可以对应单个区域，也可以对应多个区域。

分割出的区域应同时满足：（1）分割出的图像区域的均匀性和连通性。

均匀性是指该区域中所有像素点都满足基于灰度、纹理、色彩等特征的某种相似性准则，连通性是指该区域内存在连接任意两点的路径。

（2）相邻分割区域之间针对选定的某种差异显著性。

（3）分割区域边界应规整，同时保证边缘的空间定位准确。

基本的分割算法，首先对灰度图像的分割可基于像素灰度值的2个性质：不连续性和相似性。

区域内的像素一般具有灰度相似性，而区域之间的边界上一般具有灰度不连续性。

所以分割算法可据此分为利用区域间灰度不连续性的基于边界的算法和利用区域内灰度相似性的基于区域的算法。

其次，根据分割过程中处理策略的不同，分割算法又可分为并行算法和串行算法。

在并行算法中，所有判断和决策都可独立地和同时地做出，而在串行算法中早期处理的结果可被其后的处理过程所利用。

一般串行算法所需计算时间常比并行算法长，但抗噪声能力也较强。

这2个准则互不重合又互为补充，所以分割算法根据这2个准则分成四类：（1）并行边界类；（2）串行边界类；（3）并行区域类；（4）串行区域类。

3 图像识别图像识别，可分为是图像的模式识别，它是模式识别技术在图像领域中的具体运用。

传统图像处理是对输入图像的某种有效的改善，其输出仍是一幅完整的图像，而识别是可认为是认识它而且能从一堆物件中间把它与其他事物区别开来。

3.1 判别函数和判决规则模式识别系统的基本功能是能判别各模式所归属的类型，完成这一功能的重要方法之一是采用判别函数。

判别函数[18]有线性和非线性之分。

3.1.1 线性判别函数线性判别函数是应用较广的一种判别函数。

所谓线性判别函数，是指判别函数是图像所有N 个特征量的线性组合。

设它的组合系数为0i ω，则对于M 类问题，其任一类i 的线性识别函数为01)(i k N k ik i X X D ωω+=∑= M i ,,2,1 = （1）式中：)(X D i 代表第i 个判别函数，ik ω是系数或权，0i ω为常数或称为阈值。

在i ω和jω两类之间的判决分界处有)()(X D X D j i =，所以边界方程为0)()(=-X D X D j i （2）该方程在二维空间是直线，在三维空间是平面，在N 维空间是超平面。

)()(X D X D j i -可以写成如下形式：)()()()(001j i k Nk jk ik j i X X D X D ωωωω-+-=-∑= （3）相应的判决规则为：如果0)()(D )()(>->X D X X D X D j i j i 或，则i X ω∈；如果0)()(D )()(<-<X D X X D X D j i j i 或，则j X ω∈。

用线性判决函数构造的分类器是线性分类器。

任何m 类问题都可以分解为（m-1）个两类识别问题。

方法是先把模式空间分为某一类和其他类的组合，即两两对比，如此进行下去即可实现最终分类。

因此，两类线性分类器是最简单和最基本的。

x 2x N -1x 1图2 两类的线性分类器在线性分类器中要找到合适的权值，才能使分类尽可能不出差错，有效地方法就是实验法。

3.1.2 最小距离判别函数在图像识别中，线性分类器一种很重要的方法就是将未知类别的图像和特征空间中作为模板的点（标准样点的中心）之间的距离作为分类的准则。

对于M 类模板，未知类别图像与哪一类距离最近就属于哪一类。

这就是最小距离判别函数[8]。

3.1.3 非线性判别函数线性判别函数很简单，但也有缺点，它对于较复杂的分类往往不能胜任。

e商务文档

图像识别技术综述

相关文档推荐：