当前位置:文档之家› 图像识别方法和设备的制作流程

图像识别方法和设备的制作流程

本技术的实施方式提供了一种图像识别方法。

该方法包括:对待识别图像进行特征提取,得到多个特征向量;确定每个特征向量对应的类别;针对每个特征向量,分别计算其所对应的类别下各样本图像的分数;将计算得到的同一样本图像的分数累加,得到该同一样本图像的分值;将分值最高的样本图像对应的图像标识作为待识别图像的识别结果。

通过上述图像识别方法,有效提取多个特征来表征待识别图像,提取的特征不受图像中物体的特性所影响,能够实现对图像的有效识别,适用范围广;且通过计算样本图像分数的方式得到识别结果,综合考虑了特征的重要性,能够获得较好的识别精度。

此外,本技术的实施方式提供了一种图像识别装置。

权利要求书1.一种图像识别方法,包括:对待识别图像进行特征提取,得到多个特征向量;确定每个特征向量对应的类别;针对所述每个特征向量,分别计算其所对应的类别下各样本图像的分数;将计算得到的同一样本图像的分数累加,得到该同一样本图像的分值;将分值最高的样本图像对应的图像标识作为所述待识别图像的识别结果;按照以下公式计算样本图像的分数:其中,S表示当前样本图像的分数,A表示平均每个类别下的样本图像特征向量个数,B表示所述当前样本图像所属的类别下的所有图像标识出现次数之和,C表示所述当前样本图像所属的类别下,所述当前样本图像对应的图像标识出现次数,D表示放缩因子。

2.根据权利要求1所述的图像识别方法,其中,确定每个特征向量对应的类别,包括:分别计算所述特征向量与预先存储的多个聚类中心向量的距离,其中,所述聚类中心向量与所述类别一一对应;确定与所述特征向量距离最近的聚类中心向量对应的类别为所述特征向量对应的类别。

3.根据权利要求1所述的图像识别方法,其中,对待识别图像进行特征提取,得到多个特征向量,包括:利用滑动窗口遍历所述待识别图像;针对所述滑动窗口所处的每个区域,计算该区域的特征向量。

4.根据权利要求3所述的图像识别方法,其中,计算该区域的特征向量,包括:将该区域划分为多个大小相同的细胞单元,其中,每个细胞单元之间不重叠;针对所述每个细胞单元,计算其中各像素的梯度方向值,将所述梯度方向值在预设的投影区间内进行投影生成梯度方向投影向量;将各像素的梯度方向投影向量求和,得到该细胞单元的梯度方向直方图;将该区域内所有细胞单元的梯度方向直方图进行串联作为该区域的特征向量。

5.根据权利要求3所述的图像识别方法,其中,利用滑动窗口遍历所述待识别图像,包括:在所述待识别图像上,利用所述滑动窗口按照预设方向每隔固定个数的像素进行滑动,直到遍历整个待识别图像。

6.根据权利要求1所述的图像识别方法,其中,对待识别图像进行特征提取,包括:在所述待识别图像上裁剪出识别区域,并将所述识别区域的像素尺寸调整到预定像素尺寸,对所述识别区域进行特征提取。

7.根据权利要求1至6中任一项所述的图像识别方法,其中,在对待识别图像进行特征提取之前,所述方法还包括:建立索引信息,并存储所述索引信息。

8.根据权利要求7所述的图像识别方法,其中,建立索引信息包括:记录多张样本图像的图像标识,分别对每张样本图像均提取多个样本图像特征向量,并记录所述图像标识与所述多个样本图像特征向量的对应关系;对所述多张样本图像对应的全部样本图像特征向量进行聚类,得到预定个数的类别及与所述类别一一对应的聚类中心向量;建立长度为所述预定个数的哈希索引结构,所述哈希索引结构包括:类别、图像标识及图像标识出现次数;将所述全部样本图像特征向量插入所述哈希索引结构,得到所述索引信息。

9.根据权利要求8所述的图像识别方法,其中,将所述全部样本图像特征向量插入所述哈希索引结构,包括:对每个样本图像特征向量均执行如下操作以插入所述哈希索引结构:确定与待插入样本图像特征向量距离最近的聚类中心向量所对应的类别,并将该类别标记为所述待插入样本图像特征向量的类别;在所述哈希索引结构中查找所述待插入样本图像特征向量的类别的位置,并遍历所述待插入样本图像特征向量的类别下的所有图像标识;如果所述待插入样本图像特征向量对应的图像标识未存在于所述待插入样本图像特征向量的类别下,则添加新节点,其中,所述新节点的图像标识设置为所述待插入样本图像特征向量对应的图像标识,所述新节点的图像标识出现次数设置为1;如果所述待插入样本图像特征向量对应的图像标识存在于所述待插入样本图像特征向量的类别下,则将该图像标识对应的图像标识出现次数加1。

10.一种图像识别装置,包括:特征提取单元,用于对待识别图像进行特征提取,得到多个特征向量;第一确定单元,用于确定每个特征向量对应的类别;计算单元,用于针对所述每个特征向量,分别计算其所对应的类别下各样本图像的分数;累加单元,用于将计算得到的同一样本图像的分数累加,得到该同一样本图像的分值;第二确定单元,用于将分值最高的样本图像对应的图像标识作为所述待识别图像的识别结果;所述计算单元具体用于:按照以下公式计算样本图像的分数:其中,S表示当前样本图像的分数,A表示平均每个类别下的样本图像特征向量个数,B表示所述当前样本图像所属的类别下的所有图像标识出现次数之和,C表示所述当前样本图像所属的类别下,所述当前样本图像对应的图像标识出现次数,D表示放缩因子。

技术说明书图像识别方法和装置技术领域本技术的实施方式涉及图像识别技术领域,更具体地,本技术的实施方式涉及一种图像识别方法和装置。

背景技术本部分旨在为权利要求书中陈述的本技术的实施方式提供背景或上下文。

此处的描述不因为包括在本部分中就承认是现有技术。

随着智能技术的发展,图像识别的使用和需求也在迅速发展。

所谓的图像识别主要有:从图像中识别出目标物体,或者是识别出图像中的某个物体所属的类别等等。

可以将其理解为近似于人面对一副图像或者一个场景时,通过肉眼和大脑实现对图像或者场景中所出现的物品进行区分和辨别。

目前,常用的图像识别(这里主要指识别图像中的某个物体所属的类别)方法主要有以下几种:1)基于神经网络;2)基于Hu不变距特征搜索;3)基于SIFT特征点匹配搜索;4)基于Gabor 图像特征搜索。

然而,上述几种方式也存在不同程度的问题,具体的:1)基于神经网络,一般采用人工设计的图像特征算子作为输入,然而,目前人工设计的特征算子对某些图像的识别并不适用,例如硬币识别,而且神经网络多为浅层结构,难以学习到有效的高层抽象的特征。

2)基于Hu不变距特征搜索,一般利用物体的形状特征,但是有些不同类别的物体之间形状差异很小,因此Hu不变距特征搜索的方式难以有效地捕获上述物体的形状特征,难以实现有效识别。

3)基于SIFT特征点匹配搜索,对于纹理特征较多为刚性纹理特征(例如硬币上字的边角)的图像,提取出的有效SIFT特征点较少,且错误匹配现象严重。

4)基于Gabor图像特征搜索,表面凸起的物体,光线打上去不是整体变化,Gabor特征难以有效地捕捉物体图像的边缘信息。

技术内容如前所述,现有的图像识别技术对于某些图像难以有效捕获特征信息,进而难以实现对图像的有效识别,识别精度低。

有鉴于此,非常需要一种改进的图像识别方法,以有效提取图像特征,提高识别精度。

在本技术实施方式的第一方面中,提供了一种图像识别方法,包括:对待识别图像进行特征提取,得到多个特征向量;确定每个特征向量对应的类别;针对所述每个特征向量,分别计算其所对应的类别下各样本图像的分数;将计算得到的同一样本图像的分数累加,得到该同一样本图像的分值;将分值最高的样本图像对应的图像标识作为所述待识别图像的识别结果。

在本技术实施方式的第二方面中,提供了一种图像识别装置,包括:特征提取单元,用于对待识别图像进行特征提取,得到多个特征向量;第一确定单元,用于确定每个特征向量对应的类别;计算单元,用于针对所述每个特征向量,分别计算其所对应的类别下各样本图像的分数;累加单元,用于将计算得到的同一样本图像的分数累加,得到该同一样本图像的分值;第二确定单元,用于将分值最高的样本图像对应的图像标识作为所述待识别图像的识别结果。

通过本技术实施方式的图像识别方法和装置,有效提取多个特征来表征待识别图像,提取的特征不受图像中物体的特性所影响,能够实现对图像的有效识别,适用范围广;且通过计算样本图像分数的方式得到识别结果,综合考虑了特征的重要性,能够获得较好的识别精度。

附图说明通过参考附图阅读下文的详细描述,本技术示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。

在附图中,以示例性而非限制性的方式示出了本技术的若干实施方式,其中:图1示意性地示出了根据本技术实施方式的应用场景示意图;图2示意性地示出了根据本技术实施例的图像识别方法的流程图;图3示意性地示出了根据本技术实施例的样本图像信息的示意图;图4示意性地示出了根据本技术实施例的哈希索引结构的示意图;图5示意性地示出了根据本技术一实施例的图像识别装置的结构框图;图6示意性地示出了根据本技术另一实施例的图像识别装置的结构框图;在附图中,相同或对应的标号表示相同或对应的部分。

具体实施方式下面将参考若干示例性实施方式来描述本技术的原理和精神。

应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本技术,而并非以任何方式限制本技术的范围。

相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。

本领域技术技术人员知道,本技术的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。

因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。

根据本技术的实施方式,提出了一种图像识别方法和装置。

需要说明的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。

下面参考本技术的若干代表性实施方式,详细阐释本技术的原理和精神。

技术概述现有的图像识别技术对于某些图像难以有效捕获特征信息,进而难以实现对图像的有效识别,识别精度低。

为此,本技术提供了一种图像识别方法,通过该方法进行图像识别的过程可以包括:对待识别图像进行特征提取,得到多个特征向量;确定每个特征向量对应的类别;针对每个特征向量,分别计算其所对应的类别下各样本图像的分数;将计算得到的同一样本图像的分数累加,得到该同一样本图像的分值;将分值最高的样本图像对应的图像标识作为待识别图像的识别结果。

这样有效提取多个特征来表征待识别图像,提取的特征不受图像中物体的特性所影响,能够实现对图像的有效识别,适用范围广;且通过计算样本图像分数的方式得到识别结果,综合考虑了特征的重要性,能够获得较好的识别精度。

在本例中,图像标识可以是图像的名称、编号或者其他能够唯一标识该图像的信息。

相关主题