当前位置:文档之家› 基于内容的图像检索_累加直方图算法

基于内容的图像检索_累加直方图算法

基于容的图像检索——累加直方图算法摘要随着多媒体、网络技术的迅速发展,图像信息的应用日益广泛,对规模越来越大的图像数据库、可视信息进行有效的管理成为迫切需要解决的问题,灵活、高效、准确的图像检索策略是解决这一问题的关键技术之一。

因此,基于容的图像检索已成为国外学者研究的主要热点问题,并取得了不少的成果。

本文主要对当今热门的基于容的图像检索技术进行了研究,重点对它的算法进行研究。

在半年的时间里,通过查阅很多相关的资料,并认真学习了基于容的图像检索的基本理论,特别是深入研究了颜色直方图理论和累加直方图算法,最后在MATLAB平台下编程实现此系统,该系统可以实现基本图像检索的功能,根据用户输入的样本图像来与图像库中的图像进行特征匹配,然后找出与样本图像距离比较小的若干幅图像,并按照图像之间的距离由小到大的顺序显示给用户。

经过对该系统进行反复的调试运行后,该系统所实现的功能基本达到了设计目标,并且运行良好。

当用户提供出所要查询的关键图后,系统就可以从用户提供的图像库中检索到与关键图相似的图片并排序返回给用户,达到了预期效果。

关键词:图像检索累加直方图颜色特征 MATLAB目次1 绪论 (1)1.1 国外的研究现状 (1)1.2 选题意义及本文研究的容 (3)2 基于容的图像检索的简介 (4)2.1 基于容的图像检索技术的概述 (4)2.2 基于容的图像检索的关键技术 (5)3 基于容的图像检索原理和特点 (6)3.1 基于容的图像检索的原理及处理过程 (6)3.2 基于容图像检索的特点 (8)4 颜色特征理论 (8)4.1 颜色模型 (9)4.2 颜色特征提取 (10)5 直方图理论 (12)5.1 颜色直方图 (12)5.2 直方图的矩 (13)5.3 直方图均衡化算法 (14)5.4 基于直方图的图像检索技术分析 (14)6 累加直方图算法 (16)6.1 累加直方图 (16)6.2 算法实现 (18)6.3 改进的局部累加直方图算法 (18)6.4 算法总结 (19)6.5 实验结果 (19)7 系统的性能评价 (22)7.1 查全率和查准率 (22)7.2 排序评价方法 (23)结论 (24)致 (25)参考文献 (26)1 绪论随着多媒体技术和计算机网络的飞速发展,全球的数字图像的容量正以惊人的速度增长。

面对如此丰富且散布在世界围的海量图像资源,如何从海量的图像数据中高效、快速地检索出所需信息是当前许多应用领域所面临的重要问题。

传统的基于关键词、文本的图像检索技术的不足日益凸显,主要体现在仅用关键词对图像资源描述的局限性,这种基于个体对图像特征主观认识的描述方法不能充分描述图像资源;而基于容的图像检索技术(Content-Based Image Retrieval,CBIR)的研究就是在这种现实需要的前提下提出并展开的。

基于容的图像检索这一课题目前已是一个非常活跃的研究领域,其在数字图书馆、数据挖掘及多媒体视觉容检索等领域都起着十分重要的作用,在工业和科研领域具有广泛的应用性,例如医学研究机构的病理图像资料管理、公安机关的犯罪数据分析、气象局的卫星照片管理和网上时兴的电子购物等。

但是CBIR评价研究还处于起步阶段,评价方案和评价标准都处在探索之中,而特征维度较高、缺乏大规模的公用测试数据集等问题也给CBIR评价的研究工作带来了很大的困难和挑战。

本论文的研究工作就是在这样的情况下开展的。

1.1 国外的研究现状1.1.1 国的研究现状随着我国社会和经济的发展,使得从公共媒体到家庭娱乐,从自然科学到社会科学,每一个领域都渗透着对多媒体技术和因特网技术的应用,都要求对各种资料的智能化的管理。

随着我国国防科技和航天事业的快速发展,军事领域对图像检索技术也提出了更高的要求,大量的宇航图片和卫星图片的产生,要求高效率的管理和查找。

因此,在国不论是民用还是军用,都使图像检索技术的研究具有极为重要的应用价值。

在我国从上个世纪末至今,基于容的图像检索技术逐渐成为研究和应用的热点。

目前,我国的医药卫生领域,工业生产和机械制造加工领域,农业生产领域,国防科技领域,以及娱乐文化领域等都逐渐研究并应用这项技术。

在医学领域,利用基于容的图像检索技术对医学病理图像进行检索,辅助医生的诊断和治疗。

工业生产中,利用这项技术对加工的产品进行质量检测,在新研制的汽车维修和零件销售中,进行网上选购和订货。

农业生产中对农作物进行病虫害的监测和防治工作。

军事领域中,开发智能导弹自动选择目标实施攻击。

这些领域都是我国己经和正在发展及应用的实例[1]。

从目前究和应用的现状来看,基于容的图像家检索技术主要应用在专业图库中进行图像的检索。

如在商标图库中,在扫描得到的报纸库中,在农产品如烟叶图库中。

目前,市场上推出的基于图像容的检索系统软件虽然各有所长,但是始终不能尽如人意,而且针对海量数据的特点如何快速地进行图像的检索还需要解决。

1.1.2 国外的研究现状在国外,基于图像容的检索技术是随着数字图书馆的发展,而逐渐发展并成为一个研究热点。

1994年美国启动了持续四年的“数字图书馆”项目。

1998年,美国自然科学基金会,国防部高级研究计划署,国家航空航天局,国家医学图书馆,国会图书馆,国家人文科学基金会和联邦调查局联合自主第二期计划的的实施,掀起了全球性的数字图书馆研究热潮[2]在数字图书馆中,其中一个关键的问题是检索问题,集中在以下两个方面:一是解决目前Internet的信息检索问题,二是多媒体信息的检索。

因为图像属于一种视觉信息,所以图像检索问题在两个方面中都存在[3]。

IBM公司的QBIC系统可能是最著名的产品,它可以作为独立的软件产品使用,也可以作为IBM公司的数字图书馆的一个组成部分。

QBIC系统实现了基于颜色、纹理或形状的组合查询,以及文字关键字的查询。

查询接口方式实现了基于模板图像的查找,基于调色板的查找,基于草图的查找。

Virage公司的VIR图像工程系统也具有独立性及附属性,并且被应用于AltaVista的网络图片查询工具AV Photo Finder中。

Excalibur公司的Excalibur视觉检索产品是在公司长期研究的模式识别理论和数据库技术的基础上研制出来的,现已被成功地应用于Yaho上,即图像冲浪组件,实现了基于容的图像检索。

这些产品共同特征是:都是基于图像特征矢量的检索,数据库中的每一幅图像都由一个不超过500个元素的特征矢量描述。

特征矢量一旦产生,就永久性地存储下来,查询时的搜索只是基于特征矢量的查询。

特征矢量之间的欧氏距离作为相似性度量的准则,按照距离的大小给出查询结果[4]。

1.2 选题意义及本文研究的容1.2.1 课题的目的和意义随着Internet网络技术的不断发展,网络用户越来越多,网络已成为目前最重要的信息来源之一。

事实上,来自网络的信息量比任何一种渠道的信息量都要大。

所涉及的领域之广、更新速度之快和搜集成本之低也是其他任何手段无法比拟的。

网络将会改变人类的一切,这已不是谣言,而是一个不争的事实。

但是,网络的确是一个名副其实的“双刃剑”,利用好它可以发挥它无穷的威力;反之,就会给自己带来无穷的祸害,给国家带来巨大的损失。

从广义上讲,网络就是一个巨型数据库,人人都可以从中取到自己所需的东西。

利用搜索引擎合法的在网上搜索特定信息本身就是网络的建设目的之一。

目前,国外许多研究者正在研究基于网络的信息收集和检索技术。

特别是随着网络的普及,数据检索和收集显得越来越重要,已成为人们达到特定目的最有效的方法和手段之一。

随着图像处理、图像理解和模式识别研究的发展和深入,以及对人眼图像理解机制的深入研究,基于图像的搜索引擎得到了很大的发展,从传统的语义注释的图像检索到基于图像容的图像检索技术(CBIR,Content-Based Image Retrieval)发展,标志着图像检索技术根本性的变革。

CBIR技术是随着计算机视觉、图像理解与图像处理研究的进步而逐渐发展成熟的一种图像媒体检索技术。

1.2.2 研究的主要容本文主要讨论了基于颜色直方图的图像检索技术一些基本的理论知识,着重研究的是用累加直方图算法来实现一个系统,并用该系统达到实现图像检索的目的,还要给出对该系统性能评价的一般标准。

下面是本文的容介绍:本文第一部分简要介绍了基于容地图像检索技术的背景资料和研究发展状况,说明了研究该项技术的必要性。

第二部分说明基于容的图像检索的基本概念综述以及其关键技术。

第三部分讲述基于容的图像检索的原理工作过程和其特点。

第四和第五部分主要讲颜色特征理论和直方图理论,这是为后面的算法研究打下理论基础。

第六部分主要介绍累加直方图算法,这也是本文的最核心部分。

后面一个部分讲的是基于容的图像检索的评价标准。

最后结论部分介绍的是总结和图像检索的研究趋势。

2 基于容的图像检索的简介2.1 基于容的图像检索技术的概述基于容的图像检索涉及到图像处理、计算机视觉、模式识别以及神经网络等学科,同时也和人脑的认识程度紧密相关,这诸多因素使得基于容的图像检索的研究成为一项极富挑战性的课题。

本章从基于容的图像检索的基本原理、流程、关键技术、特点等多个方面对基于容的图像检索进行介绍和分析。

2.1.1 基于容的图像检索的基本概念所谓基于容的图像检索技术(Content-Based Image Retrieval,CBIR),它是指利用图像的颜色(灰度)、形状、纹理、语义等特征对图像进行查询,试图在理解图像容的基础上,检索出与示例相类似的图像。

这种检索不同于传统的检索,它用于检索的是反映媒体容并与媒体存储在一起的各种量化特征,使用的是基于相似性度量的示例查询(Query By Example)方法。

它区别于传统的检索手段,融合了图像理解技术、模式识别技术,从而可以为信息用户提供更加有效的检索手段。

2.1.2 基于容的图像检索的体系结构基于容的图像检索涉及了数据库管理、计算机视觉、图像处理、模式识别、信息检索和认知心理学等诸多学科。

目前图像检索系统的高性能还必须建立在人机交互的基础上,如图2.1为一种系统结构图[6]。

系统结构中有三个数据库。

原始图像数据库存储用于视觉显示的所有原始图像。

考虑到在图像检索过程中可能对图像的分辨率由不同要求,因此,需对图像进行预处理。

视觉特征数据库用来存储提取出的图像视觉特征,这是基于容的图像检索的必备信息,主要涉及计算机视觉和图像理解技术。

文本注释数据库包括图像的关键词和对图像自由描述的文本。

它是基于容的图像检索的必要补充,主要涉及文本信息检索和数据库管理技术。

多维索引模块是为了提高在大规模图像库中检索图像时的运行速度。

尽管目前大部分实验系统上未能采用这项技术,但它是未来高性能图像检索系统必不可少的部分。

相关主题