研究生课程考核试卷
(适用于课程论文、提交报告)
科目:数字图像处理教师:黄鸿
姓名:潘世强学号:20110802096 专业:仪器科学与技术类别:(学术)上课时间:2011年10月至2012年01月
考生成绩:
阅卷评语:
阅卷教师(签名)
重庆大学研究生院制
CHONGQING UNIVERSITY
数字图像处理
——基于内容的图像检索系统
学院:光电工程学院
姓名:潘世强
学号:20110802096
指导教师:黄鸿
时间: 2012年01月08日
基于内容的图像检索系统
摘要:随着多媒体技术的迅速发展,图像数据库也急剧膨胀起来,如何高效、快速地从像资源中获取有用的图像成了信息检索技术研究的热点。
本文主要针对基于内容的图像检索技术(CBIR)做了相关的介绍,对基于图像检索技术中的特征提取技术进行了较为详细的阐述,研究了图像颜色的提取方法,以及图像间相似性度量方法。
本文运用的特征值提取方法为颜色直方图的方法,对图像提取颜色特征,并根据这些特征对目标图片与图片库中的图片进行了相似度排序,最后运用Matlab软件对上述方法进行验证,得到图像检索结果,从而实现基于内容的图像检索。
关键词:直方图HIS彩色空间基于内容图像检索
1.引言
图像是对客观对象的一种相似性的、生动性的描述或写真。
或者说图像是客观对象的一种表示,它包含了被描述对象的有关信息。
它是人们最主要的信息源。
据统计,一个人获取的信息大约有75%来自视觉。
俗话说“百闻不如一见”,“一目了然”,都反映了图像在信息传递中的独特效果。
所谓基于图像内容检索,即从图像库中查找含有特定目标的图像,也包括从连续的视频图像中检索含有特定目标的视频片段。
它区别于传统的图像检索手段,融合了图像理解技术,从而可以提供更有效的检索手段。
本文主要针对基于内容的图像检索技术中的特征提取方法展开论述,简要地介绍了近年来基于内容的图像检索中颜色、纹理、形状及语义特征的描述方法,并对颜色特征的描述方法以及特征相似性做了详细的论述。
2.算法流程
本算法主要经过以下几个流程得以实现:
图2.1 主要算法流程图 2.1图片预处理
2.1.1色彩空间转换
在计算两幅图像的相似度时,通常要提取它们的颜色特征在特定的颜色空间进行比较。
颜色空间的目的是按照某种标准利用基色表示颜色,常用的有RGB 、HSI 、HSV 等。
RGB 颜色空间的相似不能代表颜色的相似。
例如,查询图像上RGB 颜色是(200,150,0),图像库图像的RGB 颜色是(200,200,0),这两幅图像在RGB 颜色空间上很相似,但在颜色上差别很大(黄色和绿色)。
HSI 和HSV 颜色空间则没有这个方面的问题,它们很适合人们肉眼的分辨,较好地反映人对颜色的感知和鉴别能力。
故在此采用HSI 颜色空间。
通过(2.1)~(2.3)公式,可以将图像从RGB 颜色空间转换到HSI 颜色空间。
()()()()()()()()()()()()⎪⎪⎩
⎪⎪⎨⎧>⎪⎪⎭⎫ ⎝⎛--+---+--≠≠⎪⎪⎭⎫ ⎝⎛--+---+-=G B B G B R G R G R B R G R B R G R B G B R G R G R B R G R H ,2arccos 2,2arccos π或 (2.1) ),,(),,(B G R MIN B G R MAX S -= (2.2)
3B
G
R
I +
+
= (2.3) 2.1.2统计直方图特征的提取
灰度级为[0,L-1]范围的数字图像的直方图是离散函数h(r)=n,其中n是图像中灰度级为r的像素个数[3]。
由于给定的图像数据库图像数量有651幅,且图像的大小不一,本次作业采用图像的统计直方图分布之间的欧氏距离的阈值约束,此阈值约束只是为了缩小图像的比对范围,并作为一个比对指标,待检索的图像与搜索图像间的欧式距离小于这个阈值时,就认为与待检索的图像是相似的。
在提取图像的统计直方图之前,先要对图像进行直方图均衡,把图像的灰度级扩展到整个灰度空间(unit8对应灰度级为:0-255),因为各幅图像的灰度分布可能相差比较大,如图1(a)和图2(b)所示,直接利用直方图进行图像检索的话,就只能对一些与被检索图像直方图一致的图像进行检索,这样就限制了基于直方图进行图像检索的图像范围。
直方图均衡化后,再进行归一化,在整个灰度空间来比对统计直方图分布可以减小阈值的设置,便于数据的处理,也为通过直方图进行图像检索提供了更为广泛的图像检索范围。
(a)图像初始直方图(b)直方图均衡的直方图(c)归一化后的直方图(d)统计直方图
图2.2 某图像的直方图
(a)图像初始直方图(b)直方图均衡的直方图(c)归一化后的直方图(d)统计直方图
图2.2 图像berlin (67).jpg的直方图
2.2图像检索算法
2.2.1图像匹配算法
如何用数值来有效地表示图像在颜色上的相似程度,是直接影响检索效果的重要环节,好的相似性度量方法不仅要求结果精确而且速度要快。
由于提取的图像特征绝大多数都可以表示成向量形式,因此常用的相似性度量方法是基于向量模型的,也就是将图像特征看成是向量空间中的点,通过计算点与点之间的距离来描述图像特征之间的相似度。
基于内容的图像的检索因为图像的颜色、纹理和形状等特征提取受众多因素的影响,达不到精确匹配,只能进行这些特征之间的相似度计算进行模糊匹配。
如果满足一定条件时,我们就可以说这两图像相似,放入检索结果中。
本作业基于城区(city-block )距离计算两图像的差异。
公式如下:
21(,)n
i i
i L A B a b ==-∑ (2.4)
2.2.2差异度排序
由于图像大小有异,为使图像能得到有意义的排序,将此距离计算为差异度。
差异度越小,图像与源像越相似。
具体算法为:
①设定两阈值:t1=0.01,t2=0.9;
②得到两图像差值的百分比:Ω=L/A ; ③得到差异度:212
L diff N ⨯Ω=; 2.3显示
最终,利用GUI ,将所得到的图像按差异度升序排列,并显示前十幅。
3.实验及结果分析
为了验证算法的有效性, 在PC 机上进行实验仿真验证,其中运行环境为
Windows 7操作系统,系统配置为Core2 Duo 2.30GHz CPU,1.99GB内存,仿真平台为Matlab 7.6。
实验中,在一个包含100幅各类图像的综合图像数据库中进行检索,图像大小均为250×195左右。
库中包含了各类常见的图像,人物、花草、建筑、动物等,每类几乎等幅相关图片。
(1)开始界面
图3.1 开始界面
(2)检索过程
①载入匹配图像
图3.2 载入源图像(1)
图3.3 载入源图像(2)②载入检索图像库
图3.4 载入图像库(1)③图像检索结果
图3.5 载入图像库(2)
4.结论
单从图像的统计直方图特征对图像进行检索,虽然解决了图像大小不一带来的困难,但是难以符合人们的视觉习惯。
因此,可以结合其他的图像特征进行图像检索,此时的统计直方图的阈值应该选的大些,以保障有一定量的图像被选择。
但是不同的图像特征之间往往差异较大,比如直方图和颜色空间的信息,这将给图像各个特征的联合检索图像带来困难。
因此,可以考虑差异较小的图像特征联合检索图像,比如直方图和图像的纹理特征或者几何特征相结合来检索图像。
参考文献
[1] 陈世文,高燕.基于内容的图像检索[M].中小企业管理与科技.2008.
[2] 基于HSI颜色空间统计直方图的图像检索.百度文库.08-07-2010.
[3] 唐晓静,张明. 几种基于内容图像检索匹配算法的比较研究.Computer
Knowledge and Technology.,pp.1969-1971.V ol.6,No.8,March 2010.
[4] 程秀峰,祝颂,夏立新.基于分布式的直方图检索方法研究及实现.现代图书情
报技术.第205期.2011.
[5] 君顶,原芳.基于内容的图像检索技术. 计算机系统应用.2011.第20卷,第8期。
[6] 金莲芳,覃团发,王海霞,等.基于结构量化直方图的图像检索方法.中国图像图
形学报,2006,11(2):180−185.
[7] Basu S, Banerjee A, Mooney RJ.2004.Active semi-supervision for pairwise
constrained clustering. In SDM '04: Proceedings of the 2004 SIAM International Conference on Data Mining, Florida, 333-344.
[8] 高如如.基于内容的图像检索技术研究[D],中国科学技术大学,2011:1-2.
[9] Rafael C.Gonzalez,Digital Image Processing.电子工业出版社,2007:72-81.。