当前位置:文档之家› 基于内容的图像检索原理及方法应用

基于内容的图像检索原理及方法应用


较 , 在有噪声情况下检索效果较好 。公式为 :
d2hist ( X , Y) = ( X1 - Y2) 2 + ( X2 - Y2) 2 + … + ( Xn - Yn) 2
= ( X - Y) T ( X - Y)
考虑到颜色分布的不均匀性 , 引入相关权值 N 3 N 维 矩阵 A , A = [αij ] , 权重αij表示颜色 i 和颜色 j 间相似程 度 。此时公式改为 :
ip (i) /ω1 (t)
t Φi Φm- 1
μ = ω0 (t)μ0 (t) +ω1 (t)μ1 (t)
此时有图像最佳阈值 g 的公式为 :
g
=
Arg
Max
0 Φt Φm-
[ω0
1
(t)
(μ0
(t)
- μ) 2
+ω1 (t) (μ1 (t)
- μ) 2 ]
2 基于颜色的图像检索方法
由于颜色的特征与图像尺寸无关 , 所以颜色特征具有 旋转不变性和尺寸不变性 , 即图像颜色特征与图像尺寸和 图像对象位置无关 。在利用颜色的图像检索中 , 可用颜色 直方图[2 ]表示图像整体颜色分布特征 。利用颜色直方图向 量构造图像颜色特征索引记录 , 同时在检索时用户将其绘 制的颜色分布图或引用的检索范围按同种方法转换为相应 的颜色直方图 。利用颜色直方图匹配算法计算检索图和目 标图的相似度 , 满足一定阈值要求即可认为符合检索需 求。 211 如何建立颜色直方图
d2hist ( X , Y) = ( X - Y) TA ( X - Y) 21214 利用矩 (moment) 的优势特征算法[8 ] 设颜色频
道的一阶矩 E , 二阶矩 J 和三阶矩 S 分别代表颜色频道的
平均 值 ( average ) , 方 差 ( variance ) 和 倾 斜 度 ( skew2
但如果被检索图像与目标图像颜色分布不是完全一致而是
略有偏差 , 则检索结果存在较大模糊性 , 即便提高阈值也
仅仅能代表颜色数值相似而非实际颜色分布相似 。
21213 欧基里德距离 ( Euclidean Distance) 公式算法[7 ]
利用欧基里德距离公式对两个 N 维直方图 X , Y 图像的比
根据交集的值选出最佳方案 。直方图交集算法公式如下 :
N
∑min{X(i ,j ,k) , Y(i ,j ,k) }
D ( X , Y) = i ,j ,k
N
∑X(i ,j ,k)
i ,j ,k
其中 X 和 Y 分别表示检索图 (库图) 与目标图 , D
( X , Y) 为两幅图像的匹配值 。D ( X , Y) ∈ (0 , 1) 它
D (M ,N) = w1 ( Rm - Rn) 2 + w2 ( Gm - Gn) 2 + w3 (Bm - Bn) 2
其中 w1 、w2 和 w3 为加权系数 , 根据人眼睛对 R GB 三原
色的敏感程度取值 。
此时将待检索图像上所有像素的色度空间值 (也称颜
色频道 colorchannel) 分布以横坐标形式表示 , 将图像中
(X , Y) 称距离函数 , 0 ≤d ( X , Y) ≤2N 。当 d ( X , Y)
= 0 时 , 认为 X 和 Y 完全相同 ; d ( X , Y) = 2N 时 , X
和 Y 完全不同 ; 当 d ( X , Y) 小于某个阈值时可认为 X
和 Y 足够相似 。Ll2metric 算法的优点是比较过程简单 ,
设 b (i , j) 为 M 3 N 图像 (i , j) 点处的灰度值 , 灰 度级为 m , 设 b (i , j) 取值 [ 0 , m - 1 ] , p ( k) 是灰度 值为 k 的频率 , 则 :
∑ p (k)
=
1 MN
b
(i
,j)
1
设以灰度值 t 为阈值分割出背景与物分别为 {b (i , j) >
t} 和 {b (i , j) ≤t} 。
物体部分比例 :
∑ ω0 (t) = p (i) 0 Φi Φt
背景部分比例 :
— 164 —
物体均值 :
∑ ω0 (t) =
p (i)
t Φi Φm- 1
∑ μ0 (t) =
ip (i) /ω:
总均值 :
∑ μ1 (t) =
幅图像的比较很细 , 在有噪声情况下这种算法易产生错误
的结果 。
21212 Ll2metric 算法 (Swain , bsllard , 1991)
n
∑ d ( X , Y) = | Xi - Yi | i=1
X 和 Y 分别表示检索图 (库图) 与目标图 , Xi 和 Yi
分别表示落入第 i 个颜色频道的 X 和 Y 中像素个数 , d
可利用 Otsu 法先将图像物体与背景分离出来 , 将图像以 g
(f) 颜色直方图表示出来与同样方法生成的目标图像的颜
色直方图加以比较 , 在满足一定阈值的情况下得到检索结
果。
21211 基于直方图交集的算法 ( Swain) [5 ] 直方图交集
算法是将目标图像的颜色直方图与库图的直方图取交集 ,
1 图像阈值的选取
在进行图像检索前 , 可选取一定的阈值使图像背景与 物体最佳分离 。图像阈值自动选取方法中简单适用 、自适
应性强且具有代表性的方法有大津算法 (最大类间方差
法 , Otsu , 1979) [1 ] 。其原理是图像物体部分与背景部分 灰度分布方差越大 , 图像物体与背景分离准确性越大 。 Otsu 方法公式如下 :
首先要将图像进行数字化处理 , 用色度空间[3 ]描述图 像颜色分布 (使用具有特定意义的一组二进制数表示一个 像素 , 进而将整个图像以若干组二进制数表示 , 以利于计 算机处理) 。可采用 HSB 色度空间 3 种元素表示每个像素 的颜色组合 。这样就可以用 3 组二进制代码表示 HSB 色 度空间值 , 来描述一个像素 。也可采用多媒体技术中常用 的 R GB 色度空间 ( R , 红 ; G , 绿 ; B , 蓝) 表示一个像 素 。用 3 组二进制代码分别表示 R GB 的强度 , 从而使一 个像素也可用 3 组二进制代码表示 。
ness) , 以这些颜色频道分布的特征值来表示颜色频道 ,
用于检索图像 。公式如下 :
N
∑ D (X , Y) = (Wi1 | XEi - YEi | + Wi2 | XJi - YJi | + Wi3 | XSi - YSi | ) i=1
式中 Ei , Ji , Si 分别表示图像颜色频道的一阶矩 、二
阶矩 、三阶矩 ; Wi1 , Wi2 , Wi3 为用户定义 的 权 重 ; N
为颜色频道数目 。Ei , Ji , Si 公式表示如下 :
∑ ∑ N
Ei
=
1 N
Pij Ji
j=1
=
N
1 N
j=1
( ( Pij
-
Ei)
2)
1 2
N
∑ Si
=
1 N
j=1
( ( Pij
-
Ei)
3)
1 3
Pij 代表图像第 i 个颜色频道中第 j 个像素 。
以 R GB 色度空间为例说明图像量化过程 : 设色度空 间中每个点都可用向量表示 :
·第 24 卷 2001 年第 3 期·
ITA
! 理论与探索 #
X = [ Rx GxBx ]2 两种颜色 M 和 N 的相似度可以用色彩距离 D ( M , N) 表示 :
D (M ,N) = ( Rm - Rn) 2 + ( Gm - Gn) 2 + (Bm - Bn) 2 考虑到 R GB 色度空间不一定是均匀性线性空间[4 ] , 按距离最短颜色最接近分类检索结果与预期结果相差很 大 。于是可在 R GB 色度空间中采用加权范数补偿其非均 匀性 , 此时上式变为 :
集算法作了一定程度的改进 :
∑ D ( X , Y) =
N
min ( Xi , Yi)
n
i=1
∑Xi
i=1
N 是颜色频道数 , Xi , Yi 分别是图像 X , Y 中属于颜
色频道 N 的像素数 , 通过像素总和的比值来确定图像间
的相似度 。再利用颜色频道间距优化算法 (Niblack 等人 ,
所有像素落入特定颜色频道的值以纵坐标形式表示 。设图
像 X 由 H 级颜色频道组成 , 第 i 种颜色 hi (i = 1 , 2 , …, H) , 落入颜色频道 hi 的像素数量为 gi , 则 G ( g1 , g2 , …, gH) 向量组即为颜色直方图 。
212 基于颜色检索的匹配算法
一幅待检索图像 F (M , N) 利用颜色直方图检索时 ,
! 理论与探索 #
ITA
●李 勇 (安徽财贸学院经济信息管理系 安徽 233041)
基于内容的图像检索原理及方法应用
Abstract : The paper mainly deals wit h t he basic concept , characteristics and met hods of t he color and shape2 based image retrieval. It gives several quantization algorit hms for image retrieval. At t he same time , Otsu met hod t hat selects t he image t hreshold automatically and a new met hod using information entropy are described.
相关主题