Research on Image Mining-Concepts and ApplicationDing Chong Fan Jun Luan TianAbstract:Image mining is an emergng field in data mining.Along with the wild use of large scale digital photo tech -nology,it becomes more and more important to devise powerful tools for analyzing tremendous image data and grasping the contents inside.But there is a large gap between traditional data mining and image mining in data formation and content,and the methods and algorithms are also different.In this paper,we focus on illustrating basic concepts and re -cent applications issues on image mining and the frameworks are reviewed,and then related technologies such as pat -tern recognition and image processing are discussed.At last,applications of such techniques as satellite photo,medical X-rays,and bio-photomicrography are introduced.Key words:data mining;pattern recognition;image processing作者简介:丁冲,1983年生,吉林长春人,南京大学商学院在读硕士,研究方向为电子商务、数据挖掘。
范钧,1983年生,河北保定人,西南财经大学在读硕士,研究方向为人力资源管理。
栾添,1983年生,吉林长春人,东北师范大学在读硕士,研究方向为动物学。
图像数据挖掘相关研究综述—概念和应用丁冲范钧栾添摘要:图像挖掘是数据挖掘领域中新兴的领域。
随着数字照相技术的发展和在多学科中的广泛应用,对大量图像数据的分析和研究越来越重要。
由于图像挖掘的对象、内容不同于传统数据,方法上也不同于传统技术。
本文旨在介绍图像挖掘的基本概念和体系以及国际上最新的研究成果。
本文回顾了图像挖掘的相关问题及建模框架,并与模式识别、图像处理等相关领域进行了比较,在此基础上,还介绍了近年来图像挖掘领域在卫星遥感、医学影像和生物显微照片研究的相关应用。
关键词:数据挖掘;模式识别;图像处理1引言图像获取和存贮技术的发展带来了大规模精细图像数据库的产生。
通过诸如卫星照片、医学照片和数字照相机等设备,获得了大量的图像数据。
图像挖掘由于它潜在的巨大价值而受到广泛关注,对于那些能够自动提取语义信息(知识)的图像挖掘系统的需求与日俱增。
然而时至今日,人们所掌握的技术还很难对这过于巨大的数据加以利用。
Hsu,Lee 和Zhang [1]的一篇综述性文章指出,这一领域中最基本的问题在于,需要对原始的象素图像和图像序列分析到何种精确程度,才能有效的获取复杂的空间目标以及它们之间的关系。
换句话说,图像挖掘(Image mining ,简称IM )研究的对象是隐含的知识,图像数据的间接关系,或者其他那些没有被明确地存贮于图像数据中的模式,因此需要对其进行有效的取舍。
2相关概念和问题2.1数据挖掘与图像挖掘由于图像数据库和传统的关系型数据库存在巨大差异,导致了很多现有的数据挖掘(Data Mining )技术无法应用在IM 领域。
第一,在关系数据库中,数据值在语义上是有意第12期(总第111期)2008年12月No.12(Series No.111)Dec2008统计教育Statistical Thinktank第12期义的,例如年龄值35,这是容易理解的。
然而在图像数据库中,如同灰度值为46这种信息,没有背景资料的支持就难以理解。
第二,图像中包含的空间信息对研究图像内容至关重要,但在关系数据库中却并非如此。
比如,为了识别出图像中的某一特别形状或模式,必须考虑位相近位置上的一系列象素点,而在关系数据库中,数据挖掘更关注的是某一条记录的特征,而不是它跟上一条记录或下一条记录之间的关系。
所以,为了在图像挖掘中使用数据挖掘的方法,挖掘器的首要工作是从图像中提取不依赖于位置属性的特征,之后再挖掘有用模式。
第三,传统的DM关联算法无法使用图像问题,所以针对挖掘图像中的有价值模式需要开发新的算法。
2.2图像挖掘和其他相关领域的区别图像挖掘技术关注于整合数据挖掘和图像处理技术帮助分析和理解图像丰富领域中的问题。
它是机器视觉(computer vision)、图像处理、图像检索(image retrieval)、数据挖掘、机器学习、数据库和人工智能领域的交叉学科。
由于上述很多领域本身也并不成熟,使得图像挖掘本身仅在发展和实验阶段。
图像挖掘不同于底层的机器视觉和图像处理技术,其目的是抽取大量图像集合中的模式(pattern),而机器视觉和图像处理技术则关注于图片的特定特征。
图像挖掘和基于内容的图像检索似乎有点重叠(两者都要处理大量图片),但IM的目标是结合相关文本数据等知识探索图像模式,而超越了检索的范畴。
把图像挖掘看成模式识别的分支也不合适。
诚然,两个领域有很多重合,如特征抽取等等,但基础的假设确不相同。
在模式识别中,目标是识别出一些特定的模式;而IM则是要在没有先验知识的情况下归纳出显著性的模式。
另外一个关键不同是两个领域检验的模式种类差异。
模式识别主要做分类模式(clas-sification patterns)。
IM的模式则更加多样化,可以是分类模式、描述性模式(description patterns)、关系模式、时间模式和空间模式……最后,模式识别只关注模式生成和模式分析,而这在IM中只是重要的一部分[1]。
2.3图像挖掘和视频挖掘[2]图像挖掘和视频挖掘都来源于一般的数据挖掘并且都包括知识提取和智能搜索的方法,两者都是多媒体挖掘的子领域。
在视频方面,我们并不直接考虑声音或文字数据与视频数据的复合问题,而在图像处理问题上往往要把图片与背景信息结合考虑。
图像和视频挖掘与其他多媒体挖掘(如文字、语言、音频)技术所用的手段有着本质的不同,更加复杂。
视频挖掘有时候被看作是动态化的图像挖掘,然而,视频中包含的其他数据-音频和文字,并不是图像挖掘所考虑的。
3图像挖掘的框架性描述图1说明了IM的过程。
首先要对图像数据库进行预处理以提高质量,之后进行各种变换和特征抽取以生成图像的重要特征。
生成特征后,可以由数据挖掘技术发现显著性模式。
这些模式再进一步转化为可以实际应用的最终知识。
Perner[3]将图像挖掘过程分为两种。
第一种是bottom-up,应用图像处理、分类和特征测量等一系列方法,最后达到分类的目的。
然而,这些数量方法经常是难以解释的(黑箱)。
第二种方法是基于专家给出的图片符号性描述[4]。
图像的关键属性由专家选出,并由专家确定是整张图片还是其中的某些部分。
专家可以在标记出来的区域里计算一些图像特征(目标轮廓、面积、直径、形状或者材质特征)。
把专家估计出的或实际计算出的图片特征值记入特征数据库中。
当专家评估的图片到达一定数量之后,就可以利用相应的挖掘工具建立模型了。
图片特征统计上的特征,这是最低层次的提取;从低层次的特征和它们的统计特征,如区域、斑点、带状物、边缘和线,这些都是次高的提取层次;从低层次的特征可以得到高层次或符号特征;最后通过专家的符号行描述,得到最高层的特征。
信息可以划分为4个层次:最底层的象素级别。
这一级别包括诸如图像象素和主要图像特征(颜色、材质及形状)的原始图像信息;目标层次,基于ImagedatabasepreprocessingTransformation&feature extractionMiningInterpretation andevaluationKnowledge图1图像挖掘过程丁冲等:图像数据挖掘相关研究综述—概念和应用92008年象素层次的特征处理目标物或目标区域信息。
结合该领域知识的聚类算法可能在这里得到有效的结果;语义层次,对目标物或区域在一定的背景下进行识别。
高层次的推理和知识发现技术在此用来生成高等级的语义概念并且探索兴趣模式;模式和知识层次。
整合了从图像数据中发现的相关文字资料和语义关系。
进一步的挖掘工作将针对于发现文字资料和图像模式之间的相关性。
这种相关性将对现实世界的相关领域非常有用。
4图像挖掘相关技术现有领域的技术可以帮助解决IM的问题,这些技术包括目标识别,图像索引和检索,图像分类和聚类,关联规则挖掘以及神经网络。
下面讨论这些技术的应用。
4.1目标识别(Object Recognition)通过先验知识概括的目标模型(object models)的使用,目标识别系统可以从图像中找到知识。
这是IM的主要任务之一。
自动机器学习和智能信息提取只能在那些目标可以被计算机明确辨别出来的情况下实现。
一个目标识别系统由4部分组成,包括模型数据库,特征探测器,hypothesizer和hypothesis verifier。
模型数据库包含所有系统已知的模型,这些模型概括了目标的重要特征。
探测器主要针对象素层面,hypothesizer标识出图像中出现目标的似然性(like-lihood)。
Verifier使用模型来验证假设并改进目标的似然性。
最后,系统选择具有最高似然性的目标作为正确目标。
4.2信息检索(Image retrieval)IM要求图像能够按照一定准则被检索。
这些准则可以被归纳为三个复杂性递增的类[5]:(1)包含颜色、材质、形状或者空间位置等特征,比如“检索那些右上角有红色长条形状的图片”;(2)包括能够检给定的种类或个体,人的逻辑特征,比如“检索内容包含桌子的图片”或,“检索Jimmy的图片”;(3)通过提炼的属性检索,包括目标或场景的高级因果关系,比如“检索足球比赛的图片”。
Kazman和Kominek[6]提出了图像检索的三种查询方式:关联属性查询,描述查询,图像内容查询。
通过关联属性查询实最简单的,通过输入的文本找到相关图像信息,找到的图片应比较符合查询所要求的属性。