西安电子科技大学硕士学位论文基于GIS的空间数据挖掘方法研究姓名:葛登科申请学位级别:硕士专业:情报学指导教师:王亚民20100101摘要摘要空间数据挖掘是从空间数据库中发现隐含知识、空间关系或者其它模式的过程,是数据挖掘的一个重要研究方向。地理信息系统(GIS)是一种以空间数据库为中心,为地理研究和地理决策提供服务的计算机系统。将数据挖掘与知识发现的概念、模式和方法引入地理信息系统,充分利用GIS存储、管理和分析空间数据的功能,将空间数据挖掘技术与GIS相结合,使GIS中的有限数据变为无限的知识,对于有效的处理海量的地学数据、提高地理信息系统的智能化水平、为全球与区域地学分析提供有力的工具具有重要意义。本文研究了基于GIS的空间数据挖掘,致力于寻找从GIS中发现知识的有效途径。在本文中,首先介绍了空间数据挖掘和地理信息系统的背景与现状。其次,分别介绍了空间数据挖掘的概念、方法和应用与地理信息系统的定义、功能和发展方向。最后,针对空间数据挖掘的特点,结合地理信息系统的多种功能,在充分发挥两者的优点的前提下,提出了一种基于GIS的空间数据挖掘模型,并且在空间数据挖掘模型的体系结构下,结合关联规则挖掘算法与聚类算法,提出了从GIS中发现空间关联规则与聚类的方法。在上述研究的基础上,对提出的空间关联规则挖掘方法与空间聚类方法进行了实验验证,通过一个具体的地理数据实例以及一个模拟实验测试并验证了这两种方法的有效性和可行性。
关键词:空间数据挖掘地理信息系统聚类关联规则概念格AbstractAbstractSpmiMDataMining(SDM),animportantbranchofDataMining,referstoextractionofimplicitknowledge,spatialrelationships,andotherpatternswhicharenotexplicitly
storedinSpatialDatabase.GeographicInformationSystem(OIS)isasystembasedon
GeospatialDatabaseforgeographicdecisionsupport.IntroducingtheconcepLpattern
andmethodofDMandKDDintothefieldof
GIS,wecanusethestoragemanagement
andanalysisfunctionofGIStomakethelimiteddatainGISbecomethelimitless
knowledge.FordoingSO,weCalleffectivelyhandlethehugedata,advancethe
autoimmunizationandintelligencelevelofthegeography
data
analysisand
offer
powerfulanalysistoolsfortheglobechange
andsustainabledevelopment.
Tllispaperresearchesthespatialdataminingbased
onGIS,commitstoseekan
effectiveway
todiscoverknowledgefrom
GIS.Beginningwitlltheintroductionofthe
backgroundofSDMandGIS,thepaperintroducestheconcept,methodsand
applicationsofspatial
dataIIliIlingandthedefinition,functionand
development
directionofgeographicinformationsystems.Combiningwiththecharacteristicsof
spatialdataminingandthefunctionsofgeographicinformationsystems,thepaper
presentsaGIS—basedspatialdataminingmodel,whichgivesfullplaytotheadvantages
ofbotIlthem.Andbasedonthemodel,themethodsofdiscoveringspatial
association
rulesandclustering
fromGISarepresented.
BasedOiltheabove-mentionedstudy,aspecificinstanceofgeographical
dataand
a
simulationtestareprovidedtoverifytheeffectivenessofthesetwomethods.
Keywords:SpatialDataMiningGeographicInformationSystemClustering
AssociationRuleConceptlattice声明西安电子科技大学学位论文独创性(或创新性)声明
秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切的法律责任。本人躲麟
日期型!尘鉴
西安电子科技大学关于论文使用授权的说明
本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后结合学位论文研究课题再攥写的文章一律署名单位为西安电子科技大学。(保密的论文在解密后遵守此规定)
本人签名:导师签名:日期鲨[!。f:尘
日期丝丝:[:丝=-第一章绪论第一章绪论1.1课题背景及研究意义现代数据采集技术和计算机网络等技术的迅速发展,使得人们采集、存储和处理数据的能力大大提高,积累的数据资源越来越丰富。但是快速增长的海量数据已经远远超出了人们的分析能力,人们无法充分地挖掘和利用数据中蕴含的巨大价值,迫切需要一种能够从大量数据中发现有用信息和知识的技术方法。面对“数据过量而知识贫乏’’的窘境,如何从数据中提取信息,如何把数据转化为有用的知识,已经成为国际上研究和应用的热点。空间数据是人们认识自然和发展社会经济的重要数据。日常生活中人们接触和利用的数据,大部分与地理位置和属性及其空间分布有关。随着各种先进数据采集技术的应用、数据获取手段的更新和提高以及计算机、网络、全球定位系统、遥感、地理信息系统等技术的发展,空间数据呈现出爆炸式的增长,其膨胀速度远远超出了常规的事务型数据。每时每刻,现代技术设备都采集和生产新的空间数据,同时也在存储和积累数据。面对浩瀚的空间数据,人们已经没有能力完全处理和利用它们,只能完成数据到信息的过程,没有实现从信息到知识的过程。因此,在过量的空间数据面前,空间知识显得相当贫乏,人们缺乏有效的技术手段将大量空间数据转化为有用的信息和知识。正是在这样的背景下,空间数据挖掘作为数据挖掘的一个重要分支应运而生。空间数据挖掘(SpatialDataMining,SDM)是一种知识决策支持技术,重在从数据中挖取未知却有用的最终可理解的知识,提供给空间决策支持系统。空间决策所用的知识从空间数据挖掘而来,最终服务于数据利用,目的是帮助人们最大限度地利用数据,提高决策的准确性和可靠性。它应用于空间数据的理解、空间和非空间数据关系发现、空间知识库构造、空间数据库的查询优化。作为一种知识决策支持技术,SDM在GIS、遥感、导航、交通控制、环境研究等涉及空间数据的系统中有着广泛的应用。空间数据挖掘是从空间数据库中发现知识。随着地理信息系统和遥感等地理信息技术的不断发展,使空间数据的存储、检索、查询、制图等功能越来越完善,空间数据库有了极大发展,数据以指数级方式不断增长。但是,目前的空间数据库都无法发现隐藏在数据背后的关系、规则和发展趋势等知识,作为空间数据库发展的主体,迫切需要推动GIS数据库从数据库型转入分析型阶段。作为一个管理空间数据的系统,GIS本身就是空间数据分析技术的重要组成部分和平台。GIS的空间分析能够对地理数据的空间分布、空间形态和空间关系进行精确地分析。