创先职称论文发表网
www.lunwen1998.com
时空关联性分析方法研究与应用
摘要:随着信息技术、通讯技术、数字存储技术和高速数据获取技术的迅猛发展,在交通、
电力、物流、环境监控、工业生产等领域积累了大量与时间和地理空间相关的数据资源,可
这些随时随地获取的、呈爆炸性增长的数据资源在给我们带来丰富信息的同时,“数据越丰
富,知识越贫乏”的问题则日益突出。近年来,越来越多的学者认识到,通过研究空间对象
随时间的变化规律,发现数据的时空关联规则,分析数据的时空变化趋势并预测未来的时空
状态,对于规划建设、指挥调度、应急管理、信息服务等具有重要的应用价值。本文研究的
目的是面向智能交通领域,在时空关联性分析基础上,利用时空关联规则挖掘方法获取含时
空约束的关联规则,从而进行交通拥堵趋势分析,为道路导航、趋势查询、交通控制等提供
辅助决策信息。时空关联性分析是研究空间对象随时间的变化规律,反映时空数据在时间和
空间上的关联性,时空关联规则挖掘作为时空关联性分析的主要方法之一,目前已有不少学
者对其进行了研究或应用。本文详细介绍了时空关联规则挖掘的研究现状,通过分析现有时
空关联规则算法在同时考虑时间和空间约束方面的不足,实现了一种新的时空关联规则挖掘
方法。文中首先对时空数据进行空间关联性分析和时间段划分形成事务表,然后对空间关联
的项集进行连接并产生时空关联规则。在算法执行过程中,对关联规则挖掘相关的阈值进行
了分析,使挖掘所得的结果能更好的满足用户的需求。算法分析和实验对比表明,同时考虑
时间和空间约束,能够在分析过程中及时过滤不相关的数据,提高时空关联规则的获取效率,
能够有效地发现时空关联规则。在理论研究的基础上,本文设计并实现了一个基于时空关联
规则分析交通拥堵趋势的原型系统,可有效地实现时空关联性分析和结果的可视化。
关 键 词:时空关联性分析,时空关联规则,可视化,阈值分析,交通拥堵
时空关联性分析绪论
当前像气象预报、环境监测和交通控制等领域,在问题的求解过程中越来越需要同时
考虑时间和空间因素,而时空关联性分析的目标就是明确时空数据的时间有效性和空间可达
性,从而在时间和空间上进行有效的趋势分析和预测。时空关联规则挖掘作为时空关联性分
析的主要方法之一,将作为本文研究的重点,用时空关联规则挖掘方法来分析含时间和空间
约束的时空关联性,从而进行趋势分析与预测。本章首先阐述了时空关联规则的研究背景,
并介绍了国内外学者和研究人员在时空关联规则挖掘方面所做出的贡献,最后结合当前的研
究进展和成果描述本文所做出的工作和研究,并在本章的最后给出了论文的组织结构。
时空关联性研究背景及意义
随着各个领域数据数量的急剧增长,对从海量数据中发现有用的信息和知识的需求越
来越迫切,而这一需求导致了数据挖掘技术的出现和发展。数据挖掘的广义观点是:数据挖
掘是从存放在数据库、数据仓库或其他信息库中的大量数据中发现有趣知识的过程。它采用
机器学习、统计学、模式识别和数据可视化等技术,从数据中发现知识、规律或高层信息,
并且可以使用户从不同角度观察或浏览它们,并将这些获得的知识或信息用于辅助决策、过
程控制、信息管理和查询处理。随着空间数据采集、存储和处理等现代技术设备的迅速发展,
积累了大量的城市电子地图数据库、城市规划道路网络数据库、用地现状数据库、地籍数据
库等空间基础数据。为了解决“空间数据海量而知识贫乏”的瓶颈问题空间数据挖掘应运而生。
与一般数据相比,空间数据具有空间性、时间性、多维性、海量性、复杂性、不确定性等特
点,由此决定了空间数据挖掘需要克服更多的技术难关。李德仁教授在1994年于加拿大渥
太华举行的GIS(Geographic Information System,地理信息系统)国际学术会议上,
首次提出了从GIS数据库中发现知识(Knowledge Discovery from GIS, 简称KDG)的
创先职称论文发表网
www.lunwen1998.com
概念,并且系统分析了空间知识发现的特点和使用的方法,认为空间数据挖掘能够把GIS
有限的数据变成无限的知识,从而精炼和更新GIS数据,促使GIS成为智能化的信息系统
率先从GIS空间数据中发现了用于指导GIS空间分析的知识。自进入21世纪以来,伴随
着“智慧地球”、“物联网”等策略的提出和实施,我们进入了以数据挖掘为技术支持、以网络
为运作基础的知识信息化管理时代。
在未来20年的信息社会中,人类将处于一个能够感受其存在、感知其行为、识别并响
应个体需求的智能化电子环境,这样的智能环境将在很大程度上依赖于由各传感器和服务设
施发出的数据流,以监控人类生活和工作的环境,为用户提供有效的数据访问和信息服务,
这种全新的需求孕育并诞生了场景感知的数据管理,而时间和地点是两类研究最多的场景元
素。随着时间地理信息系统(Temporal Geographic Information System,TGIS)、卫星
定位技术、遥感技术的发展,数据挖掘技术逐步从平面转变到立体,形成了时空数据挖掘方
法,通过研究空间对象随时间的变化规律,发现时空演变中隐含的知识,从而为智能交通系
统、基于位置的服务等提供有效的决策支持。早期的时空数据挖掘大多都是在空间数据挖掘
基础上展开的,而大多数空间数据挖掘研究只是针对空间对象的空间特征,不考虑时间特征,
但是越来越多的应用领域在问题的分析过程中需要同时考虑时间和空间因素两因素,例如智
能交通管理、指挥调度、应急管理等。空间现象随时间动态变化,所以只有将时间纳入空间
系统中,研究空间数据随时间变化的规律,才能重现历史,跟踪变化和预测未来。例如,在
智能交通系统中,车流量数据只有在与一定的时刻及路口相关联时才有意义,否则就难以理
解与利用。
因此,同时考虑空间和时间因素的时空数据挖掘(Spatio-Temporal Data Mining,
STDM)是一项重要的也很有实用意义的研究。时空关联性分析是在时空数据挖掘理论基础
上,研究空间对象随时间的变化规律,分析数据的时空变化趋势或预测未来的时空状态。时
空关联规则挖掘方法为实现时空关联性分析提供了有效的途径。采用时空关联规则方法,首
先对时空数据进行空间关联性分析和时间段划分,然后对空间关联的项集进行连接,最终产
生时空关联规则。因此,时空关联性分析方法可以用来获得数据项之间相互联系的有关知识,
为(交通/ 物流等)指挥调度、(能源/气象/环境等)灾害预警、(城市/市场等)规划建设及信息
服务等众多领域提供辅助决策信息,这些需求使得时空关联性分析方法研究在近年来得到广
泛关注。本论文正是根据时空关联性分析的研究需要,针对时空数据包含的时间特征、空间
特征和时空演变等复杂特征,提出有效的、合理的、快重庆邮电大学硕士论文第一章绪论 3
速的时空关联性分析方法,应用于智能交通系统(Intelligent Transportation
System,ITS)中,进行交通拥堵的趋势分析与预测,并结合表格可视化技术和地图可视化
技术,增强分析结果的理解性和可读性,为道路导航、交通控制、趋势查询等服务提供辅助
决策信息。
时空关联性分析研究现状
随着无线通信、互联网、空间定位、测量传感等技术的发展和应用,推动了时空数据
挖掘技术的研究。从时空数据挖掘的任务角度来看,目前时空数据挖掘的主要研究方向可概
括为六个方面,具体包括[5]:(1)时空预测(Spatio-Temporal Forecast);(2)时空特征
化/概化(Spatio-Temporal Characterization/Generalization);(3)时空分类和聚类
(Spatio-Temporal Classification and Clustering);(4)时空元规则挖掘
(Spatio-Temporal Meta-rules);(5)时空关联规则(Spatio-Temporal Association
Rule);(6)时空演变(Spatio-Temporal Evolution)等。其中,时空关联规则挖掘旨在发
创先职称论文发表网
www.lunwen1998.com
现时空数据中各数据项集之间潜在的有用的时空关联关系,是时空数据挖掘领域中最为关键
的技术难点之一。时空关联性分析研究空间对象随时间的变化规律,反映时空数据在时间和
空间上的关联性。时空关联规则挖掘作为时空关联性分析的主要方法之一,国内外已有不少
学者对其进行了研究或应用。李波等人[6]将洪泽湖水质监测数据与空间数据结合,先建立
具有时间和空间特征的洪泽湖水质数据库,再基于相关系数矩阵,利用GIS和 Origin等
分析软件对洪泽湖水质的时空相关性及其时间和空间分布规律进行了研究。该研究分别进行
时间相关矩阵分析和空间分布分析,并未同时考虑时间和空间因素,而同时考虑时空约束能
够在分析过程中及时过滤不相关的数据,提高算法的效率。沙宗尧[7]提出时序空间关联规
则挖掘方法,并将该方法应用于土地类型变化的时空关联分析中,发现土地覆盖演替规律。
岳慧颖[8]提出 SKDM(Shi Kong Data Mining)算法,首先考虑空间约束,按空间位置生
成项目-地址对,再综合时间因素,假设时间区间相同,然后将两者的相关有效时间进行推
广和归并,得到相应的带时空约束的关联规则。该算法先后考虑了空间和时间双重约束,以
两阶段分别进行分析,同样不是同时考虑时空约束。