当前位置:文档之家› 对地理信息分类编码的认识与思考

对地理信息分类编码的认识与思考

1 地理实体 、地理数据与地理信息
地理信息分类与编码需要把现实世界抽象为概 念世界 ,再到数字世界与信息世界 。要经过地理时 空思考 、地理概念形式Байду номын сангаас达 、计算机实现以及智能理 解等阶段[ 1 - 2] 。分析地理实体 、地理数据与地理信
息的概念和内涵 , 从而把握地理信息分类编码对象 的本质特征 。
- 01 - 02) ;中国科学院知识创新工程项目( kzcx2 - 308 - 02) 作者简介 :何建邦( 1937 - ) ,男 ,研究员 ,从事地理信息标准 、地理信息共享研究 。
© 1995-2004 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
地理学是一门研究地球表层自然要素与人文要 素相互作用与关系及其时间规律的科学 。地球表层 是由大气圈 、生物圈 、水圈 、人类圈 、岩石圈 5 大圈层 相互作用 、相互渗透组成的一个复杂地球表层巨系 统[ 7 - 8] 。因此 , 地理信息分类对象具有高度的复杂 性( 图 5) 。
图 5 分类对象的复杂性
摘要 :面向 GIS 的地理信息分类编码是在概念水平上解决空间信息分层组织与属性数据库结构设计的重要方法 。 该文从地理实体 、地理数据与地理信息概念角度 ,探讨地理信息分类编码对象的本质特征 ;简要分析大多数商品化 GIS 软件中属性数据的表达方式 ,指出地理信息分类编码实质上是从 GIS 数据组织的概念层次上对属性信息的分 类分级 ;提出地理信息分类粒度概念 ,并建立地理信息分类模型 ,列举了在不同视图下的粗粒地理信息分类方案和 代码用途 ;提出并讨论地理信息分类编码尚待进一步研究的问题 ,以及国内长期以来难以形成地理信息分类标准 的原因 。 关键词 :地理信息 ;分类模型 ;分类粒度 ;编码方法 中图分类号 :P208 文献标识码 :A 文章编号 :1001 - 8107( 2002) 03 - 0001 - 07
以按照某种抽象 , 找出分类对象之间的关系 。在这 里笔者把语义概念引申到地理信息分类中 , 作为建 立分类对象概念模型的工具 。“语义”一词在语言学 中指词与它们所表述的事物之间的关系 , 在这里语 义被定义为数据内部以及数据与现实世界之间的关 系 。在语义上 , 属性之间的相关关系反映实体之间 的分类分级关系 , 主要体现为属性多级分类体系中 从属关系 、聚集( aggregation) 关系和相关关系 。从属 关系主要反映实体之间的上下级或包含关系 ;聚集 关系反映各实体之间并列关系 , 如构成同一水系的 众多河流之间的关系是聚集关系 ;相关关系则反映 不同实 体 之 间 的 某 种 直 接 或 间 接 的 并 发 或 共 生 关 系 。所有这些关系都是地理信息分类时建立实体 关系模型即 E - R 模型的依据 。 3. 3 分类视图
在 GIS 中空间数据与属性数据一般采用分离组
© 1995-2004 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
第 3 期 何建邦等 :对地理信息分类编码的认识与思考
第3页
织 、分别存贮 。空间数据用文件管理 ,不同的软件有 不同的数据格式 。属性数据一般用关系型数据库管 理 ,但不同的软件 , 处理的方式基本相同 , 称为要素 属性表 。一般而言 , 一个二维表格与一个数据层相 对应 。表中每一行表示一个地理实体 , 每一列表示 实体的一个属性 , 在每一行中相同的列表示相同的 属性( 图 4) 。Coverage 中 ,一个图层可以有一个点或 多边形属性表 ,但不能同时兼有二者 。ArcInfo 自动 维护属性表中最前面的一些项( 字段) , 如多边形的 面积和周长( 点的为零) 、内部序列号和属性标识符 。 用户根据信息分类时定义的属性项增加到相应的表 文件中 ,通过公共项 id # 实现空间数据的连接 。
作为地理信息分类编码对象的地理信息 , 它表 示地理系统中自然 、人文现象的空间分布与各种地 理过程的数量 、质量 、分布特征 、内在联系和运动规 律[ 1 - 3] 。各种基于地理信息系统技术与方法的应用 工程 , 包括目前热度甚高的“数字省区”、“数字城 市”“、数字社区”等大型信息系统建设项目 , 地理信 息都是这些系统的主要数据基础和内容 。而统一的 地理信 息 分 类 编 码 是 实 现 系 统 内 和 系 统 间 信 息 交 换 、集成与信息共享的关键问题之一 。制定国家地 理信息分类编码标准体系便成为十分紧迫的工作 。 本文从软件工程角度分析地理实体 、地理数据与地 理信息 ,探讨地理信息分类编码对象的本质特征 ,指 出地理信息分类实质上是从 GIS 数据组织概念层次 上对属性信息的分类分级 ;用图示表达方法说明地 理数据的组织方式 , 并以空间数据基础的框架数据 为例 ,说明数据层与粗粒度信息分类之间的关系 ;笔 者以 ArcInfo 为例说明属性数据的组织方式 。从抽 象概念上简述了地理信息分类粒度与分类方法 , 并 建立了分类编码过程模型 , 列举了某些应用工程粗 粒度地理信息分类方案 、编码方法和分类编码的作 用 ; 并就某些与信息分类编码相关的问题进行了讨 论。
GIS 中属性信息分类还应当考虑与其共生的空 间实体类型 ,如地理概念层次上的水系 ,在计算机实 现时通常被它分别处理为点数据层 ,如取水口 、排污 口 ;线数据层 , 如灌渠 、支流等 ; 以及面数据层 , 如湖 泊 、水库以及由分水岭包围形成的流域等 。虽然 ,这 种基于属性分类来组织地理信息 , 有许多理论与方 法上的不足[ 5] 。而实际上到目前为止 , 多数 GIS 软 件都是以图层为处理的基础 , 例如 , ArcInfo 的 Cov2 erage , MapInfo 的 layer 等 。 2. 1 数据层
地理实体 在地理空间认知模型中 , 实体是有 相同属性描述对象的集合 。在 GIS 软件工程中 , 地 理实体是与空间位置有关 、具有一定几何形态的各 种事物和现象 。分为点状 、线状 、面状实体三种基本 类型 ,还有体状实体 、表面实体等[ 2 ,4] 。地理实体的 最根本特征是任何一个实体都可按某种空间坐标进 行数字化表达 , 并实现对其定位 、定性 、定量以及拓 扑关系的描述 。应当指出地理实体可以是客观存 在 、能看得见的或纯粹是概念上的( 如行政区) 实体 。 因此 , 地理实体是抽象意义上的现实世界地理系统 中的事物和现象 。地理信息分类就是对实体的本质 特征进行分类 。
第2页
地 理 学 与 国 土 研 究 第 18 卷
离散化的空间坐标( x , y) 或坐标序列( 图 1) 或用地 名 、邮政编码等基于地理标识符来间接实现地理实 体的定位 。
属性描述数据简称为属性数据 , 又称为非空间 数据 ,是地理实体的定性或定量特征的抽象 。例如 , 水井的属性数据可抽象为井深 、出水量等 。同样可 用土壤类型 、土壤名称等定性描述 ,也可用土壤适宜 性分级 、PH值( 等级或数量) 来表述一个土壤多边形 实体的非空间特征 ;或者通过名字 、宽度 、车道数 、交 通流量和路面材料等定性 、定量指标来描述一条道 路( 线状实体) 。根据定性描述可区分实体的类型 , 通过定量数据可辨别同一实体不同的级别 。显然 , 从地理数据层面看 ,属性数据的定性 、定量描述是地 理信息分类编码的依据 。
属性数据的多专题属性决定了一定地域范围内 的地 理 信 息 必 须 用 多 专 题 数 据 层 的 组 合 来 表 示 ( 图 2) ,用地形地势层 、土壤类型层 、土地利用层等才 能较完整地表达该区域的地理事实 。这些以地理概 念形式组织的不同的 GIS 数据层 ,一般而言 ,一类地 理实体的高位属性对应一个层 ,每一数据层可表示一 个或多个专题属性 ,如 MapInfo 的 layer 。并且一些常 用的数据层被作为空间数据基础的核心 ———“数字地 球空间数据框架”(“Digital Geo - Spatial Data Frame2 work”) 提出[6] ( 图 3) 。以数据层 —大地控制点 、DEM、 正射影像 、地形 、地名 、境界 、交通 、水系 、地籍 、土地利 用/ 覆盖等为核心构成框架数据 ,体现了高层信息的 分类思想 。属性数据的分类可以在概念水平上为各 类 GIS 数据库设计 、数据合理组织和应用提供依据 。
图 1 地理实体 、地理数据与地理信息
地理数据 地理实体的位置 、属性类型与级别 的符号化表达是地理数据 , 它是 GIS 操作与处理的 对象 。包含地理空间定位数据与属性描述数据 。空 间定位数据表现为在经纬度地理坐标 、空间直角坐 标 、平面直角坐标或极坐标中 ,点 、线 、面等实体类型
收稿日期 :2002 - 08 - 06 基金项目 :国家自然科学基金课题( 69896250 - 4) ;国家“十五”科技攻关项目“中国可持续发展信息共享系统研究与开发”( 2001BA608 B
图 2 属性分类与数据 GIS 数据层 图 3 地理信息分类与数据分层
实际上 ,应用性 GIS 系统之所以关注地理信息的 共享的地理空间框架数据 ,是各类 GIS 应用系统的共
分类与编码 ,是因为这些系统在技术上主要关注数据 同需求 ,它可以容易地用在地方 、国家事务中 ,大大减
的采集、数据分层组织、数据精度、数据量、数据存贮、 少数据收集的重复劳动 ,提高系统建设的效率 ,并对
数据集成 、分析以及数据共享等技术问题[1] 。地理信 经济增长 、环境质量改善和社会进步等做出贡献 。
息分类为 GIS 数据分层提供指导 ,属性分类直接关系 2. 2 属性数据的表达
到 GIS 中的数据组织 。建立现势性好 ,精度高和可供
实际上 ,自然 、人文现象在地球表层是不均一的 层面 ,存在着明显的地域分异 ,因其本身在时间上和 空间上的过渡性 , 以及被人类所认识和研究的程度 等存在着明显的差别 , 其空间秩序 、时间序列 、时空 耦合和动因机制等具有高度的复杂性 。
相关主题