当前位置:文档之家› 第六讲 GIS的数据库设计

第六讲 GIS的数据库设计


分析结果报告
分析结果报告通常要包括以下几个部分: 1)机构运作的逻辑数据流程图; 2)对于整个数据流程的每步过程,数据 的输入是如何转换成数据的输出; 3)各主要处理均应当以任务的形式出现; 4)各主要处理的步骤应简单明地注明。

(2)建立GIS系统获得的各种产品

各类GIS产品通常可以包括地图、报表、 文件、应用软件包、屏幕查询或是更新 的数据库等。

(2)空间数据的均衡化

将数据库中各关系表进行分解,使其变 成更简单、更稳定的一套关系表的过程 叫数据库的均衡化。
(3)使用实体—关系模型来帮助关 系表的规范化
①首先要识别实体。 ②决定实体间的关系。 ③决定各实体的关键项。 ④将其汇成连通的图表。

(4)逻辑数据图
(5)概念化设计的书面报告

地图投影选择的几个2)等形投影保持小区域内不变,但任何一种 投影不能保证大范围内的不变。 3)等面积投影保持同比例的情况下面积不变。 4)等距离投影保持某种距离上下不变,但任 何一种投影均不可能保持一幅地图上任何两点 的距离均是不变的。 等方向投影保持地图上的方位角与真实方位角 相同。

2)空间数据库属性表与属性关系设计

步骤:①设计相互关联的表格;②对数 据表进行规范化;③定义主关键项和外 部关键项;④使用实体关系模型来定义 关系;⑤关系表的再规范化。
(1)设计相互关联的表格
●唯一性:在每个表中,每个记录的关 键项均必须是唯一的; ●不变性:不含有其他方面的信息; ●纯粹性:不含有其他方面的信息; ●不重复性:不会被重复使用,即某一 个值被删除后,不会再被使用; ●可获得性:需要时便可以拿来到此信 息。
数据字典中各数据层的详细内容 定义及结构:



●标题类信息:名称、类型、数据质量; ●各层的有关文件、表、各表的项及各项的定 义、有效值范围等; ●地理参考方面要求满足的情况; ●其它有便于说明和理解的文字或图表等; ●各层空间及属性的质量控制规范; ●各层编号系统与其它各标准编号系统的关系; ●各层数据的使用与各应用类型的关系等。
(3)硬件资源表

包括:硬件名称、操作系统、主要功能、 所属部门、运行状况等。
(4)软件资源表

包括:软件名称、所属单位、操作平台、 主要功能、参与的应用、运行状况等。
(5)专业人员清单

主要包括:人员名称、所属部门职务、 主要职责范围、技术优势、经验层次、 目前工资等。
(6)数据功能参照表
已存在的电子版数据的评价原则



1)数据格式:数据格式是一个很重要的因素,如果不与数据库设 计的要求相吻合,势必要进行数据转换。 2)拓扑关系:GIS数据要求数据的特征之间保持应有的拓扑关系。 3)数据分辩率:对于栅格数据,数据的分辩率是指象元的大小。 4)数据覆盖面及一致性:该数据是否能够覆盖整个的工作地区。 5)数据的可获得性:包括数据存储的媒介,适用的计算机平台和 是否可以购买及免费提供。 6)样本数据:在数据评判过程,如果能够有机会获得该数据的样 本将会对数据的感性认识大大地提高。 7)自动化过程实施的考虑:通常现有的数字化数据并不完全符合 某一数据库设计的要求,可能需要做不同程度的加工才能入库。 8)数据的元数据信息是否完全:元数据是不关数的重要信息,它 的顾在与否及质量直接影响到该数据的价值。
需要了解的内容

通常可以分成机构的模式、日常操作、 数据、专业人员、软件和硬件这六大类。
调查内容的组织的分析
(1)现有机构的组织结构图;

1)现有机构的功能示意图; 2)现有机构的人员组织及功能示意图; 3)现有数据内容及来源清单; 4)现有数据及其功能参照表; 5)现有软硬设备关系图。 除了以上6种内容以外,还应当包括下面三种; 6)人员培训计划; 7)GIS的输出产品; 8)实施的进度计划。


数据词典
1、 数据流条目




数据流名称 [别名列表] 数据流组成 [来源][去向] [处理特点(使用频率,数据量等)] [其他注释(格式、位置等)] 〈数据流名称〉=数据项[〈逻辑操作符〉数据项] 例1:学生成绩单=课程编码+课程名+[任课教师 1指导教师]+{学 号+姓名+成绩(+备注)} 在描述数据流组成时,常用符号有:=,+,[1],{},() = 表示“定义为(等价于)” + 表示“与” [1] 括号内用“1”分割的各项目选择出现一项 () 括号内部分可以不出现 {} 括号内部部分重复出现
I: Input
O: Output
(7)数据来源清单

数据功能参照表
(8)部门功能清单
概念化设计


1)数据库的宏观地理定义:主要指对数据库比例尺、 地图投影和坐标系统的定义。 2)数据库的地理特征设计;对于各种地理特征有关的 属性数据中以什么几何形式表达进行设计。 3)数据库表格及其关系的设计表达:对与地理特征有 关的属性数据在数据库中表达方式的设计。 4)数据库总体设计的评定;根据数据库的应用目的和 数据内容及使用方式来评价前面三步的设计结果,进 行统筹的考量。 5)数据库概念模型的起草;将GIS数据库的概念设计 起草成正式的文件,作为后面详细设计时参考。
数据库的宏观地理定义
宏观地理定义通常包括以下三个内容:比例尺、地图 投影和坐标系统。 1)比例尺 比例尺是指地图和地表上长度的对应关系,它是地图 或数据精度和详细程度的标志。 2)地图投影和地理坐标系统 设计数据库时可以有以下几种选择 1)将所有数据放入一个带。 2)将各带分别存放。 3)选择不同的地图投影。 4)选择使用地理坐标系统。
第六讲 地理信息系统数据库设计 与管理
程承旗
北京大学遥感与地理信息系统研究所
GIS数据库

一般来说数据库的集合存放有下面几个要求: 1)最小冗余度原则;数据尽可能不重复。 2)应用程序对数据资源的共享原则:以最优 的方式服务于一个或多个应用程序。 3)数据独立性原则:数据的存放尽可能地独 立于使用它的应用程序。 统一管理原则:能够用一个软件统一管理这些 数据。

文件内容应该将所有的数据内容加以详细的概 述。 对数据库的数据模型和内容加以描述,即分层 和表格关系。 在能够使用图表的情况下尽量使用图表。 很多详细的内容可以放入附录之中,以保持文 本主体的清晰。 假若时间允许,可以提供一个原型以更清楚地 表示整个设计的概念。
GIS数据库的详细设计
空间数据层的设计

1)属性数据类型的设计 2)编码标准的设计
数据字典

1)数据字典的内容 2)数据文件的命名方法 3)数据字典的元数据内容。
数据字典

1)数据字典的内容 ① 数据库的总体组织结构; ② 数据库总体设计的框架; ③ 数据层的详细内容定义及结构; ④ 数据命名的定义; ⑤ 元数据内容等。
用户需求分析

GIS数据库开发应该主要了解下面的内容: 1)明白即将开发的GIS所支持的各种功 能; 2)了解系统要求的数据内容和行为; 3)了解数据之间的关系和优先次序;这 些信息有利于制定数据库的开发实施计 划。 4)了解数据库和GIS的整体要求和蓝图。
现状调查
1)在访谈以前将各种问题以表格、问卷或其他书面形式 写出来。 2)避免不必要的细节,着重了解预定的内容。 3)整个访谈应由GIS专业技术人员掌握,控制进度,保 持良好的访谈气氛。 4)尽可能在对方工作的地方进行,以便对方可以随时提 供必要的资料和过程。 5)让对方告知轻重次序,以便于在实施过程中决定执行 次序。 6)注意负面意见,但不要急于作答。 7)对于自己不熟悉的领域可以使用录音机、录相、照相 等。
数据流图
1、 数据源点和数据终点 2、 加工(数据处理/变换) 3、 数据流 4、 文件(数据存储)

具体步骤如下:
1) 确定系统边界,画出顶层数据流图。 2) 自项向下,对每个加工进行内部分解,画出分层数 据流图。 3) 对数据流图进行复查求精。 在分层数据流图求精过程中应该注意以下问题: ① 检查流入、流出加工的数据流的连续性。 ② 控制单张数据流图的复杂性 ③ 父图与子图的数据平衡 ④ 终止加工分解的条件 ⑤ 局部文件 ⑥ 分解层次的均匀性问题
主要包括五个方面的内容: ●数据源的选择; ●各种数据集的评价; ●各数据集的设计; ●数据字典的产生; ●数据库具体存储和管理结构的设计。

数据源的选择



来源:①地图;②航空象片;③GPS接收的数 据;④卫星象片;⑥现有的各种电子数据文件; ⑥照片;⑦各种记录性文件等。 1)国家各机构生产和维护的数据 2)省级政府生产和维护的数据 3)各级地方政府生产和维护的数据 4)商业团体的数据 5)非赢利性机构生产的数据
投影和坐标系统选择的一般原则:


1)在经常需要投影变换而且覆盖面积较大的 情况下,应该使用地理坐标系统。 2)笛卡儿坐标系统对于小面积和一个固定的 坐标系最为适合。 3)根据研究区的形状来选择变形最小的投影。 4)如果有地区标准的话,应该使用地区标准。 5)如果研究区的面积很重要时,可以考虑使 用一种等面积的投影进行面积计算,而数据在 存储时可以使用另外一种投影。
分享式数据库
分享式数据库的优点可以从以下几个方 面来概括: 1)灵活性增强。 2)用户应用程序的共同开发。 3)维护的分享。 4)减少数据的冗余度。

GIS数据库设计的概念
GIS数据库设计过程

第一步 第二步 第三步 第四步 第五步 第六步
需求分析 原型概念化设计 GIS数据库的详细设计 自动化方案制定 试点项目实施 数据库总体实施
相关主题