数据组织与结构
(1)可以有一个以上的结点没有“父”结点; (2)至少有一个结点有多于一个“父”结点; (3)结点之间可以有多种联系; (4)可以存在回路。
•
•(a)关系结构表
•(b)层次模型示例-林地数据 库
•(c)网状模型示例
•
•第三节 空间数据组织与结构
栅格数据结构 矢量数据结构 栅格与矢量数据结构的选择与转换 两种数据结构的优缺点比较
步骤:
(1)标定局部应用中的实体; (2)实体的属性、标识实体的码; (3)确定实体之间的联系及其类型 (1:1、1:n、m:n)
•
•E-R图基础知识
E-R图提供了表示实体、属性和联系的方法(基 本要素)。
实体:现实世界中一组具有某些共同特性和行为 的对象可抽象为一个实体。如,在学校环境中, 可把张三、李四等对象抽象为学生实体。对象与 实体是“member of”的关系。 注:对象类型的组成部分可抽象为实体的属性。
• 数据库是为一定目的服务,以特定的数据存 储的相关联的数据集合,是数据按照一定的格式 存放的仓库。 • GIS的数据库是某一区域内关于一定地理要 素特征的数据集合。
•
空间数据库与一般数据库相比,具有:
数据量特别大; 不仅有地理要素的属性数据,还有大量的空间数据; 数据应用广泛。
1. 数据库中的数据组织一般可分为四级:数据项、 记录、文件和数据库。
•班主任 •1 •管理 •n •班级 •n •上课 •1 •教室
•1
•1
•管理
•地址
•宿舍号
•人数
•宿舍 •1
•n •住宿 •n
•n •学生
•学号 •姓名•出生日期•来自•第二节 数据与文件组 织
• 数据是现实世界中信息的载体,是信息的具
体表达形式,为了表达有意义的信息内容,数据 必须按照一定的方式进行组织和存储。
数据组织与结构
2020年5月31日星期日
第一节 数据模型
通俗地讲,数据模型就是现实世界的模拟。 数据模型可分成两个不同的层次:
(1)概念模型:也称信息模型,是按用户的观点来对数据
和信息建模,是一种独立于任何计算机系统实现的,如实体联系模 型,这类模型完全不涉及信息在计算机系统中的表示,只是用来描 述某个特定组织所关心的信息结构,被称作“概念数据模型”。
矢量结构和栅格结构。两类结构都可用来描
述地理实体的点、线、面三种基本类型。
•
一、数据模型
矢量模型
在矢量模型中,每一个实体的位置用它们 在坐标参考系统中的空间位置定义。地图空间 中的每一位置都有唯一的坐标值。点、线和多 边形用于表达不规则的地理实体在现实世界的 状态。矢量模型中的空间实体与所表达的现实 世界中的空间实体具有一定的对应关系。
倒排文件:是带有辅索引的文件,其中辅索引是按照一些辅关键 字来组织索引的。倒排文件是一种多关键字的索引文件,其中的 索引不能唯一标识记录,往往同一索引指向若干记录。因而,索 引往往带有一个指针表,指向所有该索引标识的记录。通过辅索 引不能直接读取记录,而要通过主关键字才能查到记录的位置。
•
数据库结构
构用计算机语言的实现,它依赖于计算机语言。 对机器语言而言,存储结构是具体的。
•
描述地理实体的数据本身的组织方法,称为内
部数据结构。数据结构即指数据组织的形式,是
适合于计算机存储、管理和处理的数据逻辑结构。
空间数据结构则是地理实体的空间排列方式和相
互关系的抽象描述。 GIS的内部数据结构基本上可分为两大类:
•
数据结构:指的是数据之间的相互关系 ,即数据的组织形式。
数据元素之间的逻辑关系,也称数据的逻辑结 构,是从逻辑关系上描述数据,与数据的存储无
关, 是独立于计算机的。数据的逻辑结构可看作 是从具体问题抽象出来的数学模型。 数据元素及其关系在计算机存储器上的表示,称
为数据的存储结构(物理结构),是逻辑结
关系模型(relational model)满足一定条件
的二维表格。
层次模型(hierarchical model)以记录类型
为节点的有向树(tree)。其主要特征是:(1)除根节 点外,任何节点都有且 只有一个“父亲”;(2)“父
”节 点表示的实体与“子”节点表示的实体是一对多的联系
。
网状模型(network model)
2. 数据间的逻辑联系:一对一的联系;一对多的 联系;多对多的联系。
3. 常用的数据文件:顺序文件、索引文件、直接 文件和倒排文件。
•
数据项:是可以定义数据的最小单位,也叫元
素、基本项、字段等,数据项与现实世界实体的 属性相对应,数据项有一定的取值范围,称为域 。
记录:是由若干相关联的数据项组成,是处理
实体与属性是相对而言的。一般来说,属性不能 再具有需要描述的性质,即属性必须不可分的数 据项;属性不能和其他实体具有联系,即联系只 能发生在实体之间。
根据需求分析,要考察实体之间是否存在联系, 有无多余联系。
•
E-R图举例: 实体:班主任、学生、班级、宿舍。
•性别 •职工号 •姓名 •班级号 •学生人数 •教室编号 •地址 •容量
(2)数据模型:主要包括网状模型、层次模型、关系模型
等,是按计算机系统的观点对数据建模,是直接面向数据库中数据 逻辑结构的,涉及到计算机系统,一般又称为“基本数据模型”或 “结构数据模型”。
•
(1)概念模型
基本内容:
(1)两类实体:对象与属性; (2)实体的两级:个体与总体; (3)个体与总体之间的联系。 用E-R图来描述现实世界的概念模型。
和存储信息的基本单位,是关于一个实体的数据 总和,构成该记录的数据项表示实体的若干属性 。为了标识每条记录,都必须有记录的标识符, 也叫“关键字”。
文件:是一给定类型记录的全部具体值的集合
,文件用文件名称标识。
数据库
•
顺序文件:是最简单的文件组织形式,对记录按照主关键字的顺 序进行组织。当主关键字是数字型时,以其数值的大小为序;若 主关键字是文字型的,则以字母的排列为序。
索引文件:除了存储记录本身(主文件)以外,还建立了若干索 引表,这种带有索引表的文件叫索引文件。索引表中列出记录关 键字和记录在文件中的位置(地址)。读取记录时,只要提供记 录的关键字值,系统通过查找索引表获得记录的位置,然后取出 该记录。
直接文件:又称随机文件,其存储是根据记录关键字的值,通过 某种转换方法得到一个物理存储位置,然后把记录存储在该位置 上。查找时,通过同样的转换方法,可以直接得到所需要的记录 。