一、数据管理的发展阶段1、人工管理阶段2、文件系统阶段3、数据库管理阶段注意了解各阶段的背景和特点二、数据库系统的特点1、面向全组织的复杂的数据结构2、数据的冗余度小,易扩充3、具有较高的数据和程序的独立性:数据独立性数据的物理独立性数据的逻辑独立性三、数据结构模型三要素1、数据结构2、数据操作3、数据的约束性条件四、数据模型反映实体间的关系1、一对一的联系(1:1)2、一对多的联系(1:N)3、多对多的联系(M:N)五、数据模型:是数据库系统中用于提供信息表示和操作手段的形式构架。
数据库结构的基础就是数据模型。
数据模型是描述数据(数据结构)、数据之间的联系、数据语义即数据操作,以及一致性(完整性)约束的概念工具的集合。
概念数据模型:按用户的观点来对数据和信息建模。
ER模型结构数据模型:从计算机实现的观点来对数据建模。
层次、网状模型、关系六、数据模型的类型和特点1、层次模型:优点:结构简单,易于实现缺点:支持的联系种类太少,只支持二元一对多联系数据操纵不方便,子结点的存取只能通过父结点来进行2、网状模型:优点:能够更为直接的描述世界,结点之间可以有很多联系具有良好的性能,存取效率高缺点:结构比较复杂网状模型的DDL、DML复杂,并且嵌入某一种高级语言,不易掌握,不易使用3、关系模型:特点:关系模型的概念单一;(定义、运算)关系必须是规范化关系;在关系模型中,用户对数据的检索操作不过是从原来的表中得到一张新的表。
优点:简单,表的概念直观,用户易理解。
非过程化的数据请求,数据请求可以不指明路径。
数据独立性,用户只需提出“做什么”,无须说明“怎么做”。
坚实的理论基础。
缺点:由于存储路径对用户透明,存储效率往往不如非关系数据模型4、面向对象模型5、对象关系模型七、三个模式和二级映像1、外模式(Sub-Schema):用户的数据视图。
是数据的局部逻辑结构,模式的子集。
2、模式(Schema):所有用户的公共数据视图。
是数据库中全体数据的全局逻辑结构和特性的描述。
3、内模式(Storage Schema):又称存储模式。
数据的物理结构及存储方式。
4、外模式/模式映象:定义某一个外模式和模式之间的对应关系,映象定义通常包含在各外模式中。
当模式改变时,修改此映象,使外模式保持不变,从而应用程序可以保持不变,称为逻辑独立性。
5、模式/内模式映象:定义数据逻辑结构与存储结构之间的对应关系。
存储结构改变时,修改此映象,使模式保持不变,从而应用程序可以保持不变,称为物理独立性。
八、数据视图数据库管理系统的一个主要作用就是隐藏关于数据存储和维护的某些细节,而为用户提供数据在不同层次上的抽象视图,即不同的使用者从不同的角度去观察数据库中的数据所得到的结果—数据抽象。
九、规范化1、几个概念候选码(候选关键字):如果一个属性(组)能惟一标识元组,且又不含有其余的属性,那么这个属性(组)称为关系的一个候选码(候选关键字)。
码(主码、主键、主关键字):从候选码中选择一个唯一地标识一个元组候选码作为码主属性:任何一个候选码中的属性(字段)非主属性:除了候选码中的属性外码:关系模式R中属性或属性组X并非R的码,但X是另一个关系模式的码,则称X是R的外部码,简称外码。
2、函数依赖(1)设R(U)是一个属性集U上的关系模式,X和Y是U的子集。
若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称“X函数确定Y”或“Y函数依赖于X”,记作X→Y。
X称为这个函数依赖的决定属性集(Determinant)。
Y=f(x)(2)在关系模式R(U)中,对于U 的子集X 和Y ,如果X →Y ,但Y ⊆ X ,则称X →Y 是非平凡的函数依赖若X →Y ,但Y ⊆ X, 则称X →Y 是平凡的函数依赖(3)在关系模式R(U)中,如果X →Y ,并且对于X 的任何一个真子集X’,都有X’/ →Y , 称Y 完全函数依赖于X ,记作XF →Y 。
若X →Y ,但Y 不完全函数依赖于X ,则称Y 部分函数依赖于X ,记作XP →Y 。
(4)在关系模式R(U)中,如果X →Y ,Y →Z ,且Y ⊆X ,Y →X ,则称Z 传递函数依赖于X 。
记为X 传递→Z 。
注: 如果Y →X , 即X ←→Y ,则Z 直接函数依赖于X 。
3、范式范式是符合某一种级别的关系模式的集合(1)范式种类:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、BC 范式(BCNF)、第四范式(4NF)、第五范式(5NF)(2)各种范式之间的联系:(3)定义:1NF :如果一个关系模式R 的所有属性都是不可分的基本数据项,则R ∈1NF 。
存在的问题:插入异常、删除异常、数据冗余度大、修改复杂2NF :若关系模式R ∈1NF ,并且每一个非主属性都完全函数依赖于R 的码,则R ∈2NF 。
(所有非主属性完全依赖每个候选关键字。
)3NF :关系模式R<U ,F> 中若不存在这样的码X 、属性组Y 及非主属性Z (Z\ ⊆ Y ), 使得X →Y ,Y →Z 成立,Y\→X ,则称R<U ,F> ∈ 3NF 。
(所有非主属性既不部分依赖于码也不传递函数依赖码。
)BCNF :设关系模式R<U ,F>∈1NF ,如果对于R 的每个函数依赖X →Y ,若Y 不属于X ,则X 必含有候选码,那么R ∈BCNF 。
(每一个决定属性集(因素)都包含(候选)码,R 中的所有属性(主,非主属性)都完全函数依赖于码,R ∈3NF 。
)性质:a 、所有非主属性都完全函数依赖于每个候选码b 、所有主属性都完全函数依赖于每个不包含它的候选码c 、没有任何属性完全函数依赖于非码的任何一组属性多值依赖:设R(U)是一个属性集U 上的一个关系模式, X 、 Y 和Z 是U 的子集,并且Z =U -X -Y ,多值依赖 X →→Y 成立当且仅当对R 的任一关系r ,r 在(X ,Z )上的每个值对应一组Y 的值,这组值仅仅决定于X 值而与Z 值无关平凡多值依赖和非平凡的多值依赖:若X →→Y ,而Z =φ,则称X →→Y 为平凡的多值依赖,否则称X →→Y 为非平凡的多值依赖。
4NF :关系模式R (U ,F )∈1NF ,如果对于R 的每个非平凡多值依赖X ◊◊Y(Y 不包含于X),X 都含有候选码,则R ∈ 4NF12345NF NF NF BCNF NF NF ⊃⊃⊃⊃⊃范式关系:十、数据库数据库:数据库就是为了一定的目的,在计算机系统中以特定的结构组织、存储、管理和应用的相关联的数据集合。
空间数据库:空间数据库是存取、管理空间信息的数据库。
空间数据库管理系统:空间数据库管理系统是指能够对物理介质上存储的地理空间数据进行语义和逻辑上的定义;1、提供必须的空间数据查询、检索和存取功能;2、能够空间数据进行有效的维护和更新的一套软件系统。
空间数据库应用系统:提供给用户访问和操作空间数据库的用户界面,是应用户数据处理需求而建立的具有数据库访问功能的应用软件。
一般需要进行二次开发。
数据库系统组成:数据库、数据库管理系统、应用系统、数据库管理员空间信息的特征:(1)几何信息:描述了事物在空间中的位置及所占据的范围将地球表面以投影方式转换为平面通过平面几何来抽象描述和研究事物的位置和范围用图形和符号的方式来描绘这些空间相关的事物(2)拓扑信息:研究空间相关的事物本身或者事物之间的在空间坐标变换下的不变性质事物本身的内外关系事物之间的相离、相接、相交事物之间相连的布局(3)属性信息:与位置范围无关的其它信息描述了事物本身的内在性质和外在表现事物之间的非位置关系空间数据库管理系统三层体系结构及每层的代表软件:标准DBMS存储空间数据的局限性(1)空间数据记录是变长的(如点数的可变性),而一般的数据库都只允许把记录的长度设定为固定;(2)在存储和维护空间数据拓扑关系方面存在着严重缺陷;(3)一般都难以实现对空间数据的关联、连通、包含、叠加等基本操作;(4)不能支持复杂的图形功能;(5)单个地理实体的表达需要多个文件、多条记录,一般的DBMS也难以支持;(6)难以保证具有高度内部联系的GIS数据记录需要的复杂的安全维护。
GIS的发展演化空间数据库管理系统与传统数据库的区别:(1)数据量大(2)需要处理与传统数据库中数据性质相似的属性数据和空间位置数据及它们之间的联系(3)对数据的检索涉及空间分析方法(4)数据应用广泛,不局限于某个部门GIS发展三个阶段1、第一代GIS(从60年代中期到80年代的中后期,是GIS软件从无到有、从原型到产品的阶段)技术特点:以图层作为处理的基础以系统为中心单机、单用户全封闭结构支持二次开发能力非常弱在主要实现技术上,以文件系统来管理几何数据与属性数据应用领域基本上集中在资源与环境领域的管理类应用2、第二代GIS(从80年代末到90年代中期,是GIS软件成熟和应用快速发展的时期)技术特点:以图层作为处理基础引入网络技术,多机、多用户以系统为中心支持二次开发的能力有所增强以商用DBMS管理属性数据,但几何数据仍用文件系统管理应用领域开始有较大范围的扩展,但基本上是管理类应用。
3、第三代GIS(90年代中期开始,估计将延续10年或稍长的时间)技术特点:仍然以图层为处理的基础,但面临不断演化引入了Internet技术,开始向以数据为中心的方向过渡,实现了初步的(浏览型或简单查询型)的B/S结构开放程度大幅度增加,组件化技术改造逐步完成逐渐重视元数据问题,空间数据共享、服务共享和GIS系统互连技术不断发展GIS的标准化问题备受重视实现空间数据与属性数据的一体化存储和初步的一体化查询,并将不断完善应用领域迅速扩大,应用深度不断提高,开始具有初步的分析决策能力。
展望新一代GIS面向空间实体及其时空关系的数据组织与融合统一的海量存储、查询和分析处理有效的分布式空间数据管理和计算一定的三维和时序处理能力强大的应用集成能力灵活的操纵能力和一定的虚拟现实表达空间数据库管理系统与GIS的联系和区别空间数据库管理系统一般由专业GIS软件提供GIS—处理地理数据——以地球表面为基本参照框架的空间数据SDBMS——处理空间数据(空间数据包括地理数据,地理数据是空间数据的子集)GIS促进SDBMS的研究与发展空间信息模型:基于场的模型:用于表示具有连续的空间变化的情况,形状不定的现象,采用栅格数据结构。
基于对象的模型:用于表示具有固定形状的空间实体/概念,描述空间上离散的空间对象。
采用矢量数据结构空间数据库设计的三个步骤空间数据库的设计是指在现在数据库管理系统的基础上建立空间数据库的整个过程。