《数据库系统原理》课程总结与复习大纲一、要求熟读的章节:第一章:绪论第二章:关系数据库第三章:关系数据库标准语言——SQL第四章:数据库安全性控制第五章:数据库完整性第六章:关系数据理论第七章:数据库设计第八章:数据库编程第九章:关系系统及其查询优化第十章:数据库恢复第十一章:并发控制二、要求掌握的主要内容要求熟悉数据库的基本概念、基本理论和基本技术:1.数据管理的发展阶段及每个阶段的特点。
数据管理技术发展经历了三个阶段:一、人工管理阶段(40年代中--50年代中)数据不保存,应用程序管理数据,数据不共享,数据不具有独立性二、文件系统阶段(50年代末--60年代中)数据长期保存,由文件系统管理数据,数据共享性差、冗余度大,数据独立性差:物理独立性、逻辑独立性均差三、数据库系统阶段(60年代末--现在)数据结构化数据的共享性高,冗余度低,易扩充。
数据的独立性高。
(逻辑独立性:是指用户的应用程序与数据库的逻辑结构是相互独立的物理独立性:是指用户的应用程序与存储在磁盘上的数据库中的数据是相互独立的。
数据与程序独立由DBMS统一管理和控制数据。
2.数据、数据库、数据库管理系统的概念,DBMS提供的数据控制功能。
数据是描述事物的符号记录数据库(Database,简称DB)是长期存储在计算机内,有组织的、可共享的大量数据集合数据库管理系统(DBMS )位于用户与操作系统之间的一层数据管理软件DBMS的功能:1、数据定义功能2、数据组织、存储和管理3、数据操纵功能4、数据库的事务管理和运行管理5、数据库的建立和维护功能6、其他功能DBMS还必须提供以下几方面的数据控制功能:(1)数据的安全性(Security)保护(2)数据的完整性(Integrity)检查(3)并发(Concurrency)控制(4)数据库恢复(Recovery)3.数据模型的概念,组成数据模型的三要素。
数据模型:现实世界数据特征的抽象,一组概念的集合数据模型的三要素:一、数据结构数据结构是对系统静态特性的描述二、数据操作数据库操作的类型:检索, 更新(包括插入、删除、修改)数据操作对系统动态特性描述。
三、数据的约束条件(完整性约束)。
(概念模型也称信息模型逻辑模型和物理模型逻辑模型主要包括网状模型、层次模型、关系模型、面向对象模型物理模型是对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法。
4.概念模型、实体、属性、码、候选码、外码、域、实体型、实体集的概念。
概念模型也称信息模型,它是按用户的观点来对数据和信息建模,用于数据库设计。
信息世界中的基本概念实体(Entity)客观存在并可相互区别的事物实体型(Entity Type)用实体名及其属性名集合来抽象和刻画同类实体,称为实体型5.实体间的联系及E-R模型。
用E-R图来描述现实世界的概念模型, (实体型,属性联系)6.实际的数据库系统支持的主要数据模型是哪几种,什么是基本层次联系,层次模型、网状模型的数据结构。
网状模型、层次模型、关系模型基本层次联系,是指两个记录以及它们之间的一对多(包括一对一)的联系7.数据库系统的三级模式结构、两级映象功能、数据的物理独立性和逻辑独立性。
(1)模式也称逻辑模式或概念模式数据库系统中全体数据的逻辑结构和特征的描述,所有用户的公共数据视图,综合了所有用户的需求,并将这些需求有机地结合成一个整体。
(整体性原则)反映的是数据库系统整体结构。
一个数据库只有一个模式(2)外模式也称为子模式(Subschema)或用户模式。
它是数据库用户(包括应用程序员和最终用户)能够看见和使用的局部数据的逻辑结构和特征的描述。
它是数据库用户的数据视图,是与某一应用有关的数据逻辑表示。
(3)内模式也称存储模式(Storage Schema),是数据库物理结构和存储方式的描述;是数据在数据库内部的表示方式。
一个数据库只有一个内模式将模式和内模式分开,保证了数据的物理独立性;将外模式和模式分开,保证了数据的逻辑独立性外模式/模式映象保证数据的逻辑独立性模式/内模式映象的用途:保证数据的物理独立性8.数据库系统的组成。
一、硬件平台及数据库二、软件DBMS支持DBMS运行的操作系统与数据库接口的高级语言及其编译系统以DBMS为核心的应用开发工具为特定应用环境开发的数据库应用系统三、人员数据库管理员系统分析员和数据库设计人员应用程序员用户9.关系的定义及关系的特性,关系模式的表示,元组、属性、主属性、码、候选码、非码属性、全码、外码的概念关系:关系是一张二维表,由行和列组成。
表/实体集元组:表中的一行即为一个元组。
记录/实体属性:表中的一列即为一个属性。
字段/属性主码:表中的某个属性组,它可以唯一确定一个元组。
域:属性的取值范围。
分量:元组中的一个属性值。
关系模式:对关系的描述, 表结构/实体型关系操作的特点:l 数据操纵都是集合操作;l 操作对象和操作结果都是关系;l 关系模型的语言:高度的非过程化。
10.关系模型的三类完整性:实体完整性、参照完整性和用户定义完整性第二章11.掌握关系代数的运算:传统的集合运算(并、交、差、笛卡儿积)和专门的关系运算(选择、投影、连接、除法)12.关系数据语言的特点,关系操作的特点关系数据语言的特点关系语言是一种高度非过程化的语言存取路径的选择由DBMS的优化机制来完成用户不必用循环结构就可以完成数据操作能够嵌入高级语言中使用关系代数、元组关系演算和域关系演算三种语言在表达能力上完全等价关系操作的特点:集合操作方式,即操作的对象和结果都是集合,这种方式一次一集合(set-at-a-time)。
非关系数据模型数据操作方式:一次一记录(record-at –a-time)。
13.SQL语言的四个特点综合统一(数据定义,数据查询,数据操纵,数据控制功能于一体。
)高度非过程化语言面向集合的操作方式以同一种语法结构提供两种使用方式自含式语言:联机交互的使用方式嵌入式语言:嵌入高级语言如C,COBOL,FORTRAN,PB等SQL语言支持的关系数据库的三级逻辑结构14.SQL语言的数据定义功能:包括对基本表、索引和视图的建立修改和删除,语法格式15.掌握查询(SELECT)语句功能和应用(单表、多表连接、嵌套、集函数)。
16.掌握修改(UPDATE)、删除(DELETE)和插入(INSERT)语句的应用17.SQL数据控制功能(GRANT、REVOKE)18.基本表、视图的概念,了解视图的作用。
19.了解关系数据库管理系统(RDBMS)的定义,关系系统的分类20.了解关系系统查询优化的一般策略21.(平凡与非平凡的)函数依赖、完全函数依赖、部分函数依赖、传递函数依赖、函数依赖、(平凡与非平凡的)多值依赖22.关系规范化:了解第一范式、第二范式、第三范式、BC范式、4NF的定义,将一个非规范化的表转化为三范式的表的步骤。
掌握把一个非规范的表转化为三范式的表的方法。
23.Armstrong公理系统、极小函数依赖集、属性基于函数依赖的闭包。
24.数据库设计的步骤,每个阶段所做的工作。
(尤其要掌握概念设计、逻辑设计的工作内容和步骤及基本技术)(1)需求分析(2)概念结构设计(3)逻辑结构设计(4)物理结构设计(5)数据库实施(6)数据库运行和维护概念结构设计:将需求分析得到的用户需求抽象为概念模型的过程就是概念结构设计描述概念模型的有力工具是E-R模型。
自底向上设计概念结构的步骤第1步:抽象数据并设计局部视图第2步:集成局部视图,得到全局概念结构第3步:验证整体概念结构逻辑结构设计:将概念结构转化为具体的数据模型逻辑结构设计的步骤将概念结构转化为一般的关系、网状、层次模型将转化来的关系、网状、层次模型向特定DBMS支持下的数据模型转换对数据模型进行优化物理结构设计:为一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,就是数据库的物理设计确定数据库的物理结构,在关系数据库中主要指存取方法和存储结构对物理结构进行评价,评价的重点是时间和空间效率DBMS常用存取方法索引方法聚簇(Cluster)方法HASH方法数据库的重组织不会改变原设计的数据逻辑结构和物理结构数据库重构造:根据新环境调整数据库的模式和内模式25.事务的概念、故障种类、恢复原理和技术、恢复策略。
定义一个数据库操作序列一个不可分割的工作单位恢复和并发控制的基本单位COMMIT表示提交,即提交事务的所有操作,事务正常结束ROLLBACK表示回滚,在事务运行的过程中发生了某种故障,事务不能继续执行,系统将事务中对数据库的所有已完成的操作全部撤销,回滚到事务开始时的状态。
事务故障系统故障介质故障计算机病毒26.并发控制的技术、基本封锁的种类、封锁协议、并发调度的可串行性、两段锁协议、并发控制的主要技术有封锁(Locking)时间戳(Timestamp)乐观控制法封锁就是事务T在对某个数据对象(例如表、记录等)操作之前,先向系统发出请求,对其加锁基本封锁类型排它锁(Exclusive Locks,简记为X锁)只允许T读取和修改A共享锁(Share Locks,简记为S锁)其他事务可以读A两段锁协议指所有事务必须分两个阶段对数据项加锁和解锁27.数据安全性是指保护数据库以防止不合法用户的使用所造成的数据泄露、更改或破坏。
基本的数据安全控制措施。
数据库安全性控制的常用方法用户标识和鉴定存取控制视图审计密码存储28.数据库的完整性是指数据的正确性和相容性。
完整性约束涉及的对象及其状态。