当前位置:文档之家› 数据库技术复习资料

数据库技术复习资料

1.与网状和层次数据库相比,关系数据库有哪些优点?与层次和网状模型比较,关系模型有下列优点:数据结构单一;建立在严格的数学概念基础上;将数据定义和数据操纵统一在一种语言中,使用方便,易学易用。

2.试述关系模型的完整性规则实体完整性:关系中键属性的值不能取空值。

参照完整性:是关系间引用所遵循的规则,与外键有关。

用户定义的完整性:数据间应满足的语义约束关系,由用户定义,由系统检查。

3.试述等值连接与自然连接的区别和联系等值连接表示为R A=BS,自然连接表示为R S;自然连接是除去重复属性的等值连接。

两者之间的区别和联系如下:1、自然连接一定是等值连接,但等值连接不一定是自然连接。

等值连接不把重复的属性除去;而自然连接要把重复的属性除去。

2、等值连接要求相等的分量,不一定是公共属性;而自然连接要求相等的分量必须是公共属性。

3等值连接不把重复的属性除去;而自然连接要把重复的属性除去。

4.函数依赖、部分依赖、完全依赖、传递依赖、平凡依赖5.函数依赖公理和推论Armstrong公理(三个公理):设r是R(U)上的一个关系,X、Y、Z、W U。

A1. 自反律: 若Y X U, 则 X→Y;A2. 增广律: 若X→Y且Z U,则 XZ→YZ;A3. 传递律: 若X→Y, Y→Z,则 X→Z.有以上三个公理,可以推出以下3个推论:推论1(合成规则):若X→Y,X→Z,则X→YZ推论2(分解规则):若X→Y且Z Y,则X→Z推论3(伪传递规则)若X→Y,YZ→W,则XZ→W。

6.函数依赖的覆盖和等价对于在模式R上的函数依赖集F和G,如果对G中的每一个函数依赖X→Y,都有F|=X→Y,称F是G的一个覆盖。

把逻辑蕴含符号引入函数依赖集的覆盖中,记为:F|= G定义(等价和覆盖)在模式R上的FDs F和G,若F+=G+,则称F和G等价。

记作F G。

定理:已知模式R上的函数依赖集 F和G。

当且仅当 F|=G 且 G|=F ,则 F G。

1.试述数据库设计过程,及每个阶段的任务。

数据库的设计可分为以下六个阶段:需求分析、概念设计、逻辑设计、物理设计、实施和运行、使用和维护。

需求分析:信息需求、处理需求、安全性和完整性方面的需求。

概念设计:在需求分析的基础上,通过对用户需求进行分析、归纳、抽象,形成一个独立于具体DBMS和计算机硬件结构的整体概念结构,常用工具用ER模型。

逻辑设计:在概念结构设计的基础上,在一定的原则指导下将概念模式(E-R图)转换为某个具体DBMS支持的数据模型相符合的、经过优化的逻辑结构,其中用对数据逻辑结构进行优化采用范式理论。

物理设计:为逻辑数据结构选取一个最适合应用环境的物理结构,包括存储结构和存取方法等。

数据库实施和运行:用DBMS提供的数据定义语言(DDL)和其它实用程序将数据库逻辑结构设计和物理设结构计结果用DDL严格描述出来,成为DBMS可以接受的源代码,再调试产生目标模式,最后将数据装入数据库。

数据库的使用和维护:收集和登记数据库运行的情况记录,用于评价并改善数据库系统的性能。

2.什么是数据库的逻辑结构设计?试述其设计步骤。

逻辑结构设计:把概念结构设计阶段设计好的基本E-R图转换为与选用DBMS产品所支持的数据模型相符合的逻辑结构。

逻辑结构设计的方法:1. 将概念结构转换为一般的关系、网状、层状模型;2. 将转换来的关系、网状、层状模型向特定DBMS支持下的数据模型转换;3. 对数据模型进行优化。

3.试述数据库物理设计的内容和步骤。

数据库的物理设计:为一个给定的逻辑数据模型选取一个最适合应用要求的物理结构的过程。

数据库物理设计的步骤:(1)确定数据库的物理结构,在关系数据库中主要指存取方法和储存结构。

(2)对物理结构进行评价,评价的重点是时间和空间效率。

4.数据库管理系统的主要功能有哪些?数据库管理系统是位于用户和操作系统之间的数据管理软件。

科学地组织和存储数据、高效地获取和维护数据,用户使用的各种数据库命令以及应用程序的执行,最终都是DBMS来实现的。

DBMS 的主要功能包括: (1) 数据库定义;(2) 数据操纵 (3) 数据库控制;(4) 数据库维护5.数据库管理系统有哪几部分组成?DBMS的组成如下:(1)数据和元数据存储(2)存储管理器(3)查询处理器(4)事务管理器(5) 输入模块---模式修改、查询和修改6.开发一个数据库管理系统的主要技术难点在哪里?对中国如何尽快开发自己的数据库管理系统,给出你的建议。

1.分布式数据库的有哪些特点?分布式数据库系统的特点1. 数据是分布的2. 数据是逻辑相关的3. 结点自治性2.分布式数据库管理系统有哪几部分组成?分布式数据库管理系统的组成1.局部数据库管理系统(LDBMS)2.全局数据库管理系统(GDBMS)3.全局数据字典GDD4.网络通信管理CM3.分布式数据库系统能够提供哪些分布透明性?不同透明性对应用程序的编程有什么影响?分片透明性:关系如何分片对用户是透明的,指用户不必关心数据是如何分片的。

其应用程序的编写与集中式数据库相同。

位置透明性 (较常用):用户需知道数据在哪个片段,而不必知道所操作的数据放在哪个节点。

数据在结点间的转移不会影响应用程序。

局部映象透明性:该透明性提供数据到局部数据库的映象。

在编程时不但需要了解全局关系的分片模式,还需要了解各片段存放的站点。

无透明性4.半连接在分布式查询优化中的作用?会计算简单的半连接。

5.试述事务的概念及事务的4 个特性。

事务(Transaction):是用户定义的一个数据库操作序列,是数据恢复和并发控制的基本单位,数据库系统在执行事务时,要么执行事务中全部操作,要么一个操作都不执行。

一般用Ti表示第i个事务。

原子性(Atomic):一个事务要么全执行,要么全不执行。

一致性(Consistency):事务执行的结果必须是使数据库从一个一致状态变到另一个一致性状态。

隔离性(Isolation):事务更新过的数据在事务结束前对其他事务不可见。

持久性(Durability):已完成事务对数据的更新应持久,发生故障应恢复。

6.在数据库管理系统中为什么要采用并发控制技术?常用并发控制技术有哪些?DBMS对事务采用并发机制的主要目的:(1)改善系统的资源利用率:对于一个事务来说,在不同阶段使用不同的资源,若并发执行可以交叉使用这些资源,有利于提高系统资源的利用率。

(2)改善短事务的响应时间:若设有两个事务T1 和T2,其中T1是长事务,交付系统在先;T2是短事务,交付系统比T1稍后。

如果串行执行,则须等T1执行完毕后才能执行T2。

而T2的响应时间会很长。

一个长事务的响应时间长一些还可以得到用户的理解,而一个短事务的响应时间过长,用户一般难以接受。

如果T1 和T2并发执行,则T2可以和T1重叠执行,可以较快地结束,明显地改善其响应时间.DBMS对事务采用并发机制的方法:基于封锁的方法、基于时戳的方法、版本更新方法。

其中封锁方法在商业化数据库管理技术中使用最为普遍。

7.什么是两段封锁协议?二段锁协议(Two-Puase Looking 2PL协议)(1). 任何事务在对数据操作前必须先获得锁;(2). 事务在释放一个锁后不再获得任何锁。

第一阶段是获得封锁,也称为扩展阶段。

在这阶段,事务可以申请获得任何数据项上的任何类型的锁,但是不能释放任何锁。

第二阶段是释放封锁,也称为收缩阶段。

在这阶段,事务可以释放任何数据项上的任何类型的锁,但是不能再申请任何锁。

8.数据库恢复的基本技术有哪些?事务恢复的目的是当数据库出现故障时能恢复到一个正确一致的状态。

集中式数据库系统中恢复的手段主要是利用转储和日志。

转储:数据库管理员定期将整个数据库复制到磁带或另一个磁盘上保存起来的过程。

日志:保存每一次对数据库进行更新操作的有关信息的文件,由DBMS自动建立和记录。

9.什么是日志文件?为什么要设立日志文件?日志文件的主要内容:(1).事务处理的标识符(开始、结束);(2).操作的类型(插入、删除、修改);(3).更新前的值;(4).更新后的值.10.数据库运行中可能产生的故障有哪几类?故障种类:事务故障、系统故障、介质故障。

⑴事务故障:由于某种原因导致事务尚未运行完成并提交就被中断所产生的故障。

比如:算术运算的溢出、零作除法、违反完整性等。

⑵系统故障:系统在运行过程中,由于某种原因致使所有正在运行的事务都以非正常的方式终止而引起的故障。

比如:硬件和软件故障、突然停电等。

⑶介质故障:系统在运行过程中,由于某种原因致使存储在外存储器中的数据部分丢失或全部丢失的故障。

11.试述实现数据库安全性控制的常用方法和技术。

用户鉴别、存取权限控制、视图机制、跟踪审查、数据加密存储12. 给出下列名次的含义对象、类、封装、继承、多态、对象标识、子类、超类。

对象属性集合描述对象的状态、组成和特征方法集合描述对象的行为特征消息集合是对象向外提供的界面,由对象接收和响应对象标识:每个对象都有一个内部标识符OID,OID在整个系统中是唯一的,一旦生成就不能改变。

封装:每个对象都是其状态和行为的封装体。

类:具有相同特征对象的集合;对象为类中的实例。

类本身看作对象,称为类对象。

面向对象数据库模式是类的集合,形成类层次结构一组相关类形成类层次结构子类、超类子类和超类间具有继承关系子类继承超类的属性和方法。

单继承和多继承解决同名冲突的方法:子类与超类间的同名冲突按子类优先处理;多个超类间的同名冲突,按说明超类的先后取第一个超类中的定义或规定继承的超类;提供显式方法: 从多个冲突的实例变量或方法中继承一个;继承多个,在类定义中重新命名。

多态性:同一操作有不同的实现,取决于具体对象。

13. 叙述面向对象模型中“对象标识”与关系模型中的“键”的相同点和不同点。

对象标识是指每个对象都有的一个内部标识符OID,OID在整个系统中是唯一的,一旦生成就不能改变。

而键是指在关系中能唯一标示元组的最小属性集。

它可以不止一个,可以是多个属性的组合。

它们的作用值相同的。

1.叙述key/value的数据结构。

key/value的数据结构:域(Domain)+数据项(Item) 域类似于传统关系数据库中的“表”,但域无结构,作用是容纳数据项;数据项用Key定义,一个域中的不同数据项可能具有不同的结构,数据属性全部是字符串类型,但在有些实现中,属性也可以具有简单的类型,如整型、字符串数组等。

2. Key/Value数据模式与关系数据库的比较有哪些优点和缺点?Key/Value的优点:–便于扩展,适于云计算的环境–与应用程序代码的兼容性更好Key/Value的缺点:–数据完整性约束转移至应用程序–目前的很多Key/Value数据存储系统之间不兼容–在云环境中,很多用户和应用使用同一个系统。

相关主题