当前位置:文档之家› 参考资料:数据库设计步骤知识

参考资料:数据库设计步骤知识


(2)聚簇存取方法选择
选取方法:首先确定聚簇关系组,即确定需要多少个聚簇,每 个聚簇中包含哪些关系。 聚簇关系组的确定规则:
① 经常在一起进行连接操作的关系可作为聚簇关系组,连接 属性作为聚簇键; ② 如一关系的一组属性经常出现在相等比较条件中,则该单 个关系可作为聚簇关系组,该组属性作为聚簇键; ③ 如一关系的一个/组属性上的实例值重复率很高,则此单 个关系可作为聚簇关系组,该组属性作为聚簇键。
7.5 数据库物理设计
设计任务:为每个关系模式选择合适的存储结构和存取路径, 即设计数据库的内模式,使得DB上的事务能高效运行。 设计步骤:① 分析影响物理设计的因素;② 为关系模式选择 存取方法;③ 设计关系、索引等DB文件的存储结构。
一.影响物理设计的因素
事务分析的好处:对数据库的事务的分析,可获得选择优化物 理设计策略所需要的参数,有助于存储结构和存储方法的选择。 应了解的常用的事务: ① 查询事务; ② 更新事务。以作为确 定关系存取方法的依据。
第6章 数据库设计
学习目的和要求
◆ 设计导论
◆ 需求分析
◆ 概念数据库设计 ◆ 逻辑数据库设计 ◆ 数据库物理设计
7.1 数据库应用设计导论
一.数据库应用设计问题
数据库设计基本任务:根据给定应用领域的信息需求、处理需 求和数据库支撑环境,设计出数据模式(包括外模式、逻辑/概念模 式、内模式)及典型应用程序。 信息需求:数据及其结构 ---- 静态要求。 处理需求:数据处理 ---- 动态要求。 数据库设计目标:为用户和各种应用系统提供高效(时间、空间) 的运行环境。 数据库设计考虑的内容: ① 计算机软硬件环境; ② DBMS能力; ③ 用户信息和处理要求; ④ 完整性和安全性约束。
二.数据库应用系统生命周期
生命周期分二个阶段: ① 设计阶段; ② 实现和操作阶段。 设计阶段: ① 需求分析; ③ 逻辑设计; 实现和操作阶段: ① DB实现; ② 操作与监督; ② 概念设计; ④ 物理设计。
数据库设计的特征:① 反复性(iterative);② 试探性 (tentative);③ 分步进行(multi-stage)。
Designed by Tao Hongcai 2013年12月17日 10
• 数据存储“学生登记表”可描述为: • 数据存储:学生登记表 • 说明:记录学生的基本信息 • 流入数据流:。。。。 • 流出数据流:。。。。 • 组成:。。。。 • 数据量:每年3000张 存储方式:随机存取 处理过程“分配宿舍”可描述为: • 处理过程:分配宿舍 • 说明:为所有新生分配宿舍 • 输入:学生,宿舍 • 输出:宿舍安排 • 处理:在新生报到后,为所有新生分配新生宿舍。要求同 一宿舍只能安排同一性别的学生,同一个学生只能安排在 一个宿舍中。每个学生的居住面积不小于3平方米。安排 新生宿舍其处理时间应不超过15分钟。
• 数据字典有助于这些数据的进一步管理和控制, 为设计人员和数据库管理员在数据库设计,实现 和运行阶段控制有关数据提供依据。 • 以学生学籍管理子系统为例,数据项描述如下: • 数据项:学号 • 含义说明:唯一标识每个学生 • 别名:学生编号 • 类型:字符型 • 长度:8 • 取值范围:0000000至9999999 • 取值含义:前两位标识该学生所在年级,后六位 按顺序编号与其他数据项的逻辑关系
Designed by Tao Hongcai 2013年12月或保留的地方, 也是数据流的来源和去向之一。 • 数据存储描述={数据存储名,说明,编号, 流入的数据流,流出的数据流,组成:{数 据结构},数据量,存储方式} • 5处理过程:数据字典中只需描述处理过程 的说明性信息。 • 处理过程描述={处理过程名,说明,输 入:{数据流},输出:{数据流},处理:{简要 说明}} • 注意:数据字典是关于数据库中数据的描 述,即元数据,而不是数据本身,数据本 身将存放在物理数据库中,由DBMS管理。 8 Designed by Tao Hongcai 2013年12月17日
Designed by Tao Hongcai
2013年12月17日
20
注意:不同的DBMS提供的磁盘空间管理策略差别较大,在磁 盘上存储关系、索引和聚簇的方法也不同。
参数选择:对具体的DBMS,其物理存储结构的设计主要集中 在一些参数值的选择上。
DBMS产品一般都提供一些存储分配参数,供设计人员和DBA对数据库进行物 理优化。初始情况下,系统都为这些变量赋予了合理的缺省值。但是这些值不一 定适合每一种应用环境。在进行物理设计时,需要重新对这些变量赋值以改善系 统的性能。 通常情况下,这些配置变量包括:同时使用数据库的用户数,同时打开的数据库 对象数,使用的缓冲区长度、个数,时间片大小、数据库大小等等,这些参数值 影响存取时间和存储空间的分配,在物理设计时,就要根据应用环境确定这些参 数值,以使系统性能最优。
三.数据库设计过程
前二个步骤的分析与设计:可独立于任何具体的DBMS进 行。 后二个步骤的设计:与具体的DBMS密切相关。
需求分析结果:需求分析说明书; 概念设计结果:概念数据库模式(高级数据模型);
逻辑设计结果:逻辑数据库模式(特定数据模型); 物理设计结果:物理数据库模式(特定的物理存储结构和 存取方法)。
视图综合设计方法分两个阶段:① 视图设计阶段;② 视图合 并阶段。
视图设计阶段:要根据每个应用的需求,为每个用户和应用设 计一个概念数据库模式。每个应用的概念数据库模式称为视图,可 以作为支持各种应用的外模式。
视图合并阶段:将所有视图有机地合并成为一个统一的概念数 据库模式。它支持所有的应用。
7.4 逻辑数据库设计
逻辑数据库设计的步骤: ① 形成初始关系数据库模式; ② 关系模式规范化; ③ 关系模式优化; ④ 定义关系上的完整性和安全性约束; ⑤ 外模式设计; ⑥ 性能调整。 数据库性能调整的措施: (1) 减少连接运算(开销大);
(2) 减少关系的大小和数据量; 方法:① 针对小范围快速查询,可将关系水平分割(全范围数 据分成小范围数据); ② 针对查询不多的属性,可并关系垂直分割 (分成多个关系)。
Designed by Tao Hongcai 2013年12月17日 11
7.3 概念数据库设计
可选用的概念数据模型:实体联系模型(Entity Relationship Model)、对象数据模型。 概念设计的基本步骤:
① 确定实体型及其属性和键; ② 确定实体型之间的联系及其相关的约束; ③ 使用演绎或归纳方法确定实体型之间的超类/子类联系及 其相关约束; ④ 确定实体型之间的范畴联系及其相关约束; ⑤ 形成概念数据库的EER图。 概念设计方法:① 集中式设计方法;② 视图综合(或集成)设计 方法。 集中式设计方法分两步:① 合并在需求分析阶段得到的各种应 用的需求;② 在此基础上,设计一个概念数据库模式,满足所有应 用的要求。
7.2 需求分析
需求分析的任务:调查应用领域,对应用领域中各应用的信息 要求和操作要求进行详细分析,形成需求分析说明书。 需求分析的目标:给出应用领域中数据项、数据项之间的关系 和数据操作任务的详细定义,为其后的设计奠定基础,也为优化数 据库的逻辑结构和物理结构提供依据。 需求分析的步骤:
① 应用领域的调查分析(包括组织结构、业务流程和数据流程, 调查计划安排、调查方法制定); ② 定义数据库支持的信息与应用; ③ 定义数据库操作任务; ④ 定义数据项字典; ⑤ 预测应用领域的未来改变(包括尚未规范的应用、现有应用 可能的变化以及因此对DB的影响)。
对查询事务,应了解:
① 查询的关系; ② 查询条件所涉及的属性;
③ 连接条件所涉及的属性;
④ 查询的投影属性。
对更新事务,应了解: ① 被更新的关系; ② 每个关系上的更新操作的类型; ③ 删除和修改操作条件所涉及的属性; ④ 修改操作要改变的属性值。 其他应了解的因素:事务在各关系上运行的频率、事务要求的 时间性能等,都对存取方法的选择具有重大影响。
逻辑数据库设计的任务:将概念数据库设计阶段产生的概 念数据库模式变换为逻辑数据库模式。
逻辑数据库的设计依赖于:逻辑数据模型和数据库管理系 统。 逻辑数据库设计的目标: ① 满足用户的完整性和安全性要求; ② 动态关系至少为第三范式形式,静态关系至少为第 一范式的形式; ③ 能够在逻辑级上高效率地支持各种数据库事务的运 行; ④ 存储空间利用率高。
取消候选聚簇关系组中不必要的关系的规则: ① 从聚簇组中删除经常进行全关系扫描的关系; ② 从聚簇组中删除更新操作远大于连接操作的关系。
四.物理存储结构的设计
目的:确定如何在磁盘上存储关系、索引和聚簇,使得空间利 用率最大化,数据操作引起的系统开销最小化。
• 为了提高系统性能,数据应该根据应用情况将易变部分与 稳定部分、经常存取部分和存取频率较低部分分开存放。 • 例如,数据库数据备份,日志文件备份等由于只在故障恢 复时才使用,而且数据量很大,可以考虑存放在磁带上。 目前许多计算机都有多个磁盘,因此进行物理设计时可以 考虑将表和索引分别放在不同磁盘上,在查询时,由于两 个磁盘驱动器分别在工作,因而可以保证物理读写速度比 较快。也可以将比较大的表分别放在两个磁盘上,以加快 存取速度,这在多用户环境下特别有效。此外,还可以将 日志文件与数据库对象(表、索引等)放在不同的磁盘, 以改进系统的性能。
Designed by Tao Hongcai 2013年12月17日 9
“学生”是该系统中一个核心数据结构,它可以描述 为: 数据结构:学生 含义说明:是学籍管理子系统的主体数据结构,定 义了一个学生的有关信息 组成:学号,姓名,性别,年龄,所在系,年级 数据流“体检结果”可描述为: 数据流:体检结果 说明:学生参加体检检查的最终结果 数据流来源:体检 数据流去向:批准 组成:。。。。。 平均流量:。。。。。 高峰期流量:。。。。。
Designed by Tao Hongcai 2013年12月17日 6
相关主题