当前位置:文档之家› 数据库物理结构设计

数据库物理结构设计


6.3 设计存储结构
? 存储结构设计的内容:存储的关系模式;关系模式的数据项; 数据项的类型,宽度,是否主键,是否外键,是否索引键等。
? 【例6.8】:如果关系R(R1,…,R6,R7,…,R20),包含20个属性, 但是前6个属性的利用率非常高,而其它属性的利用率非常低, 则存储时可以按照R(R1,…,R6),S(R7,…,R20)两个关系进 行存储(即:垂直分割),并通过逻辑模式/存储模式映像作 相应的调整。
? 存储位置设计的基本原则: 1)同一类文件存放在同一个目录。 2)易变部分与稳定部分应该分开存放。 3)存取频率高的部分和低的部分应该分别存放到快速和慢速设备。
例如:对于多磁盘计算机系统,为了提高系统性能,可以采用如下方案: 方案1:把数据表和索引文件放在不同的磁盘上,使多磁盘并行工作。 方案2:把大数据表分别放在不同的磁盘上,提高数据的存取速度。 方案3:把日志文件和数据库分别放在不同磁盘上,使多磁盘并行工作。 方案4:把数据库放在高速磁盘;把备份(即后备副本)放在磁带。 例如:例 6.8的 R(R1, …, R6)存入高速磁盘, S(R7,… ,R20 )存入光盘。 4)根据应用系统的文件类型和应用需求,统一设计文件目录结构。统一考虑 存取时间、存储空间、维护费用等,对数据文件进行合里安排。
聚簇索引(了解)
使用聚簇索引注意: (1)经常进行连接操作的数据表建议使用聚簇索引。 (2)对于属性组的利用率很高或者重复率很高的关系建议使用
聚簇索引。 (3)需要经常进行插入、删除或修改等更新操作,不建议使用
聚簇索引。 (4)对于更新操作远多于连接操作的关系不建议使用聚簇索引。
温馨提示:聚簇索引虽然可以提高某些应用的性能,但是会改 变数据的物理存储位置,而且会导致数据表的原有索引无效, 同时维护费用很大,因此需要谨慎使用。
节点,其指针指向对应的元组或者数据块。 3)一个数据表只能有一个聚簇索引;非聚簇索引则可有多个。 4)建立和维护非聚簇索引的开销相对较小,而聚簇索引的开销则相当大。 5)聚簇索引适合于不需要更新或者更新比较少的应用,非聚簇索引则适合于更
新比较多的应用。 6)聚簇索引灵活性较差不建议经常适应,非聚簇索引性则相对比较灵活。
所确定的数据项的存储类型和长度以及元组的存储结构等 即:数据文件及其数据项在介质上的具体存储结构。 (3)存放位置:指根数据库文件和索引文件等在介质上的具体存储位置。 (4)存储介质:指用于存储文件的物理存储设备。 包括:磁盘、磁带、光盘、磁盘阵列、磁带库、光盘阵列等。 具体包括:介质的容量大小、存取速度与费用等。
? 思考题:如果关系R(R1,…,R6,R7,…,R20),包含60万个元组, 但是前6万个元组的利用率非常高,而其它元组的利用率非常 低,则应该如何设计存储结构。
温馨提示:建立两个同结构关系(即:水平分割)。
6.4 确定存储位置
? DBMS提供了数据库、索引文件、聚日志文件、备份文件等文件的默认文件 目录结构及其存储路径。为提高系统性能,需要进一步设计存放。 例如:SQL 2005的数据库,可以设置数据库和日志文件的存储路径等。
数据库技术
● 讲授1学时
电子教案 版本6.6
●内容概述
6.1 物理结构设计的内容 6.2 选取存取方法 6.3 设计存储结构 6.4 确定存储位置 6.5 选取存储介质 6.6 评价物理结构 6.7 SQL Server 2005 的索引机制
教学进程
6.1 物理结构设计的内容
? 物理结构:指数据库在存储介质上的存取方法、存储结构和存放位置。 ? 物理结构设计:指根据逻辑结构设计的结果,设计逻辑结构的最佳存取方
物理结构设计的方法:
(1)选择存取方法。 (2)设计存储结构。 (3)确定存放位置。 (4)选取存储介质。 (5)评价物理结构。
结论: 通过存取方法、存储结构、存放位置以及存储介质的合理设计,
最终为逻辑模式设计出满足应用需求的最佳存储模式。
6.2 选择存取方法
? 实现数据库快速访问的最有效方法是使用索引机制。
? 例如:一本字典是由字典正文和字典索引连部分组成。字典索引相当于索 引表,字典正文相当于数据表。字典索引和字典正文一起配合使用实现查 询字的用法。具体查询过程如下: (1)首先在字典索引中,查询字在字典中的页码。 (2)然后按照页码,字典正文中找到该字的用法。
? 思考题1:对于任意数据表,使用索引机制进行检索与不使用索引机制而 直接对数据表进行检索相比,是否前者一定比后者快?
? 聚簇索引:指在按照关键属性对数据表建立索引时,同时按照索引顺序对数 据表的相应元组的物理存储位置进行排序,使索引的顺序与数据表中相应元 组的物理顺序始终保持一致的索引过程。
? 聚簇索引与非聚簇索引的区别: 1)聚簇索引的顺序与数据的物理存储顺序始终保持一致;非聚簇索引的顺序与
数据物理排列顺序无关。 2)聚簇索引B+树的叶节点就是数据节点;非聚簇索引B+树的叶节点仍然是索引
? 思考题2:在什么情况下,使用索引机制可以进行快速检索? ? 常用的存取方法括:
平衡树(Balance Tree,B树)、聚簇(Cluster)和散列索引。 其中:B树索引是最常用的存取方法,具体操作见数据结构。
聚簇索引(了解)
? 聚簇:指根据索引关键属性的值直接找到数据的物理存储位置,从而达到快 速检索数据的目的,提高检索的效率。
? 索引机制是指对于数据库的数据表,根据数据表的查询需要, 按照查询数据所对应的关键属性,为数据表建立相应的用于 快速检索的索引文件,在执行查询操作时,先在索引文件中 找到查询的元组在数据表中位置(地址),然后再根据这个 地址,去数据表中直接取出元组数据。这种先查询索引文件, 再从数据表中取值的检索机制称为索引机制。
法、存储结构和存放位置以及合理选择存储介质等,从而设计出适合逻辑方法、设计存储结构、确定存放位置以及 选择存储介质等,因素包括:访问类型、访问时间、插入时间、删除时间 和空间开销等。 (1)存取方法:指用户存取数据库数据的方法和技术。 (2)存储结构:指根据逻辑结构的指标以及DBMS支持的数据类型,
? 索引表是指把关键属性(例如:主键)的值按照升序(或者 降序)排序后,与它对应的元组在数据表中的位置所组成的 对照表。即:索引表是索引属性值与元组地址的对照表。
? 索引文件用于存储索引表的文件。 ? 温馨提示:索引文件需要配合数据文件一起使用,才能进行
快速检索,因此索引文件单独使用没有意义。
6.2 选择存取方法
相关主题