当前位置:文档之家› 分布式数据库的系统结构

分布式数据库的系统结构

数据目录的分布策略
首先应注意,分布式数据库中数据的分 布 是 DBA(Data Base Administrator) 决定的;但目录的分布是由系统决定 的。数据目录的分布是DBMS设计问题, 不是分布式数据库设计所处理的问题。
因DDBMS结构不同,数据目录有如
下五种分布策略:
16
1、Centralized 集中式
4
❖2、全局事务一般用某种数据库操作语 言(DML,如SQL)表示。DDBMS首先对 其进行词法,语法分析,可解释(无 错误),将事务由DML形式转为内部表 示形式,如相应关系代数表达式或查 询语法树。
❖这时的语法树所表示的查询,还没有 考虑数据分布问题,即它是面向全局 数据库和全局关系的,故称全局查询 (global query)和全局查询语法树5 。
18
2、 Extended—centralized
扩展的集中式
❖开始与集中式目录一样,数据目录集中 存放在一个结点上。
❖其他结点从集中数据目录提取的数据目 录,用完后不丢弃,而是留做本结点的 局部目录,这样随数据库应用展开,各 结点逐步建立起自己的局部目录。
❖注意:集中目录所在结点管理目录,各 结点局部目录只是集中目录的部分复本。
7
6、这时实际上就把一个查询构成 的事务分解为一组相关联的子查 询构成的子事务。并将它们通过 网络发送相应结点,由各结点 LDBMS(Local database management system 局部数据库 管理系统)再对子查询语法树进 行优化,并完成查询。
8
❖ 一个事务,分解为一组相关子事 务,分别在相应结点上并行执行。但 DDBMS的分布式事务管理软件,必须 对它们进行全程管理和监控。
❖因为一个事务虽然被分解成一组子事 务,由各自相应结点执行,但仍须保 证全局事务在并发和故障情况下,遵 守ACID准则。
❖因为一般还会有另外的并发分布执行 的事务,为此DDBMS的分布式事务管 理程序,必须对它们进行管理与控制。
9
由上述可以看出,DDBMS中要 解决的主要问题有: ❖1. 分布式数据目录 ❖2. 查询的分解和优化 ❖3. 分布式并发控制 ❖4. 分布式恢复问题
❖例如,数据分布信息每个结点都要用 到,可以全重复。其他目录数据只保 留在有关结点上。可考虑把更新频繁 的统计数据录的全复 本,读数据目录时均可在本地。
❖更新数据目录则要所有结点的目录均 同步更新。尤其是查询优化用的统计 数据更新频繁,如关系中的元组个数 等,开销很大。
❖只用于结点不多的小系统。
21
4、 Partially replicated
部分重复式
❖有些目录数据全重复,有些目录数据 只在有关结点保留一份,哪些目录全 重复,哪些目录是局部的决定于策略。
❖数据目录只有一份,存于一个结点, 所有结点都要通过该结点访问数据目 录。
❖特点:管理简单;缺点:数据目录是 频繁访问的对象,通信开销大,容易 形成系统瓶颈,效率下降。
17
❖注意管理集中目录的计算机工作 方式是文件服务器而非c/s方式。
❖目录结点出现故障,或与其通信 出现中断时,全系统瘫痪。大型 复杂的分布式系统不能采用。
❖3.分布式并发控制。
❖ Distributed concurrency control
❖4、分布式恢复问题。
❖ Distributed recover problems
❖本章将讨论上述问题
13
§2.1 distribution and management of datalog
(directory)
❖3、DDBMS从全局查询语法树分析出 事务所涉及的数据及操作。
❖4、调入相应数据目录,分析这些 数据的分布,(包括复本分布)及 访问权限和限制,并检查越权事件, 如有,拒绝执行并通知应用程序 (返回状态字)。
6
❖ 5、通过权限审查后,根据查询策略, 如:如何选用复本,如何进行分布式 数据的连接,如何减少通信开销等策 略,进行分布式查询优化并据此将全 局查询(语法树),分解成有关结点 上的子查询(语法树)。
10
❖END
11
chapter 2
distributed database management system
12
❖DDBMS中主要问题是:
❖1、分布式数据目录的管理。
❖ Distribution and management of datalog
❖2、分布式查询分解和优化。
❖ Distributed query fragmentation and optimization
14
❖分布式数据库的数据目录,内容与 集中式数据库数据目录基本相同, 但除集中式数据库数据目录内容之 外,还要增加数据分布信息:如数 据分割及分割定义,裂片分布,复 本数目及它们所在结点等。
❖分布式数据库中,为提高效率,一 般数据目录也是分布的,于是就产 生了数据目录的分布策略及管理问 题。
15
一.Distribution tactics for datalog
19
❖为保持一致,集中目录所在结点必须 跟踪记载各结点拥有复本,当集中式 数据目录更新时,通知其所有复本同 步更新。(复本可能很多,如关于数 据分布的目录)
❖这样建立的子目录针对应用强,利用
率可望较高,可部分克服集中数据目
录引起的通信开销及性能瓶颈形成的
缺点。
20
3、 Fully replicated
式数据库管理软件(DDBMS)复本。 ❖ 3、
3
❖上图只画了I结点。
❖每个结点均有一个DDBMS复本和自己 的局部DBMS软件。除LDBMS外其他功 能均属于分布式数据库管理范畴。
❖以结点I为例讨论其工作过程:
1、应用程序经用户接口的预处理 程序,提取出有关数据访问部分, 每一次数据库访问,作为一个全局 事务,交由DDBMS执行。
分布式数据库的系统结构,可分 为两类:
❖ 物理上分布,逻辑上集中。
❖ 物理与逻辑上都分布。
第一种比较成熟,也比较基本,所 以我们以物理上分布,逻辑上集中类 型的分布式数据库系统为主,介绍分 布式数据库系统的一些基本原理和结 构。物理上分布,逻辑上集中的 DDBMS体系结构如下图:
1
2
❖注意: ❖ 1、 2、每个结点都有LDBMS和分布
相关主题