当前位置:文档之家› 基于SDD-1算法的分布式数据库查询优化策略的研究

基于SDD-1算法的分布式数据库查询优化策略的研究

Li t o a Er
(c n mi & n g m n ol eo n u,ee 2 0 5 ,hn ) E 0 o c Ma a e e t lg f h i fi 3 0 9C ia s C e A H
Absr tDitiutd d tba es se sde l t n nc e s oto w o t n n o t ac : srb e a a s y tm ha atwih a d i r a eal fne c n e ta d c mplxt e a eofd srb to e iy b c us iti u in a rdu d nc f r aa iti td O n q ieS nd e n a y o d t d srbu e t i ur ,O t q r s a e y e m s he uey t tg s e patc lry mpo tn . i tx ito c t r ri ua l i ra tTh s e t nr du e d he c a a trsi so uey sr tgywhihba e nt eSDD— l o ih a d d sus edee t n mpr v n eh s h r ceitc fq r tae c s d o h Iag rt m n ic st f a d i h a o i gm tod .
c s )1 ot
B + B — J {e o e S r m B } S 一 S S r m v J f o S E + E + J {p e d S o e e u J n s r t g ) S 一 S S a p n J t c t o t a e y
中图分类号:T 31 P 1
文献标识码 :A
文章编号:10— 59( 00 6 03 — 1 0 7 9 9 2 1 )1— 04 0
T eDi rb tdDaa aeQu r t z t n h s iue tb s eyOpi ai t mi o
e r h o DD- g rt m 1Al o i h
摘 要 :分 布式数 据 库 系统 由于数 据 的分 布和 冗余 使得 分 布 式查询 处理 增加 了许 多新 的 内容 和 复 杂性 ,因此分 布式 查 询 处理 的 策略 显得 尤为 重要 。本 文介 绍 了基 于 S D一 D 1算法 的查 询 策略 的特 点 ,并提 出存 在 的 问题 及 改进 方 法。 关键 词 :分布 式数 据库 ;查 询策 略 ;S D~ 算 法 D 1

S  ̄m s — e e i i l( S) S : e i i nwihm x( e e i J o t b n f c a B { J s m j o t a b n f t
— —
资源 尽量 地少 ,从而 降低整个 系统 开销 。针对 查询 响应时 间优化 策 略的 目 是尽量 减少 查询 的响应 时间 ,而 不计 较系统 资源 的耗 费。 标 查询 优化有 两种基 本方法 :第 一是查 询转化 ,即以不 同的顺序 执 行关系 操作 ,如连 接和投 影操 作 ;第二 是查询 映射 ,即使 用一 系 列 高效 的算法来 存取各 种设 备和实现 关系 操作 。即查 询映射 是针对
Ke wo d : s iue aa ae eysrtg ;DD— loi m y r sDitb tdd tb s ; r tae yS r Qu lag rh t
分布 式 数据 库 系统 是 数据 库 系统 与计 算机 网络 系统 结合 的产 物 ,具有 数据独 立性 、集 中与 自制相结合 的控制 机制 、存在适 当的 数据冗余 度 、事 务管理 的分布性 等特点 。在分布 式数据库 系统 中, 数据独立 性除 了数 据 的逻 辑独立 性与物理 独立性 外 ,还有 数据分 布 透明性 。数据分布 透 明性 指用户 不必关心 数据是 如何被逻 辑分片 的 ( 数据分 片透 明性 ),不 必关心数 据及其 片段是 否被复制 及复制 副 本的个数 ( 数据 复制透 明性 ),也不必关 心数据 及其片段 的物理 位 置分布的 细节 ( 据位置透 明性 ),同时 也不必 关心局部场 地上 数 数 据 库支持 哪种数据 模型 。有 了分布 透明性 ,用 户 的查询程 序书写起 来就 如 同数据 没有分布 一样 ,使 系统使用 起来更 简单 、有 效 。 分布 式查 询策 略 的基 本特 点 在 分布 式 查询 处理 技 术 中 ,查询 策略 的基 本 类型 通 常包 括 两 类 :针 对查询执 行代 价的策 略和针 对查询 响应 时间 的策略 。针对 查 询 执 行时 间代 价进 行 优化 策 略 的 目标 是使 查 询执 行所 使 用 的系 统
一 ...— —
3 . 4.— . —
p c si ro es ng Bs 一 <
F r a h sm jo J n O o o e c e i i n S i G d i o t (J <e e i (J te f c s s ) b nf t S ) h n
B ( B J S 一 SuS
e —i nd f e —f nd or w 1 B hi e s≠ b i eg n d o
但 是, D 一算 法存 在 一个严 重 问题 , 就 是它 的算 法 的复杂 8D1 那 性 。当元 组数 目很大 时 ,进 行查 询搜 索 的代 价迅 速增 加 ,使 系统
关 系的存 取方法 和操作 的执行 算法进 行决 策 , 查询 转化则 是针 对 无法 承受 。为此 ,我 们在 此 基础 上对 它进 行 改进 ,降低 它 的时 间 而 操作 执行 的顺序 及不 同站点之 间数据 流动 的顺序 进行 决策 。 复杂 度 。我们 提 出 的改进 算 法描 述如 下 :假 设 已经建 立 执行 策略 二 、S D 1 D 一 算法 E ,有益 半连 接存 储表 B表 。 s s SD1 D 一 算法 由两 部分 组成 :基本 算法 和 后优 化 。 本算 法是 根 基 ( )置 E 为空 ,读 取 并行参 数值 P 一 s ; ( )计 算所 有 的有益 半连 接 并加 入B 表 中 ; 二 s 据评 估所 缩 减程 序 的费用 ,效率 ,收益估 算 等几 个 因 素, 给 出全 部 的半连 接 缩减 程序 集 ,决 定一 个最 有 益 的执 行策 略 。主 要包 括 ( ) 择最 有 益半 连接 X 比x '范 围内 的有益 半连 接 , 三 选 和 dP 若 三个 基本 步骤 :( ) 始化 :已准 备好 从查 询数 转 换的 优化 模 型 , 这 些有 益 半连 接涉 及 到 的关 系有 重复 者 ,则 去掉 其 中较 小 的有益 1初 且所 有关 系 已完 成局 部缩 减 。 ( )优 化 :根据 初 始条 件 ,构造 可 半 连接 ,将 最 终得 到 的有 益半连 接 从B 表 中删 除并 加入E 中; 2 s s 能 的半连 接 缩减 程序 :按 半 连接 缩减 程序 的静态 特 性表 , 分别 计 ( )判 断E 是 否包 含所 有 有益 半连 接 ,是 则输 出此 执行 策 四 s 算其代 价和 产 生 的益 处 , 其 中选 取一 个 半连接 程 序 ,设为 s 从 ;以 略 ,否 则执 行 下一 步 ; s 成 缩减 以后 ,又 用 重新 产 生 的 一组 新 的 静态 特 性表 再 进 行 计 完 ( )调 整统 计数 据 ; 五 算 ,再从 其 中选取 一 个合 适 的半连 接 程序 ,但每 一个 都只 做 一次 ; ( )转 到第 ( )步 。 六 二 循 环下 去 ,直到 没有 半连 接缩 减程 序 为止 。 ( )结束 :以最 后 一 3 三 、结 束 语 次缩减 关 系 的静态 特 性表 为基 础 ,进 行 费用 计算 ,选 择场 地 。 后 经过 实验 验证, 用改进 的SD 1 采 D一算法对 多关系查询进行优化后 , 优 化是 将基 本 算法 得 到的解 进行 修 正 , 已得 到更合 理 的执 行 策略 。 不但减少 了通信代价 ,而且提高 了查询执行 的并行能力 。 以当查询 所 包 括 两种 修正 ,一种 是如 果最 后 一次 半连 接 程序 缩减 关 系 的所 在 涉及 到的连接个数较 多时 ,应用 改进的SD 1 D一算法 ,通过在优化过程 场 地恰 好 是被 选 中的执 行场 地 , 则最 后一 次 半连 接 可 以取 消 。 另 中添加并行参数 ,能很 好的提高 了SD l D—算法 的并行执行 能力 。 种 修正 是在 基 本算 法 的流程 图进行 修正 ,因为 某 一个 半连 接 缩 参 考文 献 : 减程 序 的代价 可能 很高 ,就 必 须修 正半 连接 的操作序 。 [ 解飞 , 丽 , 宁. 于数 据 立 方体 的 关联规 则挖 掘 方 法研 1 】 唐培 魏 基 算法 :S D 卜Q A D 一 O 究【 . J 气象水 文 海洋仪 器,0 81 】 20, i p t G q e yg a hwi hn r l t o s s a i t c o n u :Q : u r r p t e a i n ; t t s i s f r [ 于红 , 秀坤. 于值 的分 布式 查询 优化 算 法 [. 2 】 王 基 J 大连 理 工大 】 e ch r a o a el ti n 学学报 , 0 , 2 5 0 3

o p ut ut: ES: e c ti n t at g xe u O s r e y be n gi
E 一 1 e l o e a i I ( G s o a — p r t Ol Q ) S
m odi y st ri t CS t r l t t e e f t o lo a f a s i o ef ec h f ec f cl
计算机光盘软件与应用
工程技术
C m u e D S f w r n p lc t o s o p t r C o ta ea dA p i a i n
21 0 0年第 1 6期
基于 S D 1 D 一 算法的分布式数据库查询优化策略的研究
相关主题