当前位置:
文档之家› 大数据环境下的数据迁移技术研究
大数据环境下的数据迁移技术研究
当前 大数 据 环 境 和信 息 技 术 快 速 发展 情 况 下 , 海 量 数 据 迁 移 是 企 业 解 决 存 储 空 间 不足 、新 老 系 统切 换 和 信 息 系统 升 级 改 造 等
过程 中必 须面对的一个现实 问题 。如何在业务 约束 条件 下,快速、正确、完整地 实现海量数据 迁移 ,保 障数据 的完整性、一
Da t a Mi g r a t i o n Te c h no l o g y Re s e a r c h Ba s e d o n Bi g Da t a Env i r o nm e nt
Wa ng Ga n g , W a ng Do ng ‘ Li W e n ’ , Li Gua ng ya
0 引言
数据 一直是信息系统 的基础和核心 。一方面,随着企 业 业 务 的 发展 ,信 息 系 统 覆 盖 面 的 扩 大 , 管理和服务精细化 层 度 的深 入 ,集 中 式 的 管 理 信 息 系 统 正 在 不 断 应 运 而 生 , 各 行 各 业 都 先 后 出现 了规 模庞 大 的 数据 中 心 。 这 些 数 据 中心 经 过 一 段 时 间 的运 行 ,其 数 据 量 正 成 几 何 级 增 长 , 有 的甚 至 可 以达 到 T B级或 P B 级 。 另 一 方 面 ,新 的技 术 架 构 和 业 务 操 作 对 性 能指 标 提 出 了 更 高 的 要求 , 而这些要求往往需要通过 软 件 升 级 或 者 硬 件 更 新 的方 式来 实现 , 因而 在 新 老 系 统 的切 换 或 升 级 改造 过 程 中 , 势 必 会 面 临 一 个 现 实 问题 一 一数 据 迁 移 。吕帅 …等 人 从 分 级 存 储 管 理 的 角 度 提 出 了混 合 存 储 环 境 下 的数据价值评估模型和迁移过程控 制理 论, 提 出了数据价 值 的精确判 定。徐燕_ 2 等人利用编程基础实现 了异构数据库 系 统 间 的数 据 迁 移 ,提 出 了数 据 迁 移 的抽 取 、转 换和 载 入 3 个 过 程 。李 酷 等 从 项 目管 理 和 方 法 论 角 度 描 述 了企 业 级 数 据 迁 移 的过 程 。张 玺 l 4 针 对 数 据 从 磁 盘 到 磁 带 的数 据 迁 移 问 题 ,提 出 了并 行 文 件 处 理 方 式 。丛 慧 刚 [ 5 1 等 人 ,从 元 数 据 角 度, 提 出了数据 迁移 中元数据 对映射模式体系 , 对采用源数 据驱动 E T L 引 擎 进 行 功 能 实 现 。 这 些 研 究 都 是 根 据 具 体 工 程 中数 据 迁 移 这 个 关 键 问题 进 行 了研 究 , 但 是 随 着 信 息 技 术
2 0 1 3年 第 3 0卷 第 5 期
大数据环境下 的数据迁移技 术研 究
王 刚 ,王 冬 ,李 文 ,李 光 亚
摘 要 :数据 是 信 息 系统 运 行 的 基础 和 核 心 ,是 机 构 稳 定发 展 的 宝贵 资 源 。随 着信 息 系统 数 据 量 成 几 何 级 数 增 加 ,特 别 是在
( 1 . I n f o r ma t i o n Ce n t e r o f S h a n g h a i Mu n i c i p a l Hu ma n Re s o u r c e s a n d S o c i a l S e c u it r y , S h a n g h a i 2 0 0 0 5 1 , Ch i n a ;
g e o me t r i c i n c r e a s e i n t h e a mo u n t o f d a t a g e n e r a t e d b y t h e i n f o r ma t i o n s y s t e m, e s p e c i a l l y i n t h e c a s e o f c u r r e n t d a t a e n v i r o n me n t a n d
Mi c r o c o mp u t e r A p p l i c a t i o n s V o 1 . 3 0 , N o . 5 , 2 0 1 3
文章编号 :1 0 0 7 . 7 5 7 X( 2 0 1 3 ) 0 5 . 0 0 0 1 . 电脑 应 用
2 . Wo n d e r s I n f o m a r i t o n Co . , L t d . , S h a n g h a i 2 0 1 1 1 2 , Ch i n a ;
3 . S h a n g h a i I n s t i t u t e o f F o r e i g n T r a d e , S h a n 曲a i 2 0 1 6 0 0 , C h i n a )
i n f or ma t i o n t e c h no l o gy. Th e ma s s i ve da t a mi gr a t i o n i s a r e a l p r ob l e m. W i t h t he bus i n e s s c o ns t r a i n t s , t h e ma s s i ve da t a mi gr a t i o n i s a k ey r e s e a r c h t op i c ,i n t hi s p a pe r ,f r o m t h e po i n t of v i e w of t he ma s s i ve da t a ma na g e me nt , el a b or a t e d a m as s i v e d at a mi gr a t i o n me — t h od ,a n d c ompa r e he t ch a r a c t e r i s t i c s of di f f e r e nt da t a mi gr a t i o n p r o g r a m. Ke y wor ds :Bi g Da t a; Da t a Mi g r a t i on; St o r a g e
致性 和 继 承性 , 是 一 个 关 键研 究课 题 。从 海 量 数 据 管 理 的 角度 ,阐述 了海 量 数 据 迁 移 方 法 ,比较 了不 同数据 迁移 的 方案 特 点 。 关键 词 : 大数 据 ;数据 迁 移 ;存 储 中 图 分类 号 :T P 3 9 1 文 献 标 志 码 :A
Abs t r ac t :Th e d a t a i s t h e c o r e r e s ou r c e of t h e i nf or ma t i on s ys t e m, i t i s t h e b a s i s of t h e e n t e r p r i s e , W i t h t h e c on t i nu ou s of b us i n es s , a