当前位置:文档之家› 面向高端容错计算机的进程容错系统设计与实现

面向高端容错计算机的进程容错系统设计与实现


常见的容错机制主要依据静 态结构冗余原理实现 , 然而硬 件层 的冗余成本很 高且 实现复杂 , 应用 软件 层的冗余则不具有通用 性。提 出一种基于进程冗余 的容错机制 和策略 , 对 关键进 程构造双模冗余或 多模 冗余 , 采用进程 间同步等手段确保冗余进程按 照同样 的执 行逻 辑运行 , 监 控系统并对不 同的错误进行 相应的错误处理。 与传统 的g - +  ̄ 2 r 式相 比, 进程容错 管理 系统具有通 用性高 、 成本低 等
特点, 能在较 小的性能损耗下有效地保证 系统的高可靠性 , 同时避 免 了硬件定制 的复杂 性, 并对应用程序和用 户透 明。 关键 词
中图分类号
容错计 算机
T P 3 0 2 . 8
进 程冗余 双模冗余
文 献标 识 码I 7 0错 错误 处理 D O I : 1 0 . 3 9 6 9 / j . i s s n . 1 0 0 0 — 3 8 6 x . 2 0 1 3 . 0 4 . 0 2 6
Ab s t r a c t Hi g h — e n d f a u l t — t o l e r a n t c o mp u t e r s a r e ma i n l y u s e d i n k e y s e c t o r s s u c h a s b a n k i n g a n d t e l e c o mmu n i c a t i o n s ,a n d a r e e x t r e me l y
s e n s i t i v e t o f a i l u r e, S O i t i s e x t r e me l y i mp o r t a n t t o g u a r a n t e e t h e a v a i l a bi l i t y o f t h e i r k e y p r o c e s s e s . Co mmo n me c ha n i s m o f f a u l t — t o l e r a nt i s
吴 楠 张 东 刘璧怡
( 高效能服务器和存储技术 国家重点实验室 ( 浪潮 ( 北京) 电子信 息产业 有限公 司 山东 济南 2 5 0 1 0 1 ) 北京 1 0 0 0 8 5 )


高端容错计算机 主要 应用 于银行 、 电信 等关键领 域 中, 对 于 系统失效 极其敏感 , 保 证 系统关键进 程 的可靠 性至关 重要。
第3 0卷 第 4期 2 0 1 3年 4月
计 算机 应 用与软 件
Co mpu t e r App l i c a t i o n s a n d S o f t wa r e
Vo 1 . 3 0 No . 4 Ap r .2 01 3
面 向高 端 容 错 计 算 机 的进 程 容错 系统 设 计 与 实 现
ma i n l y r e a l i s e d b a s e d o n s t a t i c s t r u c t u r a l r e d u n d a n c y p r i n c i p l e,b u t t h e r e d u n d a n c y i n h a r d wa r e l a y e r c o s t s h i g h a n d i s c o mp l e x i n e x e c u t i o n, w h i l e t h e r e d u n d a n c y i n a p p l i c a t i o n l a y e r i s o f l o w v e r s a t i l e .T h i s p a p e r p r o p o s e s a f a u l t — t o l e r a n t me c h a n i s m a n d p o l i c y b a s e d o n p r o c e s s r e d u n d a n c y,wh i c h c o n s t uc r t s d u a l — mo d u l a r r e d u n d a n c y o r mu l t i — mo d u l a r r e d u n d a n c y o n k e y a p p l i c a t i o n p r o c e s s e s .T h e me t h o d e mp l o y s t h e me a n s o f i n t e r p r o c e s s s y n c h r o n i s a t i o n t o e n s u r e t h e o p e r a t i o n o f r e d u n d a n c y p r o c e s s e s b a s e d o n t h e s a me e x e c u t i o n l o g i c,s u p e r v i s e s t h e s y s t e m a n d ma k e s c o r r e s p o n d i n g e ro r h a n d i n g o n d i f f e r e n t f a u l t s .C o mp a r e d wi t h t r a d i t i o n a l f a u l t - t o l e r a n t w a y,t h e p r o c e s s f a u l t — t o l e r a n t ma n a g e me n t s y s t e m h a s t h e c h a r a c t e r i s t i c s o f h i g h v e r s a t i l i t y a n d l o w c o s t ,c a n e f f e c t i v e l y e n s u r e h i g h r e l i a b i l i t y o f t h e s y s t e m w i t h l e s s p e r f o r ma n c e l o s t a n d a v o i d t h e c o mp l e x i t y i n h a r d w a r e c u s t o mi s a t i o n a t t h e s a me t i me, wh i l e i t k e e p s t h e t r a n s p a r e n t t o a p p l i c a t i o n s a n d u s e r s
L i u Bi y i
( N a t i o n a l K e y L a b o r a t o r y o f H i g h - p e r f o r ma n c e S e r v e r a n d S t o r a g e T e c h n o l o g y, J i n a n 2 5 0 1 0 1 , S h a n d o n g, C h i n a ) 。 ( 1 n s p u r( B e in g )E l e c t r o n i c I n f o r m a t i o n I n d u s t r y C o . ,如 , B e j i i n g 1 0 0 0 8 5, C h i n a )

DES I GN AND I M P= L EM ENTATI oN oF PROCESS FAULT— ToLERANT S YS TEM FoR HI GH . PERFoRM ANCE FAULT. ToLERANT CoM PUTER
Wu Na n
Z ha n g Do n g
相关主题