当前位置:文档之家› 系统的可靠性设计 和 数据容灾与备份

系统的可靠性设计 和 数据容灾与备份

论系统可靠性设计摘要:随着计算机网络应用的逐步普及和深入,业务处理越来越依赖于计算机网络系统,网络的可靠性必然是建立网络系统首要考虑的问题之一,否则网络故障会造成巨大的经济损失和社会影响。

本人有幸作为项目负责人之一参与了某大学二期网络的建设,并负责了校园网络可靠性的设计和实施。

该校园网主要分为行政办公大楼,教学楼群,实验楼群,图书馆,信息中心和网络中心机房6个主要区域。

本文主要从电缆级别,通信线路,服务器,网络管理,网络中心系统等方面介绍如何建立高可靠性的应用网络系统,以满足实际需求。

正文:随着计算机网络应用的逐步普及和深入,业务处理越来越依赖于计算机网络系统,网络的可靠性必然是建立网络系统首要考虑的问题之一,否则网络故障的产生会造成巨大的经济损失和社会影响。

2007年7月到2008年7月,作为××公司的一名技术骨干,本人参与了××大学二期网络的建设,全程参与了整个网络可靠性的规划设实施,以下是项目在可靠性方面所采取的方案。

第一级容错,网络电缆。

无论是光纤,同轴电缆,双绞线还是组合布线,都可能出现各种各样的故障。

首先由于选用的电缆电气指标达不到要求,造成信号衰减过度,引起网络故障;其二,电缆接插头虚接,松落;其三电缆线受到外界老化,朽蚀,机械等原因损坏。

若损坏的电缆只是连接在一个独立的设备,则定位和修复容易,而如果是连接多个网络设备的电缆线路或主干电缆线路损坏,则很难定位及修复。

本方案在主干线路和其他重要支路上布置双线甚至多线,当主线断路时,自动切换到辅线工作。

为了考虑降低电缆线路同时损坏的可能,电缆布置在不同的路途上。

(250)第二级容错,冗余拓扑。

首先,本方案采用了三层的网络拓扑结构,并在分布层和核心层的交换机之间使用冗余路径,防止网络因单点故障而无法运行,以此提升网络拓扑的可靠性。

然而,对网络中的交换机和路由器添加多余路径会在网络中引入需要动态管理的通信环路,处理不当将产生不必要的广播风暴,造成网络瘫痪。

所以必须启用生成树协议STP。

STP 会特地阻塞可能导致环路的冗余路径,以确保网络中所有目的地之间只有一条逻辑路径。

一旦网络出现故障,STP会重新计算路径,将必要的端口解除阻塞,使冗余路径进入活动状态。

其次,采用端口聚合技术。

端口聚合可将多物理连接当成一个单一的逻辑连接来处理。

它允许两个交换器之间通过多个端口并行连接同时传输数据以提供更高的带宽,更大的吞吐量和可恢复性技术。

一般来说,两个普通的连接器连接的最大带宽取决于媒介的传输速度(比如100BAST-TX为200M),而是用Trunk技术可以将4个200M的端口捆绑后成为一个高达800M的连接。

这一技术的优点是以较低的成本通过捆绑多端口提高带宽,从而消除网络访问中的瓶颈。

另外,Trunk还具有自动带宽平衡,即使Trunk只有一个连接存在时,仍然会工作,提供了网络的可靠性。

(520)第三级容错,设备冗余。

首先,该网络采用了双核心拓扑结构。

核心层采用两台CISCO C6500交换机,两者之间使用双千兆光纤互联,利用链路聚合技术,在两台核心交换机之间扩大通信吞吐量,提高可靠性,实现复杂均衡的冗余连接。

当一条交换机出现故障或核心交换机与汇聚层交换机之间的某条链路出现故障,系统会自动将通信业务快速切换到另一台正常的交换机上,从而实现系统的可靠性。

(170)其次,DNS服务器冗余配置。

该校园网里有自己的DNS服务器,服务器采用两台,一台主DNS服务器,一台辅助DNS服务器。

这样可以实现DNS服务器的容错,也就是当一天DNS坏掉,我们可以使用另一台实现域名解析,还可以实现负载均衡,也就是把所有的DNS请求由两台DNS服务器来解析,可以减轻主服务器的负担。

第四、Web和FTP服务器的集群。

由于网络用户的增加,网络成为了宣传的好工具。

许多高校都有自己的Web站点,用于宣传学校和发布招聘,招生等信息。

有些高校也有了网络教学系统,向外部开发FTP资源服务。

单台服务器显然无法满足网络用户剧增的需求。

该学校采用了四台Linux Cluster 服务器,作为Web和FTP服务器,然后利用DNS服务器配置,将不同的服务请求连接定向到不同的服务器上,从而实现服务器的负载均衡。

而且当其中某台服务器出现故障,请求连接将定向到其他正常工作的服务器上。

从而实现服务器的高可靠性,保证服务的质量。

第五、冗余电源的设置。

在一些重要的设备,核心交换机,路由器,防火墙,入侵检测系统,数据库服务器,Web和FTP服务器上设置冗余电源,当其中一个电源出现故障时,备份电源可以立刻接管主要的电源的工作,而当替换了故障电源后,两者又可以一起工作,实现负载均衡。

第四级冗余。

冗余网关配置。

为了减少交换机故障的影响,交换机上使用了STP技术。

同样,作为网关的路由器上同样可以使用冗余网关技术。

目前有三种冗余网关技术。

国际上的标准VRRP(虚拟路由冗余协议),允许在不同厂商设备之间运行,然而只有主服务器处于活动状态,而备份服务器处于热备闲置状态,导致的资源的利用率不高。

CISCO的专有标准HSRP(热备份路由协议),同样可以实现冗余网关,但是和VRRP一样存在服务器热备闲置问题,但是可以通过配置多个虚拟路由器组从而实现负载均衡。

第三种,CISCO的网关负载均衡协议(GLBP),GLBP不但可以实现冗余网关,而且可以实现负载均衡。

由于该学校的路由设备大部分采用了CISCO的设备,所以,冗余网关协议采用CISCO专有的协议GLBP,将三台路由器的虚拟网关IP配置为一样,并且通过设置优先级使其中一台路由器成为主服务器,另外两台为备份服务器,但是三台服务器都处于活动状态。

第五级可靠性设置。

分布式数据库。

由于该学校有两个校区,并且开展了提供了网络教学,所以在不同校区布置了ORACLE数据库,并且每个校区的的重要数据库(比如学生档案,学生考试信息,招生信息等)进行了双机备份,并存储与不同的位置,预防一些难于预测的灾难。

第六级容错,采用网络管理软件系统进行网络的监视和控制,随时了解网络的运行情况,诊断和确定网络故障的可能种类,发生点,作用范围等,可以作为网络维护人员的得力助手,以便及时查出故障和进行故障排除。

网管系统在大中型网络系统中是必不可少的网络工具,可以大大缩小排除网络故障的时间和降低网络维护成本。

本项目自2008年7月完工以来,运行良好,系统的安全性,高可靠性得到了学校领导和广大师生的好评。

我觉得不足之处有以下几点:DNS服务采用了循环机制,虽然实现了冗余功能,但是不能对不同DNS服务器的性能,负载实现均衡。

而且,如果某台DNS服务器出现故障,可能导致某些用户连接失败而无法得到服务。

第二,网络采用了RIP路由协议,路径的均衡采用跳步数,不能充分考虑网络带宽和延迟,本人建议,以后应该改用EIGRP或者OSPF协议,动态的实现负载均衡。

数据容灾与备份摘要摘要:随着计算机网络应用的深入,教育也步入了信息化。

很多高校拥有属于自己的网络系统。

并且随着信息发布平台,邮件系统,协同办公,校园一卡通等服务的深入应用,越来越多有价值的信息转变为海量数据,数据的价值也越来越高,任何数据的丢失都会给学校带来极大的损失。

如何保障数据的安全,以及数据在灾难之后的恢复成为了高校信息系统的重要任务之一。

本人作为项目负责人之一参与了××高校的信息网络建设,本文介绍本信息系统的数据容灾与备份方案。

开头略灾难分析:建立容灾备份工程最重要的一步是灾难分析,只有对灾难进行正确的分析后才能设计出一个好的备份方案。

建立容灾备份工程的最终目的是保证在灾难造成对数据的破坏后,业务数据的可恢复性。

灾难可以分为自然灾难,社会灾难和人为灾难。

自然灾难包括或者,水灾,地震等突发自然灾害照常业务系统灾难。

社会灾难包括区域性电力系统故障,恐怖分子制造的爆炸,战争引起的定点破坏等灾难。

国内外社会不安定因素的存在,必须引起企业足够的忧患意识。

美国9.11就是一个很好的例子,一些没有任何容灾措施的企业由于核心业务数据的破坏而最终破产。

认为灾难包括IT系统管理人员的误操作,来自网络的恶意攻击,计算机病毒发作造成数据灾难。

本文主要从备份中心,磁盘阵列,双击容错和集群,磁盘镜像,数据防毒等方面来介绍本项目的数据容灾方案。

(数据备份更多的是指数据从在线状态剥离到离线状态的过程,终于服务器高可用集群技术已经远程容灾技术有着本质区别。

虽然从目的上讲,这些技术都是为了消除或减轻意外事件给系统带来的影响,但是由于其侧重的方向不同,实现的手段和产生的效果也不尽相同。

集群和容灾技术的目的是为了保证系统的可用性,也就是说当一位发生时,系统所提供的服务和功能不会因此而间断。

对数据而言集群和容灾技术是保护系统的在线状态,保证数据可以随时被访问。

而备份技术则是将整个系统的数据或状态保存下来,以挽回硬件设备损坏带来的损失,还有逻辑错误和任务恶意拨号带来的损失。

备份技术指保证数据可以恢复,但是恢复需要一定的时间。

(备份与容灾的区别---可不写)数据容灾就是防止数据失效,有多种途径:如加强建筑物安全措施,提供员工操作水平,购买优良设备。

但是最根本的方法还是建立完善的备份知道。

备份就是保留一套后备系统。

这套后备系统与现有系统一模一样,或者是能够替代现有系统的功能。

组建远程备份中心:远程备份是为了防止主计算机中心和备份中西因为距离太近而同时损坏。

1.备份中心的选址:备份中心选址时应该考虑的问题有:备份中心与计算机中心应有充分元的距离;网络基础设施较完备,备份中心要有足够的带宽确保与数据中心的数据同步;不能在地震,洪涝,台风,雷击等地质灾害和天气灾害多发地区;不能在重要设施密集的地区,不能在交通要道附近;还得考虑是否有充足的双回路电流保障。

低价等成本也是一个不容忽视的考虑因素。

首先该学校的主计算机中心位于东校区,而数据备份中心位于离东校区20千米外的西校区。

西校区在交通,低价和电力设施方面都有很多优势。

2.备份网络的技术:学校存有关键业务主机的服务器都是基于SAN(Storage area network,存储局域网)网络,而其他非关键主机则居于Lan网络。

首先,在计算机中心安装客户端备份软件,管理需要备份的服务。

在备份中心安装服务器端备份软件,用来管理备份服务器。

在该系统中,SAN网络中关键业务主机数据通过备份服务器的管理软件将数据分别存储到位于异地的2个磁带库中。

该架构能够解决主机故障(包括硬件和系统等软件故障),核心数据库丢失故障等任何硬件级别的单点故障,并能准备地依靠备份数据将系统怀远到最后一次备份前的任意时刻,实现了逻辑损坏的修复功能。

备份频率也是一个值得考虑的问题,因为如果备份时间短,比如每次计算机中心业务活动产生对数据的修改都将其数据备份至备份中心,那么一旦系统发生故障,丢失的只是最后一次业务活动产生的数据。

相关主题