@@@服务器及网络系统维护方案@@软件系统有限公司@@@-11-51 保障维护目标@@@信息化建设管理中心机房是@@@各分公司的综合信息网络枢纽,包含多个关键业务系统,同时@@@各个业务网点也运行着多个IT设备,保障这些系统及相关的硬件设备正常运行并对外提供服务是方案的核心内容。
@@@信息化建设管理中心机房(以下简称中心机房)中包含各个收费系统,核心网络设备等多个关键业务系统,系统的稳定性、高效性、可靠性非常关键。
同时@@@各个分支机构(以下简称分支机构)均包含大量网络设备或服务器等IT设备。
以上设备原价值超过3000万元,中心机房收费系统等系统中的有效数据总和近1TB,价值无法估量。
随着集团业务的发展和信息技术的不断进步,中心机房和各分支机构对信息系统和IT 设备的稳定要求越来越高。
集团IT设备中,大部分设备的使用年限均超过了设备原厂保修期,基于@@@集团目前的信息设备维护技术力量和人员配备,远远不能满足这种需求,这种缺乏专业维护所致的系统宕机及数据丢失隐患将会严重影响@@@集团在全市业务工作的开展。
维持中心网络设备的正常运转,为@@@集团更好的为广大北京市民进行服务提供高效、稳定、可靠的信息平台和技术保障,有助于提高集团的工作质量、工作效率及良好的社会服务形象,从而更好的为广大市民服务。
2 保障维护内容2.1 服务器及存储硬件维护在现场进行维护的@@软件的工程师,根据设备的不同状况采取适当的维护服务措施,主要包括:1) 对系统错误进行记录、分析,并实施故障诊断2) 通知@@相关负责人携带备件及时进行现场维修、更换3) 对系统板卡、设备的微代码升级4) 采取系统检测诊断(Diagnostic Online/Offline)5) 对设备实行定期的预防性维护6) 提供设备维护、维修记录和报告7) 辅导掌握系统的基本操作,并给予技术支持8) 为用户提供技术培训、进行经验传授为了更好的保障@@@集团系统硬件稳定运行,我们将在@@设备保修的基础上再为如下核心服务器设备购买IBM原厂保修服务,通过双重设备保修,保障@@@集团核心服务器设备硬件故障得到最快速最有效的保障。
2.2 操作系统及软件维护操作系统类型的软件维护内容主要包括:一、系统运行状况检查1) 了解系统运行状况2) 解决客户系统软件问题3) 系统运行状况分析4) 客户同意前提下安装修正性软件(补丁)。
对于特定的系统安全性修正性软件以及IBM紧急要求的系统修正性软件可能会被随时安装5) 提供与系统软件相关的技术支持及咨询二、远程技术支持服务@@将通过电话和/或其它远程方式帮助@@@集团解决或解答以下与系统有关的日常运行、安装和使用等问题:1) 系统软件故障解决2) 系统软件使用问题解答3) 远程安装单个PTF或FixPack4) 远程在线诊断三、现场技术支持对于通过上述远程技术支持服务方式未能解决或解答的问题,@@将安排工程师提供现场支持。
四、提供修正性软件(PTF或Servicepack)根据实际情况,为客户免费提供修正性软件(PTF或Servicepack)。
五、系统性能监测应@@@集团要求,@@可以利用性能监测软件,每月或每季度为用户提供性能分析报告。
报告内容包括:1) Executive Summary2) Management Summary3) Response Time4) Response Time, Local Terminal5) Response Time, PC6) Transaction V olumes7) Transaction Analysis8) Jobs9) Print Outs10) Processor Utilization11) Processor Utilization, Trend12) Memory13) Disk Space Usage14) Disk Arms Utilization15) Communication Lines16) Additional Facts六、系统小版本(Release)升级在@@@集团获得合法的系统升级软件后,@@软件将免费协助其进行系统小版本(Release)升级。
七、其他服务内容1) 提供系统软件操作方面的24小时电话答疑2) 提供系统维护、调整及安全性设置等方面的技术支持3) 对系统软件的错误进行记录、分析,为操作系统做故障诊断4) 实施系统增强和修补程序(ServicePacks & MaintenanceLevel)的分发、安装和测试5) 辅导掌握系统软件的基本操作,并给予技术支持6) 对系统软件运行实施定期预防性的维护和检查7) 提供系统优化和性能调整8) 提供设备维护、维修记录和报告2.3 数据库系统软件维护数据库类型的软件维护内容主要包括:一、系统运行状况检查1) 了解系统运行状况2) 解决客户系统软件问题3) 系统运行状况分析4) 客户同意前提下安装数据库补丁。
对于特定的数据库补丁以及紧急修正性补丁可能会被随时安装5) 提供与数据库软件相关的技术支持及咨询二、远程技术支持服务@@将通过电话和/或其它远程方式帮助@@@集团解决或解答以下与系统有关的日常运行、安装和使用等问题:1) 数据库软件故障解决2) 数据库软件使用问题解答3) 远程在线诊断三、现场技术支持对于通过上述远程技术支持服务方式未能解决或解答的问题,@@将安排工程师提供现场支持。
四、提供数据库补丁根据实际情况,为客户免费提供数据库补丁。
五、系统性能监测应@@@集团要求,@@可以利用性能监测软件,每月或每季度为用户提供数据库性能分析报告。
报告内容包括:1) Executive Summary2) Management Summary3) Response Time4) Response Time, Local Terminal5) Response Time, PC6) Transaction V olumes7) Transaction Analysis8) Jobs9) Print Outs10) Processor Utilization11) Processor Utilization, Trend12) Memory13) Table Space Usage14) TOP SQLs六、数据库小版本(Release)升级在@@@集团获得合法的系统升级软件后,@@软件将免费协助其进行数据库小版本(Release)升级。
七、其他服务内容1) 制定并执行数据库系统维护计划;2) 数据库系统维护;3) 数据库系统性能调优;4) 数据库平台的维护等;5) 数据灾难恢复;6) 数据库系统升级;7) 定期和不定期撰写数据库运行维护报告等。
2.4 网络设备维护网络设备的维护内容主要包括:一、设备运行状况检查1) 了解设备运行状况2) 解决网络设备使用问题3) 设备系统运行状况分析4) 客户同意前提下升级网络操作系统或固件版本。
对于特定的IOS或firmware补丁以及紧急修正性补丁可能会被随时安装5) 提供与网络设备相关的技术支持及咨询二、远程技术支持服务@@将通过电话和/或其它远程方式帮助@@@集团解决或解答以下与系统有关的日常运行、安装和使用等问题:1) 网络设备故障解决2) 网络设备使用问题解答3) 远程在线诊断三、现场技术支持对于通过上述远程技术支持服务方式未能解决或解答的问题,@@将安排工程师提供现场支持。
四、提供网络系统补丁根据实际情况,为客户免费提供网络系统补丁或固件升级。
五、网络系统性能监测应@@@集团要求,@@可以利用性能监测软件,每月或每季度为用户提供数据库性能分析报告。
报告内容包括:1) Executive Summary2) Management Summary3) Service Customer Report4) Business Unit Report5) Service Level Report6) Communications Transport Report7) Transaction Analysis8) Processor Utilization9) Processor Utilization, Trend10) Memory六、网络系统版本(Release)升级在@@@集团获得合法的网络系统升级软件后,@@软件将免费协助其进行版本(Release)升级。
七、其他服务内容1) 维护计划制定;2) 网络设备安全性维护;3) 网络故障处理;4) 网络性能监测;5) 网络线路维护;6) 网络设备系统升级;7) 定期和不定期撰写网络系统运行报告等。
2.5 系统巡检服务@@软件依照用户要求,每周对@@@集团所有的维护服务对象,包括服务器、存储设备、网络设备和系统等各项软硬件进行巡检工作以保障系统稳定运行,提前发现问题和故障。
2.5.1 服务器及存储硬件巡检内容1.外部环境检查机房环境:温度是否符合要求(10℃-40℃):□ 符合要求□ 不符合湿度是否符合要求(8%-80%):□ 符合要求□ 不符合电源参数:相电压:□ 符合要求□ 不符合线电压:□ 符合要求□ 不符合零地电压:□ 符合要求□ 不符合2.系统硬件运行情况控制面板是否正常:□正常□ 不正常钥匙是否妥善保存:□ 是□ 否电源情况:□正常□ 不正常风扇转动情况:□正常□ 不正常是否有备份电池寿命报警:□ 是□ 否检查设备故障灯是否有亮:□ 有□ 无有否异常情况(如硬盘、风扇异常的声音,电缆破损):□ 有□ 无备注:3.检查磁盘阵列(如:DS4700)状况,并填写下表:序列号硬盘数量硬盘容量硬盘微码有无Hot Spare 何种数据保护Fast-Write Cache 是否打开2.5.2 操作系统巡检内容Windows巡检内容1.操作系统环境操作系统版本:补丁(Service Packs)版本:系统软件包情况:安装的病毒软件型号和版本:运行的应用软件的型号和版本:2.系统运行状态CPU使用率是否持续大于70%:□ 是□ 否硬盘使用率是否大于80%:□ 是□ 否系统日志有没有需要修复的错误:□ 是□ 否有否合符要求的系统备份:□ 是□ 否最近一次系统备份的时间:检查各网卡的状态、IP 地址、路由表等:□正常□不正常检查通信状态:□正常□不正常病毒库是否最新:□ 是□ 否应用服务是否正常:□ 是□ 否Administrator密码是否妥善保管:□ 是□ 否是否连接磁盘阵列:□ 是□ 否磁盘阵列空间使用情况:AIX巡检内容1.操作系统环境操作系统版本:补丁(Service Packs和Maintenance Level)版本:系统软件包情况:2.系统运行状态有否硬件故障:□ 有□ 无(硬件故障检测命令:# errpt -d H -T PERM)有否软件故障:□ 有□ 无(软件故障检测命令:# errpt -d S -T PERM)有否发给root 的错误报告:□ 有□ 无(检查命令:#mail)CPU使用率是否持续大于70%:□ 是□ 否(检查命令:#sar 1 10)硬盘使用率是否大于80%:□ 是□ 否是否大数据读写都集中在某些硬盘上:□ 是□ 否(检查命令:#iostat 1)是否有“stale”状态的逻辑卷:□ 是□ 否(检查命令:#lsvg –l <vg name>)交换分区使用率是否超过70%:□ 是□ 否(检查命令:#lsps –s)有否合符要求的系统备份:□ 是□ 否最近一次系统备份的时间:磁带机是否需要清洗:□ 需要□ 不需要(“usr/lpp/diagnostics/bin/utape –cd rmt0 –n”查看磁带机使用时数)检查各网卡的状态、IP 地址、路由表等:□正常□不正常检查通信状态:□正常□不正常(测试命令:#ping [ip address])3.检测诊断机器shutdown 后以慢启动方式作自检,启动后运行diag 系统诊断程序。