软件项目系统巡检报告
2019年月日
1ﻩ前言
1、1ﻩ巡检目得
为保障技术系统得平稳运行,将定期对各子系统进行巡检,并且根据巡检得实际结果给出相应建议。
本文档面向IT主管与技术维护人员,通过本文档共同完成对IT各子系统运行状况得调查与监控,使IT主管与技术维护人员充分了解网络系统运行得基本情况,并且为日常得系统网络、应用以及数据库得维护服务提供基本得参考数据。
1、2 系统组成
目前本项目技术系统主要由数据库系统、缓存集群系统、XX应用、YY应项目名称: 巡检部门:
用、ZZ应用与管理平台组成。
巡检中将对各子系统分别作全面得细致检查,为日常维护提供参考数据。
1、3 巡检范围
⏹XX应用子系统
⏹YY应用子系统
⏹ZZ应用子系统
⏹管理平台应用子系统
⏹缓存集群子系统
⏹数据库子系统
⏹应用日志与库表数据备份归档策略
2 巡检工作汇报
2、1 XX应用子系统
巡检意见:
2、2ﻩYY应用子系统
巡检意见:
2、3 ZZ应用子系统
巡检意见:
2、4ﻩ管理平台应用子系统
巡检意见:
2、5ﻩ缓存集群子系统
巡检意见:
2、6 数据库子系统
巡检意见:
2、7 日志与库表数据备份归档策略
巡检意见:
3ﻩ巡检参与人员
4 问题分析与运维建议
4、1ﻩ巡检工作中发现得问题以及对问题原因得分析
4、2运维工作建议
1)持续提高对技术系统、网络、应用与数据库服务得监控与报警能力,及早发现系统中存在问题,可以有效避免问题影响得扩大化,将问题解决在萌芽状态。
2)定期,如每周一次,检查各个应用主机节点、DB主机节点得日志归档、数据备份策略,检视这些策略就是否在有效地运行,历史数据就是否按预期得时间与方式被归档处理.检查重要数据得备份文件得有效性,确认这些备份数据就是安全得且可在应急故障中用于恢复数据得.
3)定期检查或演练一下网络服务得高可用性,确保备份措施在发生了中断故障事件时,网络服务可以迅速且有效地切换到备机继续运行。
建议将该应急切换操作进行自动化得实现,或者维护好手动切换需要使用得流程文档、操作手册与注意事项等。
4)采集与监测网络中各主机节点得网卡流量,合理设计报警阈值,用以辅助发现与定位异常得网络通信流量、信息安全威胁或就是故障事件。