高校校园网极简运维解决方案
快速恢复
IT健康指数下降,业务系 统异常,得到主管关注
IT主管
事件工程师
根据故障源情况,为 用户提供临时措施, 恢复业务
值班工程师
事件告警中心,即时产生 异常报告,定位故障源
对于少数报障用户,告 知故障原因和恢复预期
基于RIIL的故障处理
!
大屏幕标记异常
手机短信、IPAD、邮件 告警异常
IT基础架 构发生异 常
IT人员记录故障,开始排查
检查网络设备连接 CPU?内 存?流量?端口?….
用
检查主机服务器
户
CPU?内存?进程?分区?….
在
等
检查数据库
待
缓存?表空间?会话?日志?….
,
业
检查应用服务 Web应用?中间件?….
务 在 中
断
定位故障源
分析并尝试解决
最终解决,通知用户业务恢复
此时已在绝大多数用户感知 前,业务已恢复,使故障影 响降低到最小
视图展现 等
无线用户分布图:计量区域用户体验度,评估用户无 线使用质量;
无线故障预警和及时告警,直观展现故障AP位置和故
全网如何监控,故障如何快速定位?
如 学校关键业务如何管理,如何监控? 如
何
无线AP如何监控,如何管理?
何
降
是
低
服
维
务
护
响
工
应
作
虚拟化资源如何直观展现?
快
量
工作业绩如何直观体现?
捷
如何使工作流程化标准化?
IT运维管理不 再是单纯的 “IT”的管理, 而是利用IT技 术实现全校的
业务和战略管
理!
场景一:提高故障解决率
高校校园网 极简运维解决方案
IT成熟度模型
成本中心
不统一、手动管理 的基础架构
应对型 “头疼医头” 问题驱动型 “避免宕机”
更高效的 成本中心
可管理的IT 基础 架构
(有限的自动化)
应对型 稳 定的 IT 请求驱动型 变更管理和规 划 “保持系统持 续运行”
业务助推器
可管理且整和 的 IT 基础架构 (最大限度的自动化)
5、易展现
工作成果直观呈现 建设成果直观展现
1、监控全
• 支持对所有的IT资源(有线/无线网络、 服务器、数据库、中间件、虚拟化、存 储等)进行监控管理;
• 提供网络拓扑,直观展现设备和链路运 行状况,故障直观显示;
2、站位高
• 以业务为视角,对教务管理、校园一卡通、学籍管理、 行政管理等进行统一管理。
预见型 责任到人 更强的监视能 力 正规的变更管 理 SLA(服务品质 协议) 改进 可预测性 “质量驱动型 ”
战略性资产
完全自动化管理 , 动态使用资源, 与业务联系在一 起 的 SLA
预见型 优化成本及品 质 敏捷 自我评估并不 断改进 “领先一步”
* Based on the Gartner IT Maturity Model
各高校已进入业务助推器或战略性资产阶段!
高校信息化运维重点任务
网络管理 应用系统管理
安全管理 配置变更发布管理
机房管理 内部培训管理
工作人员保障
运
运行环境保障
用
行
户
管
辅助工具保障
服
理
规章制度保障
务
各部门,中心间协作
日常值班 上门服务 技术支持 自助服务 反馈跟踪 信息化相关培训
网络基础建设
应用系统建设
资源与链路的 实时性能管理
异常自动巡查 与告警
一链自动拓扑 布局
丰富拓扑视图 定制
地址簿 IP-MAC管理
多种脚本工具
网络资源管理:通过一套系统,实现自动化极简运维
3、故障准
业务、资源、链路及时预警和告警,直观显示,快 速定位故障根源,知识与告警关联,快速解决故障
4、统计快
对业务、资源、故障、资产等从多个维度统计分 析,为决策提供依据
• 业务雷达全局掌握业务的健康水平,从业务视角洞察IT 异常和变化;
• 通过业务卡片,掌握业务系统的可用性、健康度、繁忙 度的实时状态和周期变化;
• 通过业务拓扑,掌握应用系统的异常对业务、用户的影 响和威胁,呈现IT对业务的支撑价值;
网络资源管理: IT故障快速定位
传统手工故障处理
业务系统无法访问,用户报障
• 高校信息化CIO •整体信息化战略发
布
•高校信息化执行规
划
•业务系统支撑
•校园网稳定运行 •基础网络升级换
代
基于高校考核体系,进行
运维体系建设
高校考核体系
综合绩效 服务满意度
故障率
高校用户运维面临的挑战
如果说把硬件比作数字化校园的血与肉,把信息化建设所带来的学校的核心 竞争力的提升比作灵魂,那么以IT管理运维体系、安全体系及用户服务体系 所代表的支撑体系建设则可视为高校数字化校园建设的骨骼。
准确定位
服务台人员 向受影响用户发出故 受影响 障通告 用户
…… 业务服务一览,判断受影响用 资源性能分析,从指标历史变 知识库查询,快速找到相关
户
化情况分析问题发生原因。 解决方案
根本解决
通知用户故障已根本解决,业务可用性保 持良好的水平
问题工程师
业务拓扑,验证问题是否根本 解决
网络资源管理:以S18000+无线为核心的极简运维
高校网络管理人员最关心设备运行状况是否良好,出现故障是否可快速定 位,恢复网络
场景一:网管所关注的:网络资源如何监控和管理
高教网络技术人员关注点
众多的网络资源如何发现? 是否需要添加拓扑? 网络一但出现问题,是否可以自 动报警? IP,Mac地址如何管理?
RIIL-IMC平台帮您解决 上述难题
锐捷技术的网 络拓扑算法一的视角来展示 N18K的VSU和VSU成员设备(多个),标注 VSU主控设备角色,显示槽位板卡信息和可用 性状态
当VSU主设备的板卡发生故障时,在拓
扑图中通故过障颜告色警变化直观标识设备和
主 板卡,进行故障提醒。
无线拓扑图:有线无线一体化管理 无线AP分布图:展现AP分布、AP健康状态、故障AP
——摘自南开大学张四海关于《高校IT运维面临的挑战与机遇》
提高IT系统利用率,降低IT运维成本,提高运维灵活性和响应速度,成为 高校普遍的运维需求!
三层面客户关注点
信息化发 展战略者 业务支撑 应用管理 基础网络 技术管理
4
高教职教行业信息化 各级人员关注点
分管信息 化副校长
信息网络 中心主任
网络管理 技术人员
考核点
故障率
日常工作目标:减少故障
工作困扰
• 故障后知后觉,业务老师报 障或投诉;
• 故障频发,定位处理难,设 备更新换代缺少数据支持。
应用对策
• 提供自动化运维工具,解决纯手工运维 的局面;实现故障预警,减少故障发生; 故障报警准,定位故障源,快速解决, 降低故障对业务的影响;快速、准确统 计分析,为决策提供依据。