当前位置:文档之家› 银行数据中心自动化智能运维平台需求

银行数据中心自动化智能运维平台需求


需求分析:3
• 审计和合规管理:
– 支持配置与操作审计,包括操作用户的审计、操作时间的审计、 操作内容的审计等,可以具体到用户的击键记录; – 内置多种合规或最佳实践要求,包括Sarbanes Oxley, PCI, FISMA, HIPAA, ITIL, COBIT, COSO等; – 也可由用户自定义合规策略,可以针对文件、目录、用户、组、 补丁、软件包、注册表、应用配置模板等多种对象制定合规策略; – 当发现不合规情况下,可以提供自动修补功能。
项目目标
• 改变IT部门的传统运维模式,建立新的自动化运维模式,建设开放平 台服务器自动化配置管理系统将。 • 从范围上来说,该系统不仅能满足目前中国XX银行 IT部门对数据中心 开放平台服务器的日常运维管理需求,而且应能够具备良好的扩展性, 可以在未来为中国XX银行 IT部门提供从数据中心到测试中心、开发中 心、各分行,乃至地市分行的端到端自动化运维管理。 • 从功能上来说,该系统应可以为开放平台服务器的整个管理生命周期 的提供一系列自动化配置管理手段,涵盖开放平台服务器规划、设计、 实施和运维的各个阶段。
容量估算
• SA服务器自动化工具后台服务器2台,建议 配置如下:
– 处理器:CPU Dual-core Processor Intel Xeon, 3.0+ GHz,4颗以上 – 内存:16GB RAM以上 – 硬盘:200 GB以上, SCSI – 网卡:100/1000Mbps以太网卡,2个
容量估算
– SA客户化功能实现配置信息自动化
服务器列表范例
29
2013年5月11日星 期六
操作系统报表范例
30
2013年5月11日星 期六
软件信息报表范例
31
2013年5月11日星 期六
日常巡检自动化
• 日常巡检自动化内容: – 包括用内置的模板进行检查,以及由用户自定义检查,比如检查CPU利用 率、表空间利用率、日志文件搜集和分析、补丁规范、配置规范、安全 设置等 – 标准操作系统软件/补丁信息
应用或技术架构图
• 应用架构图 • 技术架构图 • 系统示意图
技术架构图
外部 系统
工单 系统
监控 系统
变更 管理
帮助 台
开放平 台自动 化管理 系统
自动化运维流程整合系统
配 置 管 理
合 规 管 理
操 作 系 统 安 装
日 常 巡 检
变 更 管 理
单 点 登 录
补 丁 管 理
软 件 分 发
脚 本 执 行
卫星节点
分布部署,高可用性
数据中心1 OO+SA
3001
数据中心2 OO+SA
被管服务器
3001
被管机器
1002
被管机器
1002
架构说明
• Multi-Master
– 统一集中的服务器管理 – 避免单点故障 – 多个SAS核心服务器之间的数据共享
• 卫星节点
– 分担核心服务器负载 – 穿越防火墙 – 有效平衡网络带宽
数据中心自动化智能运维平台 项目背景、目标描述 • 描述项目的背景及需要解决的问题 • 描述项目的目标 • 评价项目目标是否实现的衡量指标
项目背景
• 目前我行所负责运维的开放平台服务器已经达到了相当的 数量规模,但是大多数配置管理和变更工作仍还由IT维护 人员手工运维。 • 随着设备数量的增长、运维标准的提升、配置和运维规范 的日益严格,手工运维的模式已经越来越难以实现我行在 IT运维方面的高标准要求,在配置管理、变更管理、合规 审计和联合排障等方面,因手工运维带来的大量繁琐工作 和易出错的操作都给安全生产带来极大隐患。 • 从运维管理模式上看,数据的集中意味着运维管理也必须 相应的向集中式的运维模式转型,如果IT还停留在传统的 运维模式和运维水平,势必对集中的业务带来极大的潜在 风险。
– 数据库信息
– 中间件信息

配置信息自动化采集和管理的解决方案
– SA默认功能实现配置信息自动化
• 对于大多数硬件信息, 标准操作系统软件/补丁信息, 操作系统信息, SA默认可以自动 采集, 同时生成相应的报表, 不需要定制 • 对于数据库信息, 中间件信息, 可以开发OGFS脚本, 把这些信息写入数据库如服务器 的custom attribute字段, 再用BIRT报表工具自定义用户需求的报表
– 处理器:CPU Dual-core Processor Intel Xeon, 3.0+ GHz,2颗以上 – 内存:4GB RAM以上 – 硬盘:80 GB以上, SCSI – 网卡:100/1000Mbps以太网卡,2个
部署方案详细描述
• 详细的部署方案图及描述,描述需求到方案的推导过程,包括:
需求分析:4
• 软件/补丁安装和回退:
– 操作系统补丁安装升级 – 应用补丁安装,包括:数据库补丁、中间件补丁、XXX银行自己开 发应用的补丁,以及如何自动部署新的应用 – 软件/补丁的回退, 能够回退到上一状态 – 以工作流方式实现对各个运维管理子系统的指挥调度和协同工作 – 实现IT流程完整的生命周期自动化,对流程进行闭环管理; – 提供可视化工具定制流程;
应 用 可 视 化
报 表 管 理
HP自动化运维术语
SA Core Slice MR SAR Server automation Core slice Model Repository Service automation report 服务器自动化系统 SA的核心服务器 和agent通讯的组件 oracle 数据库 报表管理系统
– – – – 跨越多个数据中心提供全面的硬件、软件和操作活动的全面报表; 可以自动生成通用的合规报表,如Sarbanes-Oxley报表等; 可以创建可互操作的图表,提供多层次数据并可层层深入挖掘; 可以导出报表数据与其它报表工具进行集成。
需求分析:7
• 代理(Agent)对目标机器的影响:
– Agent应该支持数据中心大多数的操作系统 – Agent应该对目标机器的磁盘和内存要求不高 – Agent运行时占用CPU, Memory, I/O等资源少

自定义脚本实现日常巡检自动化范例
自定义脚本: 密码长度>6位
定时日常巡检范例
定义运行时间
服务器合规报表范例
审计和合规管理
• 审计和合规的内容
– 用户操作行为审计
• 用户登陆哪台服务器、登陆时间、执行的操作命令、 命令执行的时间等
– 业绩多种合规或最佳实践
• Sarbanes Oxley, PCI, FISMA, HIPAA, ITIL, COBIT, COSO等 这些业绩规范的合规审计
– 检查内容非常广泛,包括用内置的模板进行检查,以 及由用户自定义检查,比如检查CPU利用率、表空间利 用率、日志文件搜集和分析、补丁规范、配置规范、 安全设置等; – 检查可以由管理员触发进行,也可以在设定的时间窗 口自动周期性执行,效率大大高于传统方式,并且可 以实现密集的检查,及时发现和消除故障隐患,变频 频救火为防患于未然,从根本上提升系统可靠性。
• OO流程自动化工具后台服务器2台,建议配 置如下:
– 处理器:CPU Dual-core Processor Intel Xeon, 3.0+ GHz,4颗以上 – 内存:8GB RAM以上 – 硬盘:80 GB以上, SCSI – 网卡:100/1000Mbps以太网卡,2个
容量估算
• OO流程自动化工具数据库2台,建议配置如 下:
• 日常巡检的内容由于每个企业,每个银行,每个数据中心都不同, 没有统一的标准, 需要利用
据库, 再用BIRT报表工具自定义用户需求的报表 • 日常巡检可以有管理员定义schedule定时执行, 以可以立即执行
现有脚本或者开发新的脚本(shell,perl,VBscript,.bat,python)开进行日常巡检. 有的日常巡检 需要采集某些信息如CPU利用率等, 有的日常巡检只是判断某个参数是否合规(符合定义的 数值), 通常用SA的audit功能的custom script或者OGFS脚本来实现, 相关数据会写入数
8,000 7,200 4,500 2,250
Managed Servers
容量估算
• SA数据库服务器2台,建议配置如下:
– 处理器:CPU Dual-core Processor Intel Xeon, 3.0+ GHz,4颗以上 – 内存:16GB RAM以上 – 硬盘:200 GB以上, SCSI – 网卡:100/1000Mbps以太网卡,2个
需求分析
• 业务需求:
– 业务量估算; – …… – …… – – – – – – – –
• 应用非功能性需求:
性能需求; 容量需求; 质量需求; 业务连续性需求; 安全需求; 运维管理需求; …… ……
需求分析
1. 2. 3. 4. 5. 6. 7. 配置信息自动化采集和管理 日常巡检自动化 审计和合规管理 软件/补丁安装和回退 用户权限管理 报表管理 代理(Agent)对目标机器的影响
• 补丁版本、xxx.rpm包版本等信息

日常巡检自动化方法: – 取代传统的人工检查, 自动化管理 – 检查可以由管理员触发进行,也可以在设定的时间窗口自动周期性执行, 效率大大高于传统方式,并且可以实现密集的检查,及时发现和消除故 障隐患,变频频救火为防患于未然,从根本上提升系统可靠性. 日常巡检自动化的解决方案
OO Central Server
SQL Server
Operation Orchestration Central Server
SQL Server
自动化运维流程整合 系统 OO的核心服务器
SQL服务器
基础设施部署架构图
相关主题