从数据库管理员到数据架构师
数据架构这个名词好抽象
神马是数据架构??
架构是建造的艺术和科学,特别是设计和建造建筑 时的艺术和实践,同时考虑到美学和实用的因素。
数据架构就是一组关于企业数据的蓝图。
8
为什么要有数据架构?
一个民工的窝棚,自然不需要什 么架构……
但是一个现代化的楼盘 可以没有架构规划吗?
9
目前电信运营商目前IT系统数据架构现状和问题
6:00:00 6:30:00 7:00:00 7:30:00 8:00:00 8:30:00 9:00:00 9:30:00 10:00:00 10:30:00 11:00:00 11:30:00 12:00:00 12:30:00 13:00:00 13:30:00 14:00:00 14:30:00 15:00:00 15:30:00 16:00:00 16:30:00 17:00:00 17:30:00
若通过硬件扩容的方式达到同样效果,需
要扩容28颗同类型CPU。
3. 性能提升
• 从生产清理出库34TB的数据,超 出目标值4TB,出库量占比34%。
• 节约生产存储的同时,为系统性能提升 打下基础。
2. 架构优化
库表清理
• 共清理冗余表15442张,超出目标 5442张,超预期50%以上。
取得
• 核心五套库清理的冗余库表占总数的
注:9月份完成首轮清理
12月1日
10月1日
我的DA之路
我从DBA到DA之路
1
数据库修理工+救火队员
4
数据架构是 企业层面的 关 注重点
2
数据库运维,预防 胜利一切
3
好系统是靠 设计、开发
出来的
15
运维DBA、开发DBA到数据架构师应该增强具备的素质 技术能力和业务能力 书面150 100
50 0
6:06:00 6:36:00 7:06:00 7:36:00 8:06:00 8:36:00 9:06:00 9:36:00 10:06:00 10:36:00 11:06:00 11:36:00 12:06:00 12:36:00 13:06:00 13:36:00 14:06:00 14:36:00 15:06:00 15:36:00 16:06:00 16:36:00 17:06:00 17:36:00
数据架构师
宏观数据架构
CRM
数据模型
ERP
数据模型
电子渠道
数据模型
客服
数据模型
开发 DBA
数据库设计 数据生命周期
开发 DBA
数据库设计 数据生命周期
开发 DBA
数据库设计 数据生命周期
……
开发 DBA
数据库设计 数据生命周期
运维 DBA
统一数据库基础运维
6
数据架构 Data Architecture
业务系统越来越多
CRM
网厅
计费
渠道
帐务
客服
短厅
…….
各系统烟囱式建设
产品搭积木式叠代开发
Φ 数据架构混乱 Φ 架构管理滞后 Φ 架构变更失控 Φ 数据无序增长
Φ 数据标准缺失
Φ 数据安全突出
Φ 数据架构黑盒
Φ 数据质量参差
10
新炬电信行业数据架构管理框架
宏观层面 微观层面 运营层面 治理层面
新炬数据架构管理框架
数据库主机CPU使用率均有不同程度的下降,优化产生相当于28颗同类型CPU的效能,如果
通过价格换算,CPU与存储总计节约成本753万。以营业库4台主机为例,CRM库12月1日较
CRMA1
100 80 60 40 20 0
12月1日
10月1日CPU使用率高峰期平均下降20%左右。
10月1日
生产业务数据库数据增长速度明显放缓,以营业A库为例:
Thank You!!
3
面对如此挑战,DBA该何去何从?
数据架构师
运维DBA
数据库专家
DA与运维DBA的区别
开发DBA
数据架构 设计
分析/设计
数据架构 管理
开发
运维DBA
那是开发 商的事
那也是开 发商的事
数据架构 实施
上线
没我啥事
数据架构 运营
运维
数据库 维护
5
数据架构师作为数据架构的管控者,将成为未来企业IT系统 规划、建设和运维核心力量
因此,亟需对数据资产进行有效的管理,提升 数据的价值 。
大数据时代的到来让IT的重点从“T”重新回到了“I”。
大数据时代对DBA提出了新的挑战
DBA的 挑战
产品 变迁
数据库产品不断迅速自我完善,Simple and Stupid成为 目前数据库产品发展方面
围绕数据库的产品也日益完善,DBA的工作难度大为降低
– 协助产品规划
18
架构师推荐学习的一些知识体系
数据质 量管理
数据架 构管理
数据开 发管理
元数据 管理
数据治 理
数据操 作管理
文档与内 容数据管
理
数据仓库 与商业智
能
数据安 全管理
参考数据 与主数据
DAMA数据资产管理体系图
TOGAF 架构开发方法论
19
12.03%。
成果
索引优化 • 共清理冗余索引24176个,超出目标
4176个,超预期20%以上。
• 核心五套库清理的冗余索引占总数的
11.78%。
1. 容量控制
模型精简 • 从318311张核心表精简出12697张
基础模型,精简度达4%,使模型
管理变得可控。
案例分享: X省业务支撑域数据生命周期管理具体案例
整体数据架构规划
数据分布管理
数据模型管理
数据业务流程分析
数据生命周期管理 数据安全管理
数据操作管理 数据质量管理
数据资产管理平台
数据资产管理制度和规范
数据资产管理团队
11
案例分享 :X省业务支撑域数据容量管理以及数据架构优化 服务
各套库CPU使用率均有所下降,核心数据
库CPU使用率高峰期平均下降20%。
把库字脱掉
—从DBA到DA
1
话题从大数据时代开始
社交网络
电子商务
在当前大数据的时代,数据被业界公认为是企 业的最宝贵资产之一,数据的价值得到认同。企业 依赖数据资产管理为其提供可靠、有价值和高质量 的数据,提供更好的产品和服务,降低开发和运维 移动互联 成本,控制风险,以及为企业提供更明智和更有效 的决策数据支持。
抽象思维能力和总结能力
全面的技术吸收和选择鉴
别能力
16
数据架构相关的专业知识
数据库和SQL开发优化技术 数据模型构建、设计和优化 整体数据库架构和规划 系统技术架构规划
专业技术知识以外需要关注业务知识
• 业务架构
– 业务领域知识 – 业务规范
• 业务流程
– 关注业务实现方法
• 组织
– 沟通能力
• 商业
系统 架构
IT系统日益复杂,大量新技术的涌现和应用, 使单一产品数据库为中心的系统架构被打破。
大量云化和分布式系统架构应用,打破了集 中式数据库的运维壁垒。
数据 变现
在 数 据 资 产 化 的 趋 势 下 , 企 业 IT 系 统 运 维的重点从单一的保稳定,提出了数据 资产变现、增值等更高的数据运维要求。