如何进行数据仓库的建设实施
数据仓库建模
•逻辑模型
•物理模型
•验证实例
PPT文档演模板
如何进行数据仓库的建设实施
实施过程
•1 •需求分析 •2 •逻辑分析 •3 •ODS建模 •4 •数据仓库建模 •5 •数据源分析
PPT文档演模板
•6 •数据获取与整合 •7 •应用分析 •8 •性能调优 •9 •数据展现 •10 •元数据管理
• •
•ETL1
•数据中心
•商务智能
•数据仓库
•ETL2
•操作型数据 存储(ODS)
•企业资源 •管理平台
全
公
局
共
数
信
据
息
字
模
典
型
•安 •运 •全 •维 •管 •管 •理 •理
•网省公 司
PPT文档演模板
•数 据 交 换
•网省公 司
如何进行数据仓库的建设实施
基本概念
ß 广义数据中心:
Þ 数据中心是提供所有应用系统的运营场所。 Þ 数据中心也是容纳用以支持应用系统运行的基础设施(包括服务器、网
•6 •数据获取与整合 •7 •应用分析 •8 •性能调优 •9 •数据展现 •10 •元数据管理
如何进行数据仓库的建设实施
逻辑分析
•处理逻辑分析 •支撑数据分析 •业务元数据建立
ß 单一主题处理逻辑分析
Þ 从业务逻辑入手,分析各指标的组成关系;
ß 多主题处理逻辑分析
Þ 综合考虑各分析主题间的逻辑关系;
•实际调研 •需求规格说明书
• 调研内容:针对不同层面的人员,调研内容不同
• 对业务人员
– 平时工作中最关心的是哪些指标?有哪几个指标与此分析主题有关? – 平时直属领导通常询问哪些指标?在这些指标中哪几个和此分析主题有关? – 业务人员目前的工作重点有哪些和此主题相关,和哪几个指标相关? – 业务人员对数据仓库的期望是什么? – 业务人员希望系统能提供哪些分析功能? – 业务人员希望以何种方式来看这些指标? – 业务人员希望对这些指标进行哪些方面的比较?
PPT文档演模板
如何进行数据仓库的建设实施
需求分析 •调研计划
•实际调研 •需求规格说明书
• 调研内容:针对不同层面的人员,调研内容不同
• 对IT人员
– 此主题所需要的数据源都取自哪些业务系统? – 与本主题有关的现有的业务系统的数据结构怎样? – 与本主题有关的现有的业务系统的数据更新频率如何? – IT人员对数据仓库的期望是什么? – IT人员在平时的工作中最关心的哪些指标?
集 成
•基础 支撑功
•单点登录 •个性化定制 •多渠道接入 •Portlet框架 •虚拟门户 •门户管理与维护
能
•身份认证登
•身录份
•认证
管理
代理
•人员 目录
•认证 目录
•业 务 流 程 集 成
•业务系统
•人力资源
•营销管理
•安全生产
•财务管理
•物资管理
•项目管理
•协同办公
•业 务 数 据 集 成
•综合管理
ORACLE数据源
•数据质量
名称 用电分类 电价表 行业 欠费信息表 客户信息 电量与电费表 地区(单位) 部门 电压
AC_ELEC_CLASS AC_TARIFF AC_TRADE_TYPE CHG_RECEIVABLES EP_CUST_INFO EP_RESULT SU_AREA SU_DEPT AC_VOLT_GRADE
PPT文档演模板
•6 •数据获取与整合 •7 •应用分析 •8 •性能调优 •9 •数据展现 •10 •元数据管理
如何进行数据仓库的建设实施
ODS建模
•逻辑模型
•物理模型
•验证实例
ß ODS逻辑模型
Þ 逻辑结构:完成实体的定义,各实体间的关系等 Þ 存储周期(立即删除、过一段时间删除或者是备份到其它介质上) Þ 存储粒度(与源系统基本保持一致)
法? – 目前状况下,针对这些指标都有哪些展现方式? – 领导层对数据仓库的期望是什么? – 领导层希望决策分析系统能提供哪些分析功能? – 领导层希望以何种方式来看这些指标? – 领导层希望对这些指标进行哪些方面的比较?
PPT文档演模板
如何进行数据仓库的建设实施
需求分析
•调研计划
•实际调研 •需求规格说明书
ß ODS物理模型
Þ 数据的存储结构 Þ 索引策略 Þ 数据存放位置(硬盘或磁带等) Þ 存储分配 Þ 分区设计
PPT文档演模板
如何进行数据仓库的建设实施
ODS建模
•逻辑模型
•物理模型
•验证实例
PPT文档演模板
如何进行数据仓库的建设实施
实施过程
•1 •需求分析 •2 •逻辑分析 •3 •ODS建模 •4 •数据仓库建模 •5 •数据源分析
电价表
Price
计费日期对应电价日期
cal_price_date
单位代码
Dept
行业代码表
Code_trade_new
电压代码表
Codvolt
时段
Code_period
用户类别
Code_user_type
用户使用电表
User_ammeter
用电分类代码表
rep_salse_kind
用电分类与用电性质关系表
PPT文档演模板
如何进行数据仓库的建设实施
需求分析
•调研计划
•实际调研 •需求规格说明书
• 需求规格说明书
– 需求规格说明书模板详见附录4
PPT文档演模板
如何进行数据仓库的建设实施
实施过程
•1 •需求分析 •2 •逻辑分析 •3 •ODS建模 •4 •数据仓库建模 •5 •数据源分析
PPT文档演模板
如何进行数据仓库的建设实施
需求分析
调研内容 内容1 内容2 内容3 内容4 …
•调研计划
•实际调研 •需求规格说明书
调研对象
调研时间
调研地点
PPT文档演模板
如何进行数据仓库的建设实施
需求分析
•调研计划
•实际调研 •需求规格说明书
• 调研方式:
– 当面访谈; – 问卷调查;
– 访谈及问卷提纲模板请参见附录2
PPT文档演模板
•6 •数据获取与整合 •7 •应用分析 •8 •性能调优 •9 •数据展现 •10 •元数据管理
如何进行数据仓库的建设实施
•
•数据展现
•元
•性能调优
•数
•据
系 统
•应用设计
•数据的获取与整 合
•管
建 设 过
•ODS建模 •数据仓库建 模
•源数据分析
•理
程
•逻辑分析
•需求分析
PPT文档演模板
rep_salse_relation
其它电费数据
Bill_data_oth
如何进行数据仓库的建设实施
名称 用电类 电价表 行业 欠费信息表 客户信息 电量与电费表 地区(单位) 部门 电压
数据源分析
•数据源范围 •数据源格式 •数据更新频率 •数据量
•数据质量
代码 AC_ELEC_CLASS AC_TARIFF AC_TRADE_TYPE CHG_RECEIVABLES EP_CUST_INFO EP_RESULT SU_AREA SU_DEPT AC_VOLT_GRADE
国网典设建议的甲方项目组织
PPT文档演模板
如何进行数据仓库的建设实施
海联讯的项目组织
PPT文档演模板
如何进行数据仓库的建设实施
实施过程
•1 •需求分析 •2 •逻辑分析 •3 •ODS建模 •4 •数据仓库建模 •5 •数据源分析
PPT文档演模板
•6 •数据获取与整合 •7 •应用分析 •8 •性能调优 •9 •数据展现 •10 •元数据管理
如何进行数据仓库的建设实施
数据源分析
•数据源范围 •数据源格式 •数据更新频率 •数据量
ß 数据源范围
包括数据源逻辑范围和物理范围
•数据质量
ß 数据源格式
理解各数据源的格式,确定统一的格式,制定相应的转换规则
PPT文档演模板
如何进行数据仓库的建设实施
数据源分析 •数据源范围 •数据源格式 •数据更新频率 •数据量
析方法?
– 目前状况下,针对这些指标都有哪些展现方式? – 中间管理层对数据仓库的期望是什么? – 中间管理层希望决策分析系统能提供哪些分析功能? – 中间管理层希望以何种方式来看这些指标? – 中间管理层希望对这些指标进行哪些方面的比较?
PPT文档演模板
如何进行数据仓库的建设实施
需求分析
•调研计划
ß 业务元数据包括以下信息:
Þ 使用者的业务术语所表达的数据模型、对象名和属性名; Þ 访问数据的原则和数据来源; Þ 系统所提供的分析方法及公式、报表信息。
PPT文档演模板
如何进行数据仓库的建设实施 实施过程•1 •需求分析 •2 •逻辑分析 •3 •ODS建模 •4 •数据仓库建模 •5 •数据源分析
络、存储设备)的物理地点。 Þ 数据中心本身的ODS、数据仓库及建立在其上的决策分析应用。 Þ 数据中心需要有一套成熟的运行、维护体系支持其日常运行,保证应用
系统高效地不间断运行,数据被正确的访问
ß 狭义数据中心:
Þ 狭义的数据中心是指数据仓库和建立在数据仓库之上的决策分析应用, 具体包括:数据源,数据的ETL,ODS数据库,数据仓库,数据集市,商 务智能应用和元数据管理等。
PPT文档演模板
如何进行数据仓库的建设实施
数据中心建设过程
•
•数据展现
•元
•性能调优