当前位置:文档之家› 数据仓库与商业智能系统建设可行性研究思路

数据仓库与商业智能系统建设可行性研究思路

6
二、相关理论与技术
1、数据仓库定义
数据仓库(Data Warehouse)是一个面向主题的 (Subject Oriented)、 集成的(Integrate)、相对稳定的 (Non-Volatile)、反映历史变化 (Time Variant)的数据集合,用于支持管理决策
7
二、相关理论与技术
2)为数据仓库建设和商业智能应用开发设计出可行的技术方案 3)指导广东电网公司数据仓库与商业智能项目的建设
5
一、研究背景与意义
3、项目目标
1)在调查和分析广东电网公司信息化现状与存在问题基础上,明确定义 项目建设的综合需求 2)设计广东电网公司数据仓库与商业智能项目具有全省共性的元数据规 范 3)设计广东电网公司数据仓库与商业智能项目建设的总体方案 4)论证项目建设的经济可行性与操作可行性 5)进行数据仓库与商业智能工具选型与经济运行分析
DM模型
DW
ETL
ODS
E T L / 源数据接口系统
通过ODS层在数据仓库
系统与业务应用系统
之间建立了一个“隔

离层”,可以有效地

降低DW系统对业务应

用系统的影响,提高
பைடு நூலகம்
系统的安全性。


……

生产
营销
工程
物资
财务
人力资源
带ODS的数据仓库体系结构
13
四、技术方案
1、体系架构
OLAP
DM模型

10
三、需求分析
2、DW与BI项目建设的必要性与意义
数据中心、EAI/EIP与DW/BI项目差异对照表
话题 项目
数据资源集中管理
数据资源重新组织
辅助决策支持
数据中心 1、设备集中管理


2、运行环境集中管理
EAI/EIP 1、集成统计指标数据 1、按管理主题组织数据
1、综合统计分析报表
DW/BI
1、集成高度概括数据 2、集成统计指标数据 3、集成业务细节数据
1.客户细分与个性化服务 2.生产\营销等计划制定与执行 3.全员劳动效能分析与评估 ……
业务决策
1.客户投诉与对策 2.停电模拟与停电方案 3.设备故障与检修计划 ……
1.客户投诉原因与服务质量跟踪 2.停电模拟与停电方案制定 3.设备故障预测与检修计划制定 ……
12
四、技术方案
1、体系架构
OLAP
1、按决策主题组织数据 2、按管理主题组织数据 3、按业务主题组织数据
1、数据挖掘与知识发现 2、数据关联分析 3、数据切片、切块、旋转
及钻取OLAP操作分析
11
三、需求分析
3、需求分析
1)用户需求
电网结构与信息结构
一个业务决策、管理决策与战略决策功能需求的例子
决策层次与决策指标 决策层 需求
优点: 1、可使用数据中心数据,降低数据抽取成本
缺点: 1、技术与管理复杂 2、可能出现EAI/EIP数据与DW数据的一致性问题
15
五、建设方案
1、省市独立,分布集中式架构
1)省级数据仓 库建设在一个省 级软硬件平台上;
2)地市数据仓 库建立在独立的 地市级软硬件平 台上;
3)先建设地市 数据仓库,最后 集中到省级仓库。
决策需求
功能描述
决策模型与决策功能 2)系统开发需求 3)平台与工具需求
战略决策 管理决策
1.电价敏感度分析 2.负荷预测与电网规划 3.投资风险与资本运营 ……
1.客户细分与大客户关系 2.计划制定与执行 3.全员劳动生产率 ……
1.消费习惯与电价敏感度关系 2.中长期负荷预测与电网规划 3.项目评估与效益分析 ……
广东电网公司主营业务信息资源统计表
应用系统资源 特大型 大型 中型
数据资源(GB) 特大型 大型 中型
年增长量(GB) 特大型 大型 中型
50GB 30GB 20GB 5MB 3MB 2MB
财务系统
存在以下问题:
人力资源系统 技改科技系统
1)信息化应用水平较低 2)数据库资源综合利用率不高 3)数据实体缺乏规范
8
二、相关理论与技术
3、技术与工具
1)数据仓库建模工具 2)数据抽取工具(ETL工具) 3)数据存储技术 4)前端数据访问与分析工具 5)数据仓库管理工具
9
三、需求分析
1、现状分析
主营业务系统
从以下角度来分析: 生产系统
1)管理架构
营销系统
2)信息资源 3)通信网络
安全监察系统 物资系统 工程系统
方案二
1、ETL工具
方案三
1、数据中心 2、ETL工具
优缺点
优点: 1、使用EAI数据集成的数据,可降低数据抽取成本 2、保持EAI/EIP数据与DW数据的一致性
缺点: 1、技术与管理复杂
优点: 1、数据抽取技术路线独立 2、技术与管理简单
缺点: 1、可能出现EAI/EIP数据与DW数据的一致性问题
2、相关理论
1)DW与BI系统体系结构
2)DW的元数据
技术元数据、商业元数据
3)DW的数据建模
4)DW的OLAP分析 5)DW的DM模型
OLAP元数据 DW元数据
ETL工具
数据仓库
OLAP服务器 服务
数据源
数据集市 数据集市 数据集市 部门级数据仓库
DM 模型服务器
前端 BI工具 查询工具
报表工具 分析工具 挖掘工具
3
一、研究背景与意义
1、研究背景
1)南方电网“两型两化” 的企业发展战略 2)如何综合开发利用已有的数据资源?如何从这些大量集中的数据资源 中挖掘具有商业价值的信息? 3)数据仓库系统建设的复杂性及高难度
4
一、研究背景与意义
2、研究意义
1)明确广东电网公司数据仓库建设项目要解决的主要问题 项目建设的需求问题 建设的总体方案问题 项目建设的经济可行性与操作可行性问题
16
五、建设方案
2、省市独立,集中分布式架构
1)省级数据仓 库建设在一个省 级软硬件平台上;
2)地市数据集 市建立在独立的 地市级软硬件平 台上;
数据仓库与商业智
能系统建设可行性 研究思路
数据仓库(DW)与商业智能(BI ) 系统建设可行性研究思路
中山大学计算科学与计算机应用研究所 2006年12月
2
数据仓库与商业智能系统建设可行性研究
一、研究背景与意义 二、相关理论与技术 三、需求分析 四、技术方案 五、建设方案 六、可行性分析 七、研究所简介

DW

E T L / 源数据接口系统


……

生产
营销
工程
物资
财务
人力资源
不带ODS的数据仓库体系结构
14
四、技术方案
2、数据抽取方案
1)与EAI/EIP平台结合的方案 2)与EAI/EIP相对独立的方案 3)与数据中心建设结合的方案 三个数据抽取方案的比较
方案
比较
方案一
数据抽取
1、EAI工具 2、ETL工具
相关主题