当前位置:
文档之家› 第3章 数据仓库系统的设计与开发答辩PPT课件
第3章 数据仓库系统的设计与开发答辩PPT课件
3.2.3采用信息包图法进行概念模型设计
3.1.1建立一个数据仓库系统的参考步骤
收集和分析业务需求步骤 建立数据模型和数据仓库的物理设计 定义数据源 选择数据仓库技术和平台 从操作型数据库中抽取、清洗及转换数据到数据仓库 选择访问和报表工具,选择数据库连接软件,选择数据分析和数据
展示软件 更新数据仓库
3.1.2数据仓库系统的生命周期
数据仓库系统的开发与设计是一个动态的反馈和循环过程。 一个数据仓库系统包括: 数据仓库数据库 数据分析应用系统
3.1.2数据仓库系统的生命周期
分析
体系结构设计
逻辑模型
概念模型 规范与需求分析 用户评价与反馈
数据库与元数据
设计
数据仓库 系统的 生命周期
维护
数据的ETL处理 中间件开发
系统维护 系统上线应用
3.1数据仓库系统的设计与开发
建立一个数据仓库系统的参考步骤 数据仓库系统的生命周期 创建数据仓库系统的两种思维模式 数据仓库数据库的设计步骤
3.1.1建立一个数据仓库系统的参考步骤
数据仓库系统的建立是一个复杂而漫长的过程。涉及到: 源数据库系统 数据仓库对应的数据库系统 数据分析与报表工具 ……
实施
安装与测试 系统
数据填充与调试
3.1.3建立数据仓库系统的两种思维模式
自顶向下(Top-down) 将数据通过ETL汇集到数据仓库中,然后再把数据通过复制的方
式存入各个数据集市中。 自底向上(Bottom-Up)
通过ETL将数据汇集到数据集市中,再将数据汇集到数据仓库中。
3.1.4数据仓库数据库的设计步骤
报表(SSRS)
作用Function
数据抽取 数据整合
商业智能应用BI
从企业各业务数据中 获取有用信息,实现 与业务流程的统一
OLAP 数据挖掘
为已有数据建立模 型,分析并找出数 据的内在关系
自定义报表 数据展现
对分析结果提供类型 多样、美观且适合不 同需求的图表和报告
3.2基于SQL Server的数据仓库数据库设计
包括以下步骤:
分析组织的业务状况及数据源结构 组织需求调研,收集业务需求 采用信息包图法进行数据仓库的概念模型设计 利用星形图进行数据仓库的逻辑模型设计 数据仓库的物理模型设计
3.2.1分析组织的业务状况及数据源结构
以SQL Server 2005实例数据库Adventure Works DW中所描述 Adventure Works Cycles公司的用户需求为例。 公司概况 业务系统流程介绍 对数据源结构的分析与理解
信息包图 星型、雪花模型 物理数据模型
概念模型 逻辑模型 物理模型
3.2.3采用信息包图法进行概念模型设计
信息包图法简介
信息包图:是数据仓库的数据模型的第一层或最高层。由于大多数 商务数据是多维的,但传统的数据模型表示三维以上的数据有一定 困难。而信息包图简化了这一过程并且允许用户设计多维信息包并 与开发者和其他用户建立联系。这种模型集中在用户对信息包的需 要,信息包提供了分析人员思维模式的可视化表示。
信息包图的建立
信息包: 维度
类别
指标和事实 空白信息包图样式
3.3.3采用信息包图法进行概念模型设计
〖例〗试画出销售分析的信息包图。 解:首先根据销售分析的实际需求,确定信息包的维度、类别和指标
与事实: (1)维度:包括日期维、区域维、产品维、客户维、广告维(待用)
等。 (2)类别:确定各维的详细类别,如:日期维包括年(5)、季度
(20)、月(60)、日(1800),括号中的数字分别指出各类别的 数量;区域维包括国家(10)、省州(100)、城市(500)、销售 点(8000),括号中的数字同样分别指出各类别的数量;类似地, 可以确定产品维、客户维、广告维等的详细类别。 (3)指标和事实:确定用于进行分析的数值化信息,包括实际销售 额、计划销售额和计划完成率。
有反复的逐步设计过程
面向用户的需求 详细的技术细节
业务 需求
收集、分析和确认
概念模型设计
常用方法:信息包图法 关键任务:分析和理解数据仓库中的主题
将需求模型转为关系模型
逻辑模型设计
常用方法:星形图法 关键任务:事实表与维度表的设计,包括事实、
粒度、聚合与分割、维度等问题的确定
由关系模型转为存储模型
物理模型设计
常用方法:关系表(通用数据库物理设计法) 关键任务:物理数据库表及其存储结构设计
第3章 目 录
1 数据仓库系统的设计与开发概述 2 基于SQL2005的数据仓库数据库设计 3 使用SQL2005建立多维数据模型 4 小结
3.2基于SQL Server的数据仓库数据库设计
SQL Server 2005介绍 集成了三个服务。
数据仓库与数据挖掘
第3章 数据仓库系统的设计与开发
通过对数据仓库的概念、体系结 构与存储结构、ETL过程等内容了 解以后,如何建立数据仓库系统 呢?
教师:郭荣熙
第3章 目 录
1 数据仓库系统的设计与开发概述 2 基于SQL2005的数据仓库数据库设计 3 使用SQL2005建立多维数据模型 4 小结
3.2.2组织需求调研,收集业务需求
坚持数据驱动+用户(需求)驱动的设计理体念,因此需要充分了解用 户的需求,进而对需求进行分析。
关于用户需求的调研(确定主题域) 对用户需求调研结果的分析(确定度量指标和维度)
3.2.3采用信息包图法进行概念模型设计
面向用户的需求
细 化 层 次
更详细的 技术细节
SQL Ser的数据仓库数据库设计
MS SQL Server 2005的数据仓库架构
服务Service
SQL Server Business Intelligence Development Studio
集成(SSIS)
分析(SSAS)
3.2.3采用信息包图法进行概念模型设计
工作: 确定系统边界:决策类型、需要的信息、原始信息 确定主题域及其内容:主题域的公共键码、联系、属性组 确定维度:如时间维、销售位置维、产品维、组别维等 确定类别:相应维的详细类别 确定指标和事实:用于进行分析的数值化信息
3.2.3采用信息包图法进行概念模型设计