当前位置:文档之家› 第三章数据仓库开发应用过程

第三章数据仓库开发应用过程


对于超市的销售主题,采用多重粒度较
为适宜,考虑到销售记录数量的庞大,以及
对销售的分析以销售统计以及销售趋势分析
为主,商品销售数据的综合层次可以分为每
1.概念模型的需求调查
概念模型的需求调查,是以DW开发任务 书(包括组织现状、业务功能及范围、组织 发展的战略、需决策支持的方面等)为基础 进行的。
第三章数据仓库开发应用过程
•CH 3
调查对象 包括组织中的DW项目负责人、知识用户、
信息用户和信息管理人员。 项目负责人
—— 通过项目负责人在开发者和用户之 间进行沟通,以确定用户的信息需求、定义 系统以及界定系统边界。
第三章数据仓库开发应用过程
•CH
2.DW的螺旋式开发方法
3
如前所述,DW的一个生命周期包含三个
阶段。然而,一个完善的DW需要经历若干个
生命周期完成——每个DW生命周期积累的经 验,一方面可以用于未来其他主题的开发应 用,另一方面,可以用于完善原DW。
上述过程便构成了数据仓库的螺旋式开
发方法,该方法是目前DW开发的主要方法。
——评审标准:是否真实反映了开发DW的
目的,信息需求表准确否,DW的主题全面否,
ERD、星形/雪花模型是否如实反映了用户的决
策分析环境等。
第三章数据仓库开发应用过程
•CH
§4 DW逻辑模型设计
3
逻辑模型是物理模型和概念模型之间的
桥梁,它与DW物理实现时所使用的数据库相
关 ——大多为RDBMS,故此,逻辑模型主要
第三章数据仓库开发应 用过程
2020/12/7
第三章数据仓库开发应用过程
•CH
§1 DW开发应用的特点
3
DW的开发也具有其特有的、完整的生命 周期——DW规划分析阶段、DW设计实施阶段 以及DW使用维护阶段。该三个阶段将循环往 复,直至一个完善的DW开发完毕。
1.DW开发的阶段性
借鉴Nolan阶段模型,可以将DW的开发阶 段划分为:创始阶段、成长阶段、控制阶段 和成熟阶段等四个阶段。[课后阅读]
可见,DW的目标非常繁多复杂,需开发 人员与用户不断交流来确定。
第三章数据仓库开发应用过程
•CH
实现范围:
3
基于用户的角度
➢ 谁[人员/部门]使用DW;
➢ DW有哪些查询——它们确定了概括、 聚集、集成、重构等的技术要求以及报表的
种类等。
基于技术的角度
➢ 确定DW的元数据库的规模——间接地 确定了DW要管理的数据量。
第三章数据仓库开发应用过程
•CH
1.分析主题域
3
数据仓库的建立是一个循环的过程——
一般每次循环建立建立一个/几个主题域。
超市DW概念模型中,确立了三个基本主 题域(商品、销售、客户)——经分析可发 现,其中销售是超市的基本业务,也是进行 决策分析的主要领域,因此,决定首先建立 并实施销售主题域。
第三章数据仓库开发应用过程
第三章数据仓库开发应用过程
•CH 3
• 用于描述DW数据源的 物理状况。
第三章数据仓库开发应用过程
•CH
3.概念模型的分析
3
Байду номын сангаас
概念模型主要在设计者与用户之间交流
对业务过程的认识,一般用ER图表示,仍以
超市为例——考虑决策者的分析需求,确定
超市DW的三个基本主题域:销售主题、商品
主题和客户主题,则其概念模型如下:
概念模型是否准确、完整地描述了用户的决
策分析环境。
第三章数据仓库开发应用过程
•CH
概念模型的评审人员
3
——DW项目负责人、DW分析人员、DW设计
人员、DW用户,一般限制在十人以下。
概念模型的评审内容
——评审资料有:DW开发任务书,用户信
息需求表,DW主题说明书,ERD,概念模型设
计成果(星形模型或雪花模型);
第三章数据仓库开发应用过程
•CH 3
例 —— 某超市的DW设计 日趋激烈的竞争环境,要求决策者能够
更准确地了解超市的经营状况,跟踪市场趋 势,制定合理的采购与销售策略。之前由于 业务需求,已建立了若干业务处理系统,如 人事、库存、销售、采购等。由于这些业务 处理系统各自为政,缺乏全局性,因此,难 以从中进行全局性的分析工作并获取相关报 表。所以,决策者决定建立一个DW。[明确决 策需求,进一步确定所需信息]
第三章数据仓库开发应用过程
•CH
➢ 不断循环的启发式过程
3
DW的开发是一个动态反馈的、启发式的
循环过程:
一方面,DW的数据内容、结构、数据粒
度、分割及其他物理模型及其设计需根据用 户的反馈信息不断调整和完善,以提高系统
的效率和性能;
另一方面,通过不断理解用户的决策分
析需求,来调整和完善DW,以提供更为准确
第三章数据仓库开发应用过程
•规划分析阶段
•数据仓库 •开发过程
•使用维护阶段
•设计实施阶段
•CH 3
DW的螺旋式开发方法
第三章数据仓库开发应用过程
•CH
3.数据仓库开发的特点
3
➢ 数据驱动的设计方法
① 用业务系统的数据创建DW
DB系统有什么→对DW有何影响;
DB数据→主题领域[联系];
数据模型→DB与主题数据的共同性。
•CH
② DW的技术平台结构
3
➢ 单层结构——数据源与DW共享平台或
数据源、DW、数据集市、最终用户工作站使
用同一平台;
➢ C/S结构;
➢ 三层C/S结构——包括基于工作站的
客户层、基于服务器的中间层、基于主机的
第三层;
➢ 多层式结构——在三层结构基础上发
展起来的,可多达五层(存储层、服务层、
查询层、应用层、客户层)。
第三章数据仓库开发应用过程
•CH 3
3.选择DW的体系结构 一般基于DW的应用结构和DW的技术平台
结构两个方面来考虑。 ① DW的应用结构
➢ 基于业务处理系统的DW——虚拟DW; ➢ 单纯DW(所有应用都在DW中进行); ➢ 单纯数据集市(部门级DW); ➢ DW与数据集市(最佳体系结构)。
第三章数据仓库开发应用过程
第三章数据仓库开发应用过程
•CH
① DW用户的决策分析
3
基于开发DW的初衷,超市决策者迫切希
望掌握超市的库存情况和销售情况。
为制定一个营销策略,决策者要进行以
下分析:超市促销效果,客户购买趋势,商
品供应市场变化趋势以及供应商和客户的信
用等级等。
② 支持决策的数据需求分析
为完成上述分析,决策者需要促销策略
第三章数据仓库开发应用过程
•CH
给出每个主题的属性后,便得到完整的 3 概念模型了:
第三章数据仓库开发应用过程
•CH 3
4.概念模型的设计 以概念模型的分析结果以及概念模型的
定义中收集到的数据为基础,完成星形或雪 花模型的设计。
前面的 ERD只适合于业务处理系统的设 计而不能用于DW的设计。
实际中,选取星形模型还是雪花模型取 决于用户的决策分析需求。
报表形式?等等。
③ DW成功因素的建议、希望DW做什么?
第三章数据仓库开发应用过程
•CH
知识用户与信息用户
3
—— 主要调查信息的来源,包括:
① 用户承担的工作及所需信息?信息的
来源?信息处理方式?所在部门使用哪些信
息系统?这些系统提供哪些分析信息?
② 用户使用什么样的计算机系统?其中
有哪些应用程序?对这些程序的熟悉程度?
第三章数据仓库开发应用过程
•CH 3
4.建立DW使用方案和项目规划预算 使用方案——实际上是DW需求的一个重
要的原型,体现了用户参与的原则。 规划预算——估算项目投资额,可根据
以往软件开发确定,或根据参照结构估算。
最后,要撰写规划说明书。
第三章数据仓库开发应用过程
•CH
§3 DW概念模型设计
3
概念模型设计包括概念模型的需求调查、 概念模型的定义、概念模型的分析以及概念 模型的设计四个阶段。
第三章数据仓库开发应用过程
•CH 3
第三章数据仓库开发应用过程
•CH 3
第三章数据仓库开发应用过程
•CH
5.概念模型文档与评审
3
概念模型设计文档
——主要包括DW开发需求分析报告、概
念模型分析报告、概念模型以及概念模型评
审报告。
概念模型的评审
——DW开发中经常出现这类的阶段性评
审[好处?]。概念模型的评审主要用于确定
第三章数据仓库开发应用过程
•CH 3
② 自下而上策略 ➢ 较灵活——一般从某个原型开始,常
用于开发数据集市; ➢ 一般用于试点[对DW技术的评价,运
行DW的各种费用等]; ➢ 适合采用螺旋式的原型开发方法。
③ 混合策略 难以操作——需要精通方方面面的专家。
第三章数据仓库开发应用过程
•CH 3
2.确定DW的开发目标和实现范围 为此,需要对用户说明DW应用和发展趋
③ 了解DW否?希望DW达到什么目的?如
何衡量是否达到此目的?工作中尚未获得哪
些信息?
④ 如何评价DW(同前)?
第三章数据仓库开发应用过程
•CH 3
信息管理人员 —— 主要调查组织所用的系统环境,比
如组织有否DSS?其用户是谁?提供什么支持 信息?等等。
可见,需求调查过程中,开发人员应该 关注的是管理决策中关于信息的需求、用户 的基本情况、用户使用信息的情况,而非像 业务处理系统开发那样,向被调查人员询问 系统应该具有哪些功能!
采用的是关系模型——利用关系模型不仅可
以设计指标实体,还可以设计维实体以及详
相关主题