数据仓库的基本概念
第 一
量的企业内部数据和外部数据。
章
❖ 传统数据库中的大量数据是事务型数据,即该
数 据
数据是对每一项工作、管理对象的具体的、细
仓
节性的描述。
库 的
❖ 事务处理型应用与分析决策型应用对数据库系
基
统的性能要求不同。
本
概
❖ 传统数据库中保存和管理的一般是当前数据,
念
而决策支持系统不仅需要当前的数据,而且还
数据仓库的多维数据存储结构为OLAP的实施
本
概
提供了理想的多维数据环境。
念
数据集市: (Data Mart)
第
一
数据集市是完整的数据仓库的一个逻辑子集,
章
而数据仓库正是由其所有的数据集市有机组合而
数
据
成的。
仓
库
一般在某个业务部门建立数据集市,或称为
的 基
部门级数据仓库。
本 概
建立数据集市与数据仓库,一般是采用“自
一
章
需求特点
需求事先可知道
需求事先不知道
数
据
操作特点
一个时刻操作一单元 一个时刻操作一集合
仓 库
数据库设计
基于E-R图
基于星型模式、雪花模式
的
一次操作数据量 一次操作数据量小 一次操作数据量大
基
本
存取频率
较高
较低
概
念
响应时间
小于3秒
几秒—几十分钟
1-3 数据仓库技术的术语
第 一
主题: (Subject)
念
顶向下”和“自下而上”相结合的设计思想。
讨论题:
第
一 章
1、结合陕西科技大学大学学生学籍管理系统
数
进行数据仓库的主题划分,列举有哪些主题。
据
仓
库 的
基
本 概
念
1-4 多维数据模型
第
多维数据模型是进行决策支持数据建模的最好
一 章
方式,数据仓库采用多维数据模型不仅能使其使用
数
方便,而且能提高系统的性能。
要求有大量的历史数据。
结论:
第 一
在事务处理型应用环境中直接构建分析
章
决策型应用是不可行的。
数
据
仓 库
于是:
的 基
面向分析决策型应用而组织和存储数据
本 概
的数据仓库技术应运而生。
念
时间:20世纪80年代初
第
人物:W.H.Inmon
一
章
定义: 数据仓库是面向主题的、集成的、
数 据
具有时间特征的、稳定的数据集合,用以支持经
数
地区维:不同地区的销售数据;
据
客户维:不同客户的销售;
仓
……
库
根据观察事物角度的细节程度不同,维又具有
的
基
维层次。数据;
本
渠道维:不同销售渠道的销售数据;
概
产品维:不同产品的销售数据
念
例:时间维:日期、周、月份、季度、年等;
地区维:城市、地区、国家等。
数据立方体:
第
一 章
数据立方体是指由两个或更多个属性即两个
仓
营管理中的决策制定过程。
库
的 基
A data warehouse is a subject-oriented,integrated,
本
time-variant,and nonvolatile collection of data in support of
概
management’s decision making process.
支持管理需求,获取信息
数 据
使用人员 办事员、DBA、数据库专家 经理、管理人员、分析专家
仓
数据内容 当前数据
库
历史数据、派生数据
的
数据特点 细节的
综合的或提炼的
基
本
数据组织 面向应用
面向主题
概 念
存取类型 添加、修改、查询、删除 查询、聚集
数据稳定性 动态的
相对稳定
续上表:
第
操作型数据库 分析型数据仓库
章
Data Schema)表示。
数 据
每一个多维数据模式都是由一个事实表(Fact
仓
Table)和一组维表(Dimension Table)组成。
库
的
事实表的主码是组合码,维表的主码是简单码,
基
本
每一张维表中的简单码与事实表组合码中的一个组
概 念
成部分相对应。
企业销售数据的多维数据模式图
第
一
章
时间维表
据 仓
于联机事务处理(OLTP,On-Line Transaction Process),
库
数据库中保存的是大量的日常业务数据。
的
基
在数据共享、数据与应用程序的独立性、维护
本
概
数据的一致性与完整性、数据的安全保密性等方面
念
提供了有效的手段。
与分析型应用结合时存在的问题:
❖ 决策支持系统为掌握充分的信息,需要访问大
章
主题是一个在较高层次上将数据归类的标准,
数 据
每一个主题基本对应一个宏观的分析领域。
仓 库
例:面向主题:产品订货分析,货物发运分析, 新产品
的
开发分析;
基 本
面向应用:财务,销售,供应,人力资源,生产调度…….
概 念
主题域的特征:独立性,完备性
粒度:(Granularity)
第 一
粒度是指数据仓库中数据单元的详细程度和
念
数据仓库的四大特征:
第
数据是面向主题的
一 章
数据是集成的
数
数据是具有时间特征的
据 仓
数据是相对稳定的
库 的
数据仓库的其它特点:
基 本
数据量非常大(10GB---1000GB)
概 念
是数据库技术的一种新的应用
使用人员较少
1-2 数据仓库与数据库
第
操作型数据库
分析型数据仓库
一
章
系统目的 支持日常操作
据
仓
1-4-1 实体关系模型与多维模型
库Байду номын сангаас
的
实体关系模型应用于操作型数据库系统,多维
基
本
模型应用于分析型数据仓库系统。
概 念
实体关系模型不适用于以查询为主的分析型应
用,具体表现在:使用者、界面、检索手段。
多维数据模型以直观的方式组织数据,每一个
第 一
多维数据模型由多个多维数据模式(Dimensional
章
级别。
数
据
数据越详细,粒度越小,级别越低,回答查
仓
询的种类就越多。(数据堆积,回答综合问题效
库
的
率低)
基 本
数据越综合,粒度越大,级别越高,回答查
概
询的种类就越少。
念
维度:(Dimension)
维度是指人们观察事物的角度。
第
一
例如:当人们关注产品销售情况时,有如下维度:
章
时间维:随时间变化的销售数据;
案例讨论:下图展示了某电信公司的市场部和计划
部对业务A是否具有市场前景的分析过程和结果。
第
一
试讨论为什么两部门分析结果不同。
章
数
据 仓 库
市场部
分析程序1
分析结果1:
前景很好
的
企业级数据库
基
本 概
计划部
分析程序2
分析结果2:
前景不好
念
第一章:数据仓库的基本概念
第
一
1-1 数据仓库的产生与发展
章
数
传统的数据库技术作为数据管理手段,主要用
数
或更多个维来描述或者分类的数据。
据 仓
在三维的情况下可以用图形来表示,一般称
库 的
为数据立方体。
基 本
实际的数据仓库的应用中,数据是多维的。
概
念
联机分析处理: (OLAP)
第
一
联机分析处理是快速、灵活的多维数据分析工
章
数
具。
据 仓
OLAP的目的是支持分析决策,满足多维环境
库
的查询和报表需求。
的
基