当前位置:文档之家› 数据仓库的基本概念

数据仓库的基本概念


第 一
量的企业内部数据和外部数据。

❖ 传统数据库中的大量数据是事务型数据,即该
数 据
数据是对每一项工作、管理对象的具体的、细

节性的描述。
库 的
❖ 事务处理型应用与分析决策型应用对数据库系

统的性能要求不同。


❖ 传统数据库中保存和管理的一般是当前数据,

而决策支持系统不仅需要当前的数据,而且还
数据仓库的多维数据存储结构为OLAP的实施


提供了理想的多维数据环境。

数据集市: (Data Mart)


数据集市是完整的数据仓库的一个逻辑子集,

而数据仓库正是由其所有的数据集市有机组合而


成的。


一般在某个业务部门建立数据集市,或称为
的 基
部门级数据仓库。
本 概
建立数据集市与数据仓库,一般是采用“自


需求特点
需求事先可知道
需求事先不知道


操作特点
一个时刻操作一单元 一个时刻操作一集合
仓 库
数据库设计
基于E-R图
基于星型模式、雪花模式

一次操作数据量 一次操作数据量小 一次操作数据量大


存取频率
较高
较低


响应时间
小于3秒
几秒—几十分钟
1-3 数据仓库技术的术语
第 一
主题: (Subject)

顶向下”和“自下而上”相结合的设计思想。
讨论题:

一 章
1、结合陕西科技大学大学学生学籍管理系统

进行数据仓库的主题划分,列举有哪些主题。


库 的

本 概

1-4 多维数据模型

多维数据模型是进行决策支持数据建模的最好
一 章
方式,数据仓库采用多维数据模型不仅能使其使用

方便,而且能提高系统的性能。
要求有大量的历史数据。
结论:
第 一
在事务处理型应用环境中直接构建分析

决策型应用是不可行的。


仓 库
于是:
的 基
面向分析决策型应用而组织和存储数据
本 概
的数据仓库技术应运而生。

时间:20世纪80年代初

人物:W.H.Inmon


定义: 数据仓库是面向主题的、集成的、
数 据
具有时间特征的、稳定的数据集合,用以支持经

地区维:不同地区的销售数据;

客户维:不同客户的销售;

……

根据观察事物角度的细节程度不同,维又具有


维层次。数据;

渠道维:不同销售渠道的销售数据;

产品维:不同产品的销售数据

例:时间维:日期、周、月份、季度、年等;
地区维:城市、地区、国家等。
数据立方体:

一 章
数据立方体是指由两个或更多个属性即两个

营管理中的决策制定过程。

的 基
A data warehouse is a subject-oriented,integrated,

time-variant,and nonvolatile collection of data in support of

management’s decision making process.
支持管理需求,获取信息
数 据
使用人员 办事员、DBA、数据库专家 经理、管理人员、分析专家

数据内容 当前数据

历史数据、派生数据

数据特点 细节的
综合的或提炼的


数据组织 面向应用
面向主题
概 念
存取类型 添加、修改、查询、删除 查询、聚集
数据稳定性 动态的
相对稳定
续上表:

操作型数据库 分析型数据仓库

Data Schema)表示。
数 据
每一个多维数据模式都是由一个事实表(Fact

Table)和一组维表(Dimension Table)组成。


事实表的主码是组合码,维表的主码是简单码,


每一张维表中的简单码与事实表组合码中的一个组
概 念
成部分相对应。
企业销售数据的多维数据模式图



时间维表
据 仓
于联机事务处理(OLTP,On-Line Transaction Process),

数据库中保存的是大量的日常业务数据。


在数据共享、数据与应用程序的独立性、维护


数据的一致性与完整性、数据的安全保密性等方面

提供了有效的手段。
与分析型应用结合时存在的问题:
❖ 决策支持系统为掌握充分的信息,需要访问大

主题是一个在较高层次上将数据归类的标准,
数 据
每一个主题基本对应一个宏观的分析领域。
仓 库
例:面向主题:产品订货分析,货物发运分析, 新产品

开发分析;
基 本
面向应用:财务,销售,供应,人力资源,生产调度…….
概 念
主题域的特征:独立性,完备性
粒度:(Granularity)
第 一
粒度是指数据仓库中数据单元的详细程度和

数据仓库的四大特征:

数据是面向主题的
一 章
数据是集成的

数据是具有时间特征的
据 仓
数据是相对稳定的
库 的
数据仓库的其它特点:
基 本
数据量非常大(10GB---1000GB)
概 念
是数据库技术的一种新的应用
使用人员较少
1-2 数据仓库与数据库

操作型数据库
分析型数据仓库


系统目的 支持日常操作


1-4-1 实体关系模型与多维模型
库Байду номын сангаас

实体关系模型应用于操作型数据库系统,多维


模型应用于分析型数据仓库系统。
概 念
实体关系模型不适用于以查询为主的分析型应
用,具体表现在:使用者、界面、检索手段。
多维数据模型以直观的方式组织数据,每一个
第 一
多维数据模型由多个多维数据模式(Dimensional

级别。


数据越详细,粒度越小,级别越低,回答查

询的种类就越多。(数据堆积,回答综合问题效


率低)
基 本
数据越综合,粒度越大,级别越高,回答查

询的种类就越少。

维度:(Dimension)
维度是指人们观察事物的角度。


例如:当人们关注产品销售情况时,有如下维度:

时间维:随时间变化的销售数据;
案例讨论:下图展示了某电信公司的市场部和计划
部对业务A是否具有市场前景的分析过程和结果。


试讨论为什么两部门分析结果不同。


据 仓 库
市场部
分析程序1
分析结果1:
前景很好

企业级数据库

本 概
计划部
分析程序2
分析结果2:
前景不好

第一章:数据仓库的基本概念


1-1 数据仓库的产生与发展


传统的数据库技术作为数据管理手段,主要用

或更多个维来描述或者分类的数据。
据 仓
在三维的情况下可以用图形来表示,一般称
库 的
为数据立方体。
基 本
实际的数据仓库的应用中,数据是多维的。


联机分析处理: (OLAP)


联机分析处理是快速、灵活的多维数据分析工


具。
据 仓
OLAP的目的是支持分析决策,满足多维环境

的查询和报表需求。


相关主题