当前位置:文档之家› 数据仓库(多维数据库模型).

数据仓库(多维数据库模型).


三、操作数据存储(ODS )
在许多情况下,DB-DW的两层体系结构并不适合
企业的数据处理要求。因为,虽然可以粗略地把数据处
理分成操作型和分析型,但这两种处理处理并不是泾渭 分明的。 ODS(Operational Data Store)作为一个中间层次, 一方面,它包含企业全局一致的、细节的、当前的或接
采购子系统
销售子系统
库存子系统
3、数据仓库中的数据组织
数据仓库中的数据分为四个级别:早期细节级,当 前细节级,轻度综合级,高度综合级。
1998~2003年 每季度销售表 1998~2003年 每月销售表 1998~2003年 销售明细表
1985~1998年 销售明细表
DW中还有一类重要的数据:元数据(metedata)。 元数据是“关于数据的数据”(RDBMS中的数据字典
维:人们观察数据的特定角度。
维的层次:人们观察数据的特定角度可能存在细节 程度不同的多个描述方面,我们称其为维的层次。 多维分析的基本动作 上卷:汇总数据
第二类系统仍为支持传统SQL查询的DBMS,但为 了有效地执行OLAP查询而进行了特殊的设计。这些系
统可以看作是为决策支持应用进行了优化的关系数据库
系统。许多关系数据库厂商对他们的产品进行了扩展, 并且随着时间的推移,专门的OLAP系统和支持决策支 持的关系数据库系统之间的差别将逐渐取消。
第三类的分析工具可用于在大量的数据集合中,找 到有意义的数据趋势或者模式,而不是上面提到的复杂 数据查询。在数据分析过程中,尽管分析者能够判定得
销售子系统: 客户(客户号,姓名,地址,电话, … ) 销售(客户号,商品号,数量,单价,日期, … )
库存子系统: 进库单(编号,商品号,数量,单价,日期, … ) 出库单(编号,商品号,数量,单价,日期, … ) 库存(商品号, 库房号,类别,单价,库存数量, 总金额,日期, … )
商品主题域: 商品固有信息:商品号,类别,单价,颜色,… 商品采购信息:商品号,类别,供应商号,供应 日期,单价,数量,… 商品销售信息:商品号,客户号,数量,单价, 销售日期, … 商品库存信息:商品号, 库房号,库存数量,日 期, … )
生命周期符合SDLC 对性能要求高
一个时刻操作一个单元 事物驱动 面向应用 一次操作数据量小 支持日常操作
完全不同的生命周期 对性能要求宽松
一个时刻操作一个集合 分析驱动 面向分析 一次操作数据量大 支持管理需求
数据仓库与决策支持系统(DSS) 用户在进行决策制定时需要得到企业各方面的信 息,因此用户一般首先根据各个业务部门数据库中的 数据,创建数据仓库,存储各种历史信息和汇总信息。 对数据仓库的进一步应用由功能强大的分析工具 来实现。现在主要有三类分析工具可用于决策支持。 第一类能够支持涉及分组和聚集查询,并能够对 各种复杂的布尔条件、统计函数和时间序列分析提供 支持的系统。主要由上述查询组成的应用称为联机分 析处理,即OLAP。在支持OLAP查询的系统中,数据 最好看成是一个多维数组。
近当前的数据,另一方面,它又是一个面向主题、集成
的数据环境,适合完成日常决策的分析处理。
四、数据仓库的实现
数据仓库的工具主要有:数据预处理工具,数据 分析( OLAP )工具,数据挖掘工具,OLAP服务器。
数据仓库和OLAP工具基于多维数据模型(在数据 仓库中,通常以多维方式来存储数据。 )。 基本概念
2、数据仓库的定义及特征
数据仓库理论的创始人W.H.Inmon在其《Building the Data Warehouse》一书中,给出了数据仓库的四个 基本特征:面向主题,数据是集成的,数据是不可更新
的,数据是随时间不断变化的。
采购子系统: 订单(订单号,供应商号,商品号,类别,单价。数 量,总金额,日期, … ) 供应商(供应商号,供应商名,地址,电话,…)
理为主的联机事务处理(OLTP) 应用和以分析处理
为主的DSS应用共存于一个数据库系统时,就会产生
许多问题。
例如,事务处理应用一般需要的是当前数据, 主要考虑较短的响应时间;而分析处理应用需要是历 史的、综合的、集成的数据,它的分析处理过程可能 持续几个小时,从而消耗大量的系统资源。
人们逐渐认识到直接用事务处理环境来支持DSS是 行不通的。要提高分析和决策的有效性,分析型处理及 其数据必须与操作型处理及其数据分离。必须把分析型
数据库技术
第 14 讲 数据仓库
一、基本概念 随着数据库技术的应用普及和发展,人们不再仅 仅满足于一般的业务处理,而对系统提出了更高的要 求:提供决策支持。
何谓数据仓库?
一种面向分析的环境; 一种把相关的各种数据转换成有商业价值的信息 的技术。
1、从数据库到数据仓库
数据库系统能够很好的用于事务处理,但它对分 析处理的支持一直不能令人满意。特别是当以业务处
数据从事务处理环境中提取出来,按照DSS处理的需要
进行重新组织,建立单独的分析处理环境。
数据仓库技术正是为了构建这种新的分析处理环境
而出现的一种数据存储和组织技术。
操作型数据 细节的 在存取瞬间是准确的 可更新 操作需求事先可知道
分析型数据 综合的,或提炼的 代表过去的数据 不更新 操作需求事先不知道
到的数据模式是否有意义,但是生成查询来得到有意义
的模式还是很困难的。例如,分析者查看信用卡使用记 录,希望从中找出不正常的信用卡使用行为,以表明是 被滥用的丢失的信用卡;商人希望通过查看客户记录找
出潜在的客户来提高收益。许多应用涉及的数据量很大,
很难用人工分析或者传统的统计分析方法进行分析,数
据挖掘的目的就是对这种大量数据的分析提供支持。
就是一种元数据)。
数据仓库中的元数据描述了数据的结构、内容、索 引、码、数据转换规则、粒度定义等。
4、数据仓库系统结构
数据仓库 RDBMS 数据文件 其他 分析工具 查询工具
综合数据
当前数据
历史数据
元数据
OLAP工具
DM工具设计
数据仓库的设计分为如下三个阶段: 数据仓库建模 分析主题域 确定粒度层次 确定数据分割策略 构建数据仓库 数据的存储结构与存储策略 DSS应用编程
相关主题