数据仓库概念汇总
LDM 逻辑数据模型(Logic Data Model)
MDD 多维数据库(Multi-Dimensional Database ,MDD)可以简单地理解为:将数据存放在一个 n 维数组中,而
不是像关系数据库那样以记录的形式存放。因此它存在大量稀疏矩阵,人们可以通过多维视图来观察数据。多维 数据库增加了一个时间维,与关系数据库相比,它的优势在于可以提高数据处理速度,加快反应时间,提高查询 效率。
库或数据仓库中提取人们感兴趣的知识,这些知识是隐含的、事先未知的、潜在有用的、易被理解的模式。
KPI 企业关键业绩指标(KPI:Key Process Indication)是通过对组织内部流程的输入端、输出端的关键参数进行设
置、取样、计算、分析,衡量流程绩效的一种目标式量化管理指标,是把企业的战略目标分解为可操作的工作目 标的工具,是企业绩效管理的基础。
效指标(KPIs)等先进信息技术和管理理论为基础的战略管理的工具,在财务、客户、内部流程和学习与发展四个维 度上进行综合绩效评测,帮助企业从整体上实现对战略实过程的贯彻和控制。
BPR 业务流程重整(Business Process Reengineering),指利用数据仓库技术,发现并纠正企业业务流程中的弊
严格遵照 Codd 的定义,自行建立了多维数据库,来存放联机分析系统数据的 Arbor Software,开创了多维数 据存储的先河,后来的很多家公司纷纷采用多维数据存储。被人们称为 Multi-Dimension OLAP,简称 MOLAP,代 表产品有 Hyperion(原 Arbor Software)Essbase、Showcase STRATEGY 等。 ODS
对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理, 它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了 重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。
根据数据仓库概念的含义,数据仓库拥有以下四个特点:
端的一项工作。数据仓库的重要作用之一。
CRM Customer Relationship Management 客户关系管理。CRM 是选择和管理有价值客户及其关系的一种商业策
略,CRM 要求以客户为中心的商业哲学和企业文化来支持有效的市场营销、销售与服务流程。
CUBE 立方体
DM(Datamart) 即数据集市,或者叫做“小数据仓库”。如果说数据仓库是建立在企业级的数据模型之上的话。那么数据集市
Metadata Metadata(元数据),它是“关于数据的数据”在地理空间信息中用于描述地理数据集的内容、质量、表示方
式、空间参考、管理方式以及数据集的其他特征,它是实现地理空间信息共享的核心标准之一。目前,国际上对 空间元数据标准内容进行研究的组织主要有三个,分别是欧洲标准化委员会(CEN/TC287)、美国联邦地理数据委员 会(FGDC)和国际标准化组织地理信息/地球信息技术委员会(ISO/TC211)。 MOLAP
就是企业级数据仓库的一个子集,他主要面向部门级业务,并且只面向某个特定的主题。数据集市可以在一定程 度上缓解访问数据仓库的瓶颈。
DM(DataMine) 数据挖掘是一个从大型数据库中提取以前未知的,可理解的,可执行的信息并用它来进行关键的商业决策的
过程。
DSS 决策支持系统(Decision Support System),相当于基于数据仓库的应用。决策支持就是在收集所有有关数
2.1 相关概念 ......................................................................................................................................................... 4 2.1.1 数据仓库 .............................................................................................................................................. 4 2.1.2 企业信息工厂 ...................................................................................................................................... 6 2.1.3 数据集市 .............................................................................................................................................. 6 2.1.4 维 .......................................................................................................................................................... 7 2.1.5 事实表 .................................................................................................................................................. 9 2.1.6 操作数据存储 ODS ............................................................................................................................ 12 2.1.7 元数据 ................................................................................................................................................ 13 2.1.8 ETL ....................................................................................................................................................... 14 2.1.9 OLAP.................................................................................................................................................... 17 2.1.10 多维数据库 ...................................................................................................................................... 19
据和信息,经过加工整理,来为企业决策管理层提供信息,为决策者的决策提供依据。
DW Data Warehouse,本世纪 80 年代中期,“数据仓库之父”WilliamH。Inmon 先生在其《建立数据仓库》一书中
定义了数据仓库的概念,随后又给出了更为精确的定义:数据仓库是在企业管理和决策中面向主题的、集成的、 与时间相关的、不可修改的数据集合。与其他数据库应用不同的是,数据仓库更像一种过程,对分布在企业内部 各处的业务数据的整合、加工和分析的过程。而不是一种可以购买的产品。
数据仓库概念汇总
目录
一、术语 ....................................................................................................................................................................... 3 二、数据仓库基础 ....................................................................................................................................................... 4
(Operational Data Store)操作型数据存储,对于一些准实时的业务数据库当中的数据的暂时存储,支持一些 同时关连到历史数据与实时数据分析的数据暂时存储区域。
二、数据仓库基础
2.1 相关概念
2.1.1 数据仓库
目前,数据仓库一词尚没有一个统一的定义,著名的数据仓库专家 W。H。Inmon 在其著作《Building the Data Warehouse》一书中给予如下描述: 数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集 合,用于支持管理决策。
1)面向主题。传统数据库主要是为应用程序进行数据处理,未必按照同一主题存储数据;数据仓库侧重于 数据分析工作,是按照主题存储的。这一点,类似于传统农贸市场与超市的区别—市场里面,白菜、萝卜、香菜 会在一个摊位上,如果它们是一个小贩卖的;而超市里,白菜、萝卜、香菜则各自一块。也就是说,市场里的菜 (数据)是按照小贩(应用程序)归堆(存储)的,超市里面则是按照菜的类型(同主题)归堆的。