当前位置:文档之家› 第4章-OLAP-在线联机分析

第4章-OLAP-在线联机分析


OLTP与OLAP对比表
OLTP OLAP
数据库原始操作
细节性数据 当前数据 经常性更新数据 一次性处理的数据量少 对响应时间要求高 用户量大
数据库导出数据或数据仓库数据
综合性数据 历史性数据 不可更新,但可周期性刷新数据 一次性处理的数据量多 响应时间合理 用户量少
面向操作人员、支持日常操作
面向应用、实物驱动
– (‘2000年’, ‘家电’, ‘南京市’, ‘1亿’) – (‘2000年7月’,‘女性服装’,‘江苏省’, ‘10亿’)

数据单元(单元格)
多维数组的取值称为数据单元。 当多维数组的各个维都选中一个维成员,

这些维成员的组合就唯一确定了一个观 察对象的值,即(维成员1,维成员 2,……,维成员n,对象值)。
面向决策人员、支持管理需要
面向分析、分析驱动
OLAP特性
快速性:用户对OLAP的快速反应能力有很高的要求。系统应能在5
秒内对用户的大部分分析要求做出反应。客户/服务器体系结构 -两层或三层C/S结构。
可分析性 :OLAP 系统应能处理与应用有关的任何逻辑分析和统计
分析。
多维性 :多维性是 OLAP 的关键属性。系统必须提供对数据的多维
问、处理和分析,通过直观的方式从多个维度、 多种数据综合程度将系统的运营情况展现给使 用者。
OLTP与OLAP
随着数据库系统广泛应用,数据库系统记录和
处理的数据越来越多,及时地记录和处理企业 的各种业务数据,这些系统成为联机事务处理 (OLTP)系统。数据库技术的广泛应用和技术的 发展,人们已经不再满足于仅仅用数据库系统 来记录企业的业务活动数据和对数据的简单处 理,人们需要对企业业务活动的数据进行各种 分析,以便发现企业业务趋势,这些系统称为 联机分析处理(OLAP)系统。
模型,促进了联机事务处理(OLTP)的发展(数据 以表格的形式而非文件方式存储)。 1993年,E.F.Codd提出了OLAP概念,认为 OLTP已不能满足终端用户对数据库查询分析的 需要,SQL对大型数据库进行的简单查询也不 能满足终端用户分析的要求。用户的决策分析 需要对关系数据库进行大量计算才能得到结果, 而查询的结果并不能满足决策者提出的需求。 因此,E.F.Codd提出了多维数据库和多维分析 的概念,即OLAP。
OLAP
多维数据集
多维数据集提供了一种信息系统结构,这种结
构可以使企业灵活地对数据进行访问,可以用 多种方法对数据进行切片、分块、动态地考察 汇总数据和细节数据之间的关系 数据仓库中的细节数据为多维数据集提供了稳 健方便的数据源.
多维数据集和数据仓库
数据仓库与多维数据集的区别: 多维数据集数据量比数据仓库少一个数据量级 数据仓库只适合少量灵活访问,多维数据集适合大量不 可预知的访问和分析 数据仓库存储很长时间范围内的数据,多维数据集存储 较短时间范围内的数据 数据仓库只允许分析人员以受限的形式访问数据,而多 维数据集允许自由地访问 多维数据集和数据仓库有着互补的关系:
维度
维的层次
人们观察数据的某个特定角度(即某个维)
还可以存在细节程度不同的多个描述方面, 我们称这个描述方面为维的层次。 一个维往往具有多个层次,例如:
描述时间维时,可以从日期、月份、季度、年等 不同层次来描述,那么日期、月份、季度、年等 就是时间维的层次; 同样,城市、地区、国家就构成了一个地理维的 多个层次。
组用多维立方体来表示,但数据立方体并不一定限于 三维,因此又称为超立方
数据立方体
日 期
产 品 ALL TV
PC
一季度
二季度 三季度
四季度
ALL NO1 NO2 NO3 ALL 商 店
VCD
可以按照产品、日期、商店三个维度任意组合,生 成销售情况
OLAP的产生背景
60年代,关系数据库之父E.F.Codd提出了关系
立方体和超立方(Cube) 多维数据模型的数据结构可以用这样来一个多维数组 来表示:(维1,维2,………维n,度量值),例如:商品 销售数据是按时间、地区、商品种类,加上度量“销 售额”组成的一个三维数组:(地区,时间,商品种类, 销售额)。三维数组可以用一个立方体来直观的表示,
立方体中每一个交点对应于一个事件。一般地多维数
视图和分析,包括对层次维和多重层次维的完全支持。
信息性 :不论数据量有多大,也不管数据存储在何处, OLAP 系统
应能及时获得信息,并且管理大容量信息。


数据仓库中可以存储非常细节的数据,而多维数据集中往往会对 细节数据进行轻度综合,DSS分析人员可以同时获取这二种数据 汇总信息在多维数据集中计算和聚集后存储在数据仓库中
维(Dimension)
维是人们观察数据的特定角度。 例如,企业常常关心产品销售随着时间推移
而产生的变化的情况,这时他是从时间的角 度来观察产品的销售,所以时间就是一个维 (时间维)。 企业也常常关心自己的产品在不同地区的销 售分布情况,这时他是从地理分布的角度来 观察产品的销售,所以地理分布也是一个维 (地理维)。

维成员
维的一个取值就称为该维的一个维成员。 如果一个维是多层次的,那么该维的维成员
就是不同维层次的取值的组合。 例如,考虑时间维具有日期、月份、年这三 个层次,分别在日期、月份、年上各取一个 值组合起来,就得到时间维的一个维成员, 即“某年某月某日”。
多维数组

一个多维数组可以表示为(维1,维2,……,维n,变 量),这样可以构成三维、四维及多维的数据表 示结构。其中,变量表示我们所观察的数据对象, 维1、维2、……、维n分别表示我们观察该数据 对象的角度。 如(时间,商品种类,商店,销售额),从而构 成一个有关商品销售额的三维数组。

什么是OLAP?
OLAP,英文全称为On-Line Analysis
Processing,中文名称为联机分析处理, 也称为在线分析处理。 OLAP允许以一种称为多维数据集的多维 结构访问来自商业数据源(如数据仓库) 的经过聚合和组织整理的数 据。
OLAP是针对某个特定的主题进行联机数据访
相关主题