第四讲 联机分析处理
7. Ost Analysis of Shared Multidimensional Information (共享多维信息的快速分析)
1. Fast(快速性)用户对OLAP的快速反应能力有很高的要求 2. Analysis(可分析性)系统应能处理与应用有关的任何逻辑分 析和统计分析,用户无需编程就可定义新的专门计算,将其 作为分析的一部分,并以用户理想的方式给出报告。用户可 以在OLAP平台上进行数据分析,也可以连接到其他外部分 析工具上,同时应提供灵活开放的报表处理功能,以保存分 析结果。
rmation(信息性):不论数据量有多大,也不管数 据存储在何处,OLAP系统应能及时获得信息,并且管理 大容量信息。这里有许多因素需要考虑,如数据的可复 制性、可利用的磁盘空间、OLAP产品的性能及与数据仓 库的结合度等。
8. DW
OLAP DM
► 数据分析过程都是基于以DW为基础,OLAP
提供信息
为查询设计的 为了分析
更新频率
用户交互的范围
非常频繁
单个交易
通常是只读的
遍及所有数据内容
联机分析处理的要求
4.OLAP是用户需要的答案
OLAP的一些基本优点
► 使分析员、主管能够更深入地了解数据的显示方法 ► 能够沿着几个维度重新构造指标,并允许用户从不同的角度来查
看数据 ► 支持多维分析 ► 能够在每个维度里面进行下钻和概括化的操作 ► 能够在测量中应用数学公式和计算 ► 能够对分析做出快速的反映,提供边思考边分析的方式 ► 与其他信息传递技术互补(如:DM) ► 通过使用图像和表格来实现数据的可视化形式,使用户更容易地 理解结果集的含义 ► 能够在Web上运行 ► 能够实现交互式分析 ► Etc.
第四讲 联机分析处理
联机分析处理(OLAP)
OLAP :On-Line Analytical Processing ► 目标
OLAP的主要特性和功能 掌握维度分析中的错综复杂的事务,学习超 立方体、下钻和概括化、多层次/多视角查看 的含义 考察不同的OLAP模型并且确定哪个模型适合 你的环境 通过研究步骤和工具来考虑OLAP执行的情况
4.
5. 6. 7.
存储OLAP结果
遗失值
数据库增量更新
SQL接口
联机分析处理的要求
6. OLAP的特征
让商业用户对数据仓库的数据有一个多维的逻辑的视图 使用户更方便地进行交互式的查询和复杂的分析 允许用户沿着单一的商业维度或跨越维度进行下钻操作, 以获得更详细的数据,或者进行概括化操作以获得指标 的聚集 使用户能够进行复杂的计算和比较等操作 用许多有意义的方式来显示结果,包括图表和图像
►切块操作也可看成进行多次切片操作以后,将每次切
片操作所得到的切片重叠在一起而形的。
►
下钻drill down和上卷(卷取roll up)
钻取是对数据进行更为细节性的观察,上卷是对数据进行更 为宏观的观察。
钻取和卷取的深度与维所划分的层次相对应。
►
旋转(rotate,pivot)
改变一个报告或页面所显示的维方向。
联机分析处理的要求
5. OLAP的定义和规则
E.F.Codd ,《为分析员提供联机分析处理》, 1993年 OLAP委员会的定义
►OLAP是一种软件技术,它使分析员、经理和主管
人员能够通过快速的、一致的和交互式的访问来获 取并理解各种可能的信息视图的数据,这些信息由 原始数据转换而成,用来反映一个企业实际的维度。
►如果有(维1,维2,……,维i,……,维n,观察变量)多维数据集,对
维i选定了某个维成员,那(维1,维2,·…,维i成员,……,维n,观察变
量)就是多维数据集(维1,维2,……,维i,…,维n,观察变量)在维i上
的一个切片。
►切片的数量完全取决于维上的成员个数,维数越多,可做的切片越多。 ►切片的维数取决于原来多维数据集的维数。只有在多维数据集是三维的
Q1:产品维从“产品”上卷到“子类”,如何 显示? Q2 :接着,商店维从“商店”上卷到“地域”,如何显 示?
5.切片、切块与旋转 (Slice-and-Dice or Rotation)
多维分析-切片
►在多维分析过程中,如果要对多维数据集的某个维选定一维成员,这种
选择操作称为切片(slice)
和DM相辅相成的分析模式 。
DW将来自于各种数据源的数据,根据不同的主 题进行存储,并对原始数据进行抽取、转换和加 载等一系列筛选和清理工作。 OLAP则将数据通过多维视角和多种层次向用户进 行多方式的呈现。 DM则应用不同的算法,向用户揭示数据间的规律 性,从而辅助商业决策
OLAP的12条原则
联机分析处理的要求
►
OLAP的12条原则
1. 多维概念的视图:提供直观、易用的多维数据模型 2. 透明度:技术、数据库、体系结构、元数据对用户透 明,用户只需熟悉前台工具 3. 可访问性:向用户显示单一的、一致的、连贯的视图 4. 一致的报表性能:特定查询时,保证运行时间、反应 时间和机器使用性能的一致性 5. 客户-服务器体系结构 6. 等价的维度:每个维度在结构和操作性能上是等价的
简单星型模型
立方体的一个切片
►
一个三维的显示页面
查询: 1、显示所有商店过去5年内所有产品的销售总计 2、比较所有商店在 2000年和2001年逐个产品的 三个维度可以用立方体的边来表示每个维度, 销售统计 也可以用行、列和页来显示结果。 超过三个维度,怎么办? 3、比较所有商店在 2000年和2001年间逐个产品 的销售总计,只比较销售额下降了的产品 4、比较2000年和2001年间单个商店逐个产品的 销售额,只比较销售额下降了的产品
特征
OLTP系统
数据仓库
分析性能
用在单一会话中的数据 结果集的大小 反映时间 数据粒度 数据流通 访问方法
非常低
非常有限 小 非常迅速 细节 当前的 预定义
适中
小型到中型 大 迅速到适中 细节和汇总 当前和历史的 预定义和特别的
基本目的
数据模型 数据库的优化
收集和输入数据
为数据更新设计的 为了交易
欧洲区域内的 利润急剧下降了
直接的成本没有 问题,间接成本 提高了
欧洲一些国家的 最近2个月内欧盟 利润率上升了,一些持平, 国家的利润急剧下降了 一些急剧下降 一个分析会话中的查询步骤
联机分析处理的要求
3.其他分析方法的局限性
传统的工具和方法:报表、电子表格、SQL语句 OLTP和数据仓库环境的区别
3. 超立方体(Hypercube)
► 超立方体是对多维数据表示方法的常见比喻。 ► 可以用多维域结构(MDS)表示多于三个维
度的数据。 ► 问题:如何显示多维数据?
同一个显示组里结合多个逻辑维度
6维的表示
6维的页面显示
4. Drill-Down & Roll-Up
► 产品维度的层次结构
► 高级特征
强大的计算 跨越维度或细节分析 通过公式推倒出数值 跨维计算 准确的表示、显示 报警技术的应用 预计算和预合并 协同策略制定 使用代理技术来生成报 表
主要的特征和功能
2. 维度分析
任何缺乏多维分析的OLAP系统是绝对没有用的 必须了解和掌握OLAP系统提供的维度分析功能 Example:
******** ******** ******** ********* ****** ****** ****** ****** * * * ********* *** *** ******** *** ******** *** ********
* ********* ******** ****** ******** ******** ****** ****** ****** ********* * * *** *** *** * *** ********* ******** ******** ******** * * * ********* ****** ****** ****** ****** ******** ******** ******** *** *** *** *** * * * * *
例如,旋转可能包含了交换行和列;或是把某一个行维移到列 维中去,或是把页面中显示的一个维和页面外的维进行交换 (令其成为新的行或列中的一个)。
6. OLAP的使用和好处
能够提高业务经理、主管人员和分析员的生产率 OLAP固有的灵活性意味着无需IT人员的帮助,用 户就可以自己执行他们的分析 使IT开发人员得到好处,因为使用专门为系统开 发而设计的软件能够缩短应用系统的交付时间 使用户能够自给自足 使一些应用系统能够更快地交付给用户 能够利用商业指标和维度来模拟现实世界的一些 问题
Chapter 15 OLAP
► Contents
联机分析处理的要求 主要的特征和功能 OLAP模型 OLAP实施的考虑事项
二、主要的特征和功能
1. 一般特征
多维分析 下钻和概括化查询 多种查看模式 一致性能 在细节内导航 扩展简单容易 交互式查询,具有快速 的反应时间 多层次/多视角查看 时间智能
2004
炊具
总计
器具
总计 ******* ** ******* ** ******* ** ******* **
******** 服装 2003 * ****** *** 电子 ******** 视频 * 视频 炊具 2004 ******** ****** 炊具 * *** 器具 ******** 器具 * 总计 总计 ****** ******** 总计 *** * 电子
某个商店某个月的销售额 另一个OLAP的例子 跨到另一个OLAP的例子
部门 生产线 产品分类 子类 产品
300 000 60 000 15 000 5 000 1 200 下钻到细节数据 下钻和概括化