当前位置:文档之家› 联机分析处理技术实验报告

联机分析处理技术实验报告

本科生实验报告
( 一 )

姓名:
学院:
专业:计算机科学与技术
班级:
实验课程名称: 数据仓库与数据挖掘
实验日期: 2015 年 4 月2 日
开课时间:2014-2015 学年 第二 学期

甘肃政法学院实验管理中心印制
实验题目 联机分析处理技术 小组合作 无
姓名 班级 学 号
一、实验目的
1.学习并掌握Analysis Services的操作,加深理解数据仓库中涉及的
一些概念,如多维数据集,事实表,维表,星型模型,雪花模型,联
机分析处理等。

二.实验环境
一台装有MICROSOFT SQL server的计算机

三、实验内容与步骤
在实验之前,先通读自学SQL SERVER自带的Analysis Manager概念
与教程。按照自学教程的步骤,完成对FoodMart数据源的联机分析。
建立、编辑多维数据集,进行OLAP操作,看懂OLAP的分析数据。

四、实验过程与分析
1、 启动联机分析管理器:开始->程序->Microsoft SQL Server
->Analysis Manager。
2、 按照 Analysis Service的自学教程完成对FoodMart数据源的联机分
析。
3、 在开始-设置-控制面板-管理工具-数据源(ODBC),数据源管理器
中设置和源数据的连接,“数据源名”为你的班级+学号+姓名,
如T3730101张雨。
(1)打开管理工具中的数据源:

(2)选择系统DNS
(3)建立名为“………….”的数据源
(4)添加,选择“Microsoft Access 驱动程序 (*.mdb)”,然后单击“完
成”按钮

(5)选择数据库
(6)在“ODBC Microsoft Access 安装”对话框中单击“确定”按钮。
在“ODBC 数据源管理器”对话框中单击“确定”按钮。

4、在开始-设置-控制面板-管理工具-服务-MSSQLServerOLAPService,
启动该项服务。
在Analysis Manager中,单击服务器名称,即可建立与 Analysis
Servers 的连接;否则,在Analysis Servers 上单击右键,注册服务
器,在服务器名称中输入本地计算机的名字,如pc56。本地计算
机的名字可右击:我的电脑,选择属性,网络标志,里面有本地
计算机的名字。建立新的数据库,数据库名与数据源名相同,如
T3730101张雨。在你所建立的数据库中,单击“新数据源”,和早
期在 ODBC 数据源管理器中建立的数据源连接。
(1)启动MSSQLServerOLAPService服务

(2)注册服务器
(3)建立名为“………”的新数据库
(4)建立数据源
5、假设你是 FoodMart Corporation 的数据库管理员。FoodMart 是一
家大型的连锁店,在美国、墨西哥和加拿大有销售业务。市场部
想要按产品和顾客分析 1998 年进行的所有销售业务数据。要求建
立Sales多维数据集,多维数据集是由维度和事实定义的。
其维度有“Time”维度、“Product”维度、“Customer”维度、“Store”
维度和“Promotion” 维度,事实表为sales_fact_1998,事实表中
的度量为:store_sales、store_cost、unit_sales。理解每个维度的级
别。

(1) “Time”维度
(2)Product维度
(3)“Customer”维度
(4)“Store”维度

(5)“Promotion” 维度
6、可以使用多维数据集编辑器对现有多维数据集进行更改。在使用
或浏览多维数据集中的数据之前,要求设计多维数据集中的数据
和聚合的存储选项。即设计好 Sales 多维数据集的结构之后,需
要选择要使用的存储模式并指定要存储的预先计算好的值的数
量。完成此项操作之后,需要用数据填充多维数据集。这里选择
MOLAP 作为存储模式,创建 Sales 多维数据集的聚合设计,然后
处理该多维数据集。处理 Sales 多维数据集时将从 ODBC 源中装
载数据并按照聚合设计中的定义计算汇总值。
7、使用多维数据集浏览器,可以用不同的方式查看数据:可以筛选
出可见的维度数据量,可以深化以看到数据的细节,还可以浅化
以看到较为概括的数据。这里可以使用多维数据集浏览器对 Sales
数据进行切片和切块操作。要求理解OLAP操作下数据的含义,
从而可以分析数据。
8、人力资源部想按商店来分析雇员的工资。本节将建立一个 HR(人
力资源)多维数据集,以进行雇员工资分析。将把 Employee(雇
员)维度创建为父子维度。然后使用该维度以及常规维度来生成
HR 多维数据集。其中,事实数据表为salary(工资), 维度为
Employee(雇员)、Store(商店)、Time(时间)。了解如何建立父
子维度。
9、建立计算成员和成员属性。在Sales 多维数据集中建立“Average
price” 计算成员,思考建立该计算成员的目的。市场部希望将 Sales
多维数据集分析功能扩展到根据客户的下列特征分析客户销售数
据:性别、婚姻状况、教育程度、年收入、在家子女数和会员卡。
需要向 Customer 维度添加以下六个成员属性:Gender(性别)、
Marital status(婚姻状况)、Education(教育程度)、Yearly Income
(年收入)、Num Children At Home(在家子女数)和 Member Card
(会员卡)。这些成员属性将限制 Customer 维度中的每个成
员。 理解什么是计算成员和成员属性,为什么要建立?
10、已经为客户维度添加了六个成员属性,可以创建一个带有 Yearly
Income(年收入)成员属性的虚拟维度,然后将这个新创建的维
度添加到 Sales 多维数据集中。使用虚拟维度,可以基于多维数
据集中的维度成员的成员属性对多维数据集数据进行分析。 其优
点是不占用磁盘空间或处理时间。
(1)为客户维度添加属性
(2)创建Yearly Income虚拟维度
11、理解多维数据集角色和数据库角色的联系和区别、建立角色的目
的。
(1)在sales中创建marketing角色
(2)在HR中创建HR角色
五、实验总结
1.实验过程中,我们可以对于一些特定的数据,通过事实数据表的选
取和纬度的建立构建多维数据集,从而建立总体分析模型,然后从多
个角度对数据进行分析。多维联机分析处理不仅体现一种先进的技术
和方法,更体现了一种思维方式。可以将很抽象且没有联系的数据进
行处理,从多种角度对原始数据中转化出来,得出一些具有关联且反
应真实情况的实用数据。
2.OLAP利用存储在数据仓库中的数据完成各种分析操作,并一直观
易懂的形式将分析结果返回给决策分析人员。

相关主题