数据仓库应用实验Analysis Service的安装与启动为了使用SQL Server 2000 的数据仓库进行在线数据分析,除了安装数据库服务器外,还必须安装Analysis Service。
1.安装下载提供的“Analysis Service”压缩包,解压后,双击“autorun”,依次单击“SQL Server 2000 组件”\“安装Analysis Service”。
2.启动单击“开始”\“程序”\“Microsoft SQL Server”\“Analysis Service”,即可进入Analysis Manager 的工作界面。
一、使用SQL Server创建数据仓库在SQL Server 2000中,创建数据仓库(多维数据集)的总体步骤包括:设置ODBC数据源、建立数据库、建立数据库与ODBC数据源的连接、建立多维数据集、编辑多维数据集、设计存储和处理多维数据集。
(一)设置ODBC数据源Microsoft SQL Server 2000的Analysis Service提供了一个样本数据集,存放在名为foodmart2000.mdb的ACCESS数据库中,在安装时已经自动建立了数据源。
如果是用户自己建立的数据集,则在开始使用Analysis Manager之前,必须先在ODBC数据源管理器中设置相应的系统数据源,以便Analysis Service能够通过系统数据源与源数据连接,从而进行联机分析处理。
如果源数据本身就存放在SQL Server中的,则不需要本过程。
以样本数据集foodmart2000.mdb为例,设置系统数据源的方法:(1)进入数据源管理器对于Windows NT4.0的用户:单击“开始”—“设置”—“控制面板”—双击“数据源(ODBC)”;对于Windows 2000 的用户:单击“开始”—“设置”—“控制面板”—双击“管理工具”—双击“数据源(ODBC)”。
(2)在“系统DSN”选项卡上单击“添加”按钮(3)选择相应的驱动程序,本例为“Microsoft Access Driver(*.mdb)”,单击“完成”,弹出新的对话框。
(4)在“数据源名”框中输入用户自定义的数据源名称,此处为“FootMart2000”,然后在“数据库”下单击“选择”。
(5)在“选择数据库”对话框中浏览到“C:\Program Files\Microsoft Analysis Services\Samples”,然后单击“FoodMart2000.mdb”,单击“确定”。
(假定Analysis Services 的安装目录为C:\Program Files\Microsoft Analysis Services)。
(6)单击“确定”,在“ODBC数据源管理器”对话框中再一次单击“确定”,完成数据源的设置。
(二)建立数据库在设计多维数据集前,需要建立一个数据库结构,该数据库是存放多维数据集、角色、数据源、共享维度和挖掘模型的一种结构。
然后和早期在ODBC数据源管理器中建立的数据源连接。
具体操作:(1)在Analysis Manager树视图中展开“Analysis Services”;(2)单击服务器名称,即可建立与“Analysis Services”的连接;(3)右击服务器名称,然后单击“新建数据库”命令;(4)在“数据库”对话框中的“数据库名称”框中,输入要建立的数据库的名称,如Sample,然后单击“确定”;(5)在Analysis Manager树视图中展开服务器,然后展开刚才创建的“Sample”数据库,此时可看到该数据库包括项目:数据源、多维数据集、共享维度、挖掘模型、数据库角色。
(三)建立数据库与ODBC数据源的连接将数据源与前面建立的ODBC数据源中的数据连接,必须在Analysis Manager中建立一个数据源,通过它将数据库连接到在ODBC数据源管理器中建立的系统数据源名称上。
以后多维数据集中的数据都将来自这个数据源。
在Analysis Manager中建立数据源的步骤:(1)在Analysis Manager树视图中,右击“Sample”数据库下的“数据源”文件夹,然后单击“新建数据源”;(2)在“数据连接属性”对话框中,单击“提供者”—单击“Microsoft OLE DB Provider for ODBC Drivers”;(3)单击“连接”选项卡,从“使用数据源名称”列表中单击“foodmart2000”—单击“测试连接”,连接成功,单击“确定”,关闭“数据链接属性”对话框。
(四)建立多维数据集多维数据集是数据仓库多维数据模型的具体形式,由维度和度量值的集合构成。
多维数据模型可简化联机业务分析,提高查询性能。
通过创建多维数据集,Analysis Manager可将存储在关系数据库中的数据转换为具有实际含义并且易于查询的业务信息。
管理数据库进行多维使用的最常用方式是使用星型模型。
例如:样本数据库中的数据来源于一家大型的连锁店FoodMart。
市场部想要按产品和顾客两个方面来分析1998年进行的所有销售业务数据。
使用存储在公司数据仓库中的数据建立多维数据集,可以使市场分析人员查询数据库时获取快速的响应。
多维数据集可以使用多维数据集向导来建立:(1)启用向导在Analysis Manager树视图中“Sample”数据库下,右击“多维数据集”—“新建多维数据集”—“向导”。
(2)建立事实表事实表中包含各种度量值,按以下步骤建立事实表,增加度量值。
根据上一步打开的“多维数据集向导”窗口,在“从数据源中选择事实数据表”步骤,展开“FootMart2000”数据源,然后单击“sales_face_1998”—“浏览数据”—浏览完后,关闭“浏览数据窗口”—“下一步”—在“事实数据表数据列”下,选择销售金额(store—sales)、销售成本(store—cost)和销售数量(unit_sales)为多维数据集度量值—“下一步”。
(3)建立时间维度表在向导“选择多维数据集的维度”步骤中,单击“新建维度”命令—在维度向导的“欢迎”步骤,单击“下一步”—选择“星型架构:单个维度表”—“下一步”—单击“time_by_day”—“下一步”—选择“时间维度”—“下一步”—选择时间级别中的“年、季度、月”—“下一步”—“下一步”—在维度名称中输入“Time”—“完成”,此时可以在“多维数据集维度”列表中看到“Time”维度。
(4)建立产品维度同前操作,单击“新建维度”命令—“下一步”—选“雪花构架:多个相关维度表”—“下一步”—将“Product”和“product_class”添加到“选定的表”中—“下一步”—“下一步”—将“product_category(产品类)、product_subcategory(产品子类)和brand_name(品牌)”添加到“维度级别”中—“下一步”—“下一步”—在维度名称框中输入“Product”—“完成”,此时在“多维数据集维度”列表中看到“Product”维度。
(5)建立客户维度同上(4),单击“新建维度”命令—“下一步”—选“星型构架:单个维度表”—“下一步”—单击“Customer”—“下一步”—“下一步”—将“Coutry、State_Province、city 和lname”添加到“维度级别”中—“下一步”—“下一步”—“下一步”—在维度名称框中输入“Customer”—“完成”,此时在“多维数据集维度”列表中看到“Customer”维度。
(6)建立商店维度同上(4),单击“新建维度”命令—“下一步”—选“星型构架:单个维度表”—“下一步”—单击“Store”—“下一步”—“下一步”—将“store_ coutry、store_state、store_city 和store_name”添加到“维度级别”中—“下一步”—“下一步”—“下一步”—在维度名称框中输入“Store”—“完成”,此时在“多维数据集维度”列表中看到“Store”维度。
(7)生成多维数据集在建立四个维度之后在多维数据集向导中,单击“下一步”,在“事实数据表行数”提示对话框出现时,单击“是”,在出现的对话框中将多维数据集命名为“Sales”,单击“完成”。
向导关闭之后,随之启动多维数据集编辑器。
(五)编辑多维数据集多维数据集创建之后,仍然可以使用多维数据集编辑器对现有多维数据集进行更改,包括删除、添加维度,新建、删除度量值等。
假定添加一个新维度以提供有关产品促销的数据,则步骤如下:在多维数据集编辑器中,在“插入”菜单上单击“表”命令—在“选择表”对话框中,单击“Promotion”表—单击“添加”—单击“关闭”—双击“promotion”表中的“promotin_name”列,打开“映射列”对话框—选择“维度”选项—单击“确定”,则树视图中出现了一个新的维度“Promotion Name”—右击“Promotion Name”,将其重命名为“Promotion”。
(备注:此种方法生成的维度默认为专用维度,即只能用于当前所处理的多维数据集。
)(六)设计存储和处理多维数据集Microsoft SQL Server 2000 Analysis Service支持三种存储模式,即MOLAP、ROLAP或HOLAP。
Analysis Service允许设置聚合,即预先计算好的汇总数据,利用这些数据可以极大地提高查询效率,缩短查询的响应时间。
选择MOLAP作为存储模式,创建Sales多维数据集的聚合设计,然后处理该多维数据集。
处理Sales多维数据集将从ODBC数据源中装载数据并按照聚合设计中的定义计算汇总值。
在多维数据编辑器窗口中,选择“工具”菜单中的“设计存储”,弹出向导—“下一步”——选择“MOLAP”—“下一步”—选择“性能提升达到”选项,并填写“40%”—单击“开始”—完成设计聚合的进程之后,单击“下一步”—选择“立即处理”—单击“完成”—处理完之后,单击“关闭”,返回Analysis Manager。
二、使用SQL Server进行联机分析经过前面的处理后,可以对多维数据集中的数据进行分析处理了。
分析工作使用多维数据集浏览器来完成。
可以用不同的方式查看数据,如筛选出可见的维度数据量(切片/切块),可以下钻查看数据的细节,也可以上钻查看较为概括的数据等等。
如何使用多维数据集浏览器对Sales多维数据集进行各种分析操作。
(一)启动或关闭多维浏览器在Analysis Manager树视图中,右击“Sales”多维数据集—单击“浏览数据”启动多维数据集浏览器。
单击下方的“关闭”,即可关闭多维数据集浏览器。
浏览器中显示了由多维数据集的一个维度和度量值组成的网格,其他四个维度显示在浏览器的上方。