当前位置:文档之家› 数据仓库与数据挖掘

数据仓库与数据挖掘

衡水学院经济学与管理学系实验报告二、定义和部署多维数据集1.定义维度可以使用多维数据集向导,通过单个步骤定义一个多维数据集及其维度。

也可以先定义一个或多个维度,然后使用多维数据集向导定义一个使用这些维度的多维数据集。

如果要设计一个复杂的解决方案,通常是先定义维度。

(定义【时间维度】)在“解决方案资源管理器”中,用鼠标右键单击“维度”文件夹,然后单击【新建维度】,将显示维度向导。

点击【下一步】,在随后的“指定源信息”页上,选择Adventure Works DW 2012OLAP 数据源视图;在“主表”列表中,选择“日期”表,勾选属性,并修改属性类型2生成多维数据集这一步在上面创建的数据源视图的基础上生成多维数据集,方法如下:(a)在“解决方案资源管理器”中用鼠标右键单击“多维数据集”文件夹对象,在弹出的快捷菜单中选择【新建多维数据集】命令。

(b)在弹出的“多维数据集向导”欢迎界面中单击【下一步】按钮进入“选择创建方法”窗口,选择“使用现有表”,继续点击【下一步】,按图5选择度量值组的表单击【下一步】按钮,在选择【现有维度】页上,选择已有的维度--时间维度,然后单击【下一步】,在【选择新维度】页上,选择要创建的新维度。

为此,请确认已选中“客户”、和“产品”复选框,再单击【下一步】完成。

(c)完成向导后,可以查看建立的多维数据集结构,如图7所示,为多维数据集的数据源视图,与前面的数据源视图相比较,这里的视图表达的是多维数据集的表间关系,而且用黄色标记了事实表,蓝色标记了维度表。

3.向维度添加属性前面已经定义了维度,维度中的属性可以通过下面方法添加。

(a)向“客户”维度中添加属性在解决方案资源管理器的“维度”节点中双击“客户”维度,此时就打开了“客户”维度的维度设计器。

如图8。

在“数据源视图”窗格中,将 Customer 表的以下各列拖到“属性”窗格中:BirthDate,MaritalStatus,Gender,EmailAddress,YearlyIncome,TotalChildren,NumberChildrenAtHome,EnglishEducation,EnglishOccupation,HouseOwnerFlag,NumberCarsOwned,Phone,DateFirstPurchase,CommuteDistance。

将“数据源视图”窗格内 Geography 表中的以下各列拖到“属性”窗格中:City,StateProvinceName,EnglishCountryRegionName,PostalCode。

(b)向“产品”维度中添加属性将“数据源视图”窗格内 Product 表中的以下各列拖到“属性”窗格中:StandardCost,Color,SafetyStockLevel,ReorderPoint,ListPrice,Size,SizeRange,Weight,DaysToManufacture,ProductLine,DealerPrice,Class,Style,ModelName,StartDate,4、部署多维数据集这一步将把创建好的多维数据集部署到Analysis Services数据库中,如图所示,在多维数据集上单击鼠标右键,在弹出的快捷菜单中选择【进程】命令,在“是否生成和部署项目”的对话框中选择“是”选项。

待部署结束,系统将会弹出“处理多维数据集”对话框,单击【运行】按钮,程序将会对多维数据集进行处理,处理完毕后,在“处理进度”对话框中单击【关闭】按钮结束处理过程。

如果以上操作都顺利进行,则此多维数据集已经顺利地部署到了Analysis Services数据库。

(c)切换到EXCEL,用透视表浏览数据对于多维数据集,“浏览器”选项卡提供了两种用于浏览数据的方法。

你可以使用内置 MDX 查询设计器生成从多维数据库返回平展行集的查询,或者可以使用 Excel 快捷方式。

当从 SQL Server Data Tools 内启动 Excel 时,Excel 将打开,并且在工作表中已有数据透视表以及与模型工作区数据库的预定义连接。

Excel 通常会提供更好的浏览体验,因为可以交互方式浏览多维数据集数据,并且使用水平轴和垂直轴来分析数据中的关系。

操作如图1切片切片是0LAP进行基本多维分析操作的一种方式。

切片之后,呈现出来的数据为多维数据集中数据的一个子集。

具体来讲,切片就是在某个或者某些维上选择一个属性成员,在某两个维上取一定区间的属性成负或者全部属性成员。

将维度“客户”中的”[English Country Region Name]" 拖拽至“行标签”。

将维度“产品”中的”[Product Line]"拖拽至“列标签”,将维度“Order Date”中的“[OrderDate].[ Calendar Year]”拖拽至“报表筛选”,并且指定-一个时间,如2012年。

最后将[Measures]. [Sales Amount] 拖拽至“数值”。

如果不小心误拖,反向拖回即可撤销操作。

呈现结果如图2切块切块是在立方体的三个维上取一定区间的属性成员或者全部属性成员。

切块可以看成是由多个切片重叠形成。

例如,依然使用上例,在时间维度上的取值如果设定为一个区间而非单一的属性成员时,如2012年—2014年,所得结果就是一个数据切块。

如图3钻取钻取包括上钻和下钻两种操作。

从高级数据到明细级数据视图称为下钻,从明细级数据视图到高级数据视图称为上钻。

数据库的设计以及数据库的粒度级别将决定上钻或者下钻的能力。

比如,在时间维上,“年”表示聚集的最高级别,“日”表示聚集的最低级别,用户可能从一个较高的聚集级别来分析数据,然后下钻到较低级别以从多个角度分析。

在浏览器中,将“年”, “半年”, “季度”, “月”, “日”所代表的字段拖动到“将行字段拖至此处”,任意选择字段放在作为列字段和筛选字段。

单击加减号,用户可以很方便地实现向上或者向下钻取。

4旋转旋转即是改变一个报告或者页面显示的维方向。

通过旋转可以得到不同视角的数据。

如交换数据立方体的横轴和纵轴,也就是说,在浏览器中,在列字段,行字段,筛选字段中进行交换,请自己动手试试,观察数据呈现的方式的变化。

练习:通过把字段按照层次结构依次展开,你可以从不同角度和深度观察数据。

现在,请找到产品型号(model name)为mountain-200的产品在2011年的订货状况(order date),该产品是每个季度都有销售吗?三修改度量值、属性和层次结构在前面的步骤,我们已经在项目中建立好了一个简单的Cube。

在实际情况中,往往Cube 的建立不是一次性的,而是会随着用户的需求发生各种改变,现在我们就来对Cube进行相关的更改。

1 修改度量值的显示格式切到多维数据集设计器的“多维数据结构”选项卡,在“度量值”窗格中展开“网络销售/internet sales”度量值组,用鼠标右键单击“Order Quantity”选项,在弹出的快捷菜单中选择【属性】命令。

弹出度量值的属性窗口,在FormatString列表中,键入“#,#”,如图所示,类比以上步骤,请把Unit Price, Total Product Cost,Sales Amount, Tax Amt的FormatString 选择为Currency。

类比以上步骤,再请把Unit Price Discount Pct 的FormatString改为Percent。

以上完成对了度量值所显示的数据类型的更改,如果用户有需求还可以修改度量值的属性的Name值为中文,使得显示出来的界面更加友好。

例如,我们现在把"Unit Price Discount Pct"改为“单价折扣百分比”,把"Discount Amount"改为“折扣”。

点击重新部署项目,这样,所作的更改才会应用在SSAS的实例中。

部署成功后,在SSAS 的浏览器中,观察数据显示格式是否出现了变化。

练习:(数据组织随意,能看到变化即可)2 修改维度(客户维度)通过以下方法修改客户维度:更改属性和层次结构名称、更改用户层次结构属性、基于数据源视图中的新命名计算定义维度属性、删除不必要的属性以及将属性划分为逻辑用户层次结构。

(a)重命名属性切换到“客户”维度的维度设计器中,然后切换到“维度结构”选项卡,在“属性”窗口中,找到要换名的属性,右键【重命名】,可以更改维度的度量值属性名为中文。

(b)创建用户层次结构在维度设计器的“维度结构”选项卡中,同时,在“层次结构和级别”窗格中,进行如图16所示的更改。

(修改方法:将相应属性从“属性”窗格中拖到“层次结构和级别”窗格的相应层次结构中)(d)将命名计算用于成员名称。

使命名计算的用户友好性可以在客户端体现出来。

切换到“客户”维度的维度设计器,然后切换到“维度结构”选项卡的“属性”窗格的“客户键”属性。

现在需要把“客户”字样在浏览的时候以全名显示,因此右键点击“客户键”,重命名为“全名”,接下来需要把此处的“全名”和刚才创建的命名计算绑定到一起。

方法如下:右键点击“全名”,在属性窗格中,展开NameColumn项,选择“新建”在弹出窗口中将"DimCustomer.全名"绑定到NameColum,如图通过以上操作,“客户”的名称是客户的全名,因此数据的呈现方式更加友好。

部署这些更改并处理这些维度和多维数据集后,将可以看到这些更改。

展开维度浏览器,查看更改结果。

(e) 对维度定义显示文件夹为了对维度进行更有效的管理,可以对维度属性通过文件夹进行管理,使分类更清晰。

在。

相关主题