当前位置:文档之家› 理工大学数据仓库与数据挖掘实验一

理工大学数据仓库与数据挖掘实验一

昆明理工大学信息工程与自动化学院学生实验报告
(2012 —2013 学年第 1 学期)
课程名称:数据库仓库与数据挖掘开课实验室: 2012 年10月 30日
一、上机目的
1.理解数据库与数据仓库之间的区别与联系;
2.掌握典型的关系型数据库及其数据仓库系统的工作原理以及应用方法;
3.掌握数据仓库建立的基本方法及其相关工具的使用。

二、上机内容
内容:以SQL Server为系统平台,设计、建立数据库,并以此为基础创建数据仓库。

要求:利用实验室和指导教师提供的实验软件,认真完成规定的实验项目,真实地记录实验中遇到的各种问题和解决的方法与过程,并绘出模拟实验案例的数据仓库模型。

实验完成后,应根据实验情况写出实验报告。

三、所用仪器、材料(设备名称、型号、规格等或使用软件)
1台PC及SQL 2008软件
四、实验方法、步骤和截图(或:程序代码或操作过程)
采用SQL语句创建数据库,数据库命名为:DW。

如图所示:
DW数据库中包含7张维表和一张事实表。

7张维表分别为:订单方式维表、销售人员及销售地区维表、发货方式维表、订单日期维表、客户维表、订单状态维表、客户价值维表。

建立7张维表语句和建立7张维表的ETL如下:
语句执行成功的结果如图所示:
DW数据库包含的事实表为FACT_SALEORDER。

建立1张事实表语句和建立1张事实表的ETL如下:
三、建事实表
CREATE TABLE FACT_SALEORDER(
SALEORDERID INT,
TIME_CD V ARCHAR(8),
STATUS INT,
ONLINEORDERFLAG INT,
CUSTOMERID INT,
SALESPERSONID INT,
SHIPMETHOD INT,
ORDER_V ALUES INT,
SUBTOTAL DECIMAL(10,2),
TAXAMT DECIMAL(10,2),
FREIGHT DECIMAL(10,2))
-----------------------------------
四、事实表的ETL
/* FACT_SALEORDER的ETL*/
TRUNCATE TABLE FACT_SALEORDER
INSERT INTO FACT_SALEORDER
SELECT SalesOrderID,CONVERT(CHAR(8),,112) ,
,,ISNULL,0),ISNULL,0),,,,,
FROM A,
V_SUBTOTAL_V ALUES B
WHERE >= AND <
--缺省值处理
INSERT INTO DIM_CUSTOMER
select DISTINCT CUSTOMERID,'未知','商店',0,'N','N','未知','未知','未知',0,0,'未知','未知','未知' from FACT_SALEORDER
where CUSTOMERID not in (SELECT CUSTOMERID
FROM )
INSERT INTO DIM_CUSTOMER
select DISTINCT SALESPERSONID,'未知','未知' from FACT_SALEORDER
where SALESPERSONID not in (SELECT SALESPERSONID
FROM )
语句执行成功的结果如图所示:
五、实验结果、分析和结论(误差分析与数据处理、成果总结等。

其中,绘制曲线图时必须用计算纸或程序运行结果、改进、收获)
通过这次上机实验了解了数据库各种表间的关系,对建立事实表有了直观的体会和理解。

相关主题