数据仓库应用实例
•注意多目标变量之间的相互关系 •确定多目标变量最终的分析顺序 •剔除那些对目标变量具有强相关性的 变量 •挖掘模型的维护和完善 •将所获得挖掘结果存储进多维数据集
3 SQL Server中的数据挖掘工具
MS SQL Server2000中的Analysis Services可以对关系 数据库和多维数据源中的数据进行挖掘,因此任何利 用 OLE DB 可 以 访 问 的 关 系 数 据 源 数 据 以 及 通 过 Analysis Services创建的多维数据集的数据都可以训练 挖掘模型。而且SQL Server系统的可扩展性使第三方 工具能够与SQL Server的数据挖掘工具组装使用,提 高了系统的性能与灵活性。 Analysis Services中所提供的数据挖掘模型主要是两种: Microsoft决策树模型和Microsoft数据聚集模型。
销售分析主题展现界面设计表
分析 对象 销售 收入 商品 子类 界面名称 Brand_Area. xls Brand_Time .xls 商品 地区 客户 Area_Stor.xl s Cust_Time.x ls Cust_Prod.x ls 基本 维 地区 时间 商店 时间 商品 钻取层次 1 商品 子类 商品 子类 省 客户 客户 2 商店类 型 商店类 型 市 客户收 入 家庭人 口 家庭 同住 人口 3 客户 客户 类型 县/区 4 5
新成员属性选择
源多维数据集选择
挖掘事例选择
预测实体选择
培训数据选择
挖掘结果存储方式选择
挖掘模型保存设置
挖掘模型编辑器
挖掘模型浏览
4 数据仓库客户端界面的设计
4.1 客户端界面展现内容设计
数据仓库的使用主要集中在主题的多维数据集展现 、数据挖掘结果的查看浏览、管理决策的预测和数 据仓库内容的动态查询。 主题多维数据集的不同维度、不同层次的上卷、下 钻,可以方便地查看数据仓库的内容。 数据挖掘结果的展现 管理决策的预测 数据仓库内容的动态查询
4.3 EXCEL展现界面的实现
要求在客户端上有Microsoft Office 2000以上的 EXCEL版本。并要求在要访问的数据仓库服务器上有 Microsoft Internet Information服务(IIS)运行。 在 客 户 端 计 算 机 操 作 系 统 所 在 盘 上 的 inetpub\wwwroot目录中有Msolap.asp文件存在,如 果 没 有 , 可 以 从 安 装 OLAP Services 的 Program Files\Microsoft Analysis Services\Bin中复制。 如果客户端需要通过网络与服务器连接,就必须知 道服务器的名称或TCP/IP地址。
MDX新查询建立
MDX查询结果显示
MDX的立方体旋转显示
2 数据挖掘模型的设计
2.1 数据挖掘对象的分析
•由数据挖掘项目组成员共同分析数据挖掘对象 •超市营销策略评价主要通过门市、商品、营销策略、日期和客 户五个维度。要分析的则是商品的销售量、销售额、商品的成 本和商品销售的利润等度量信息。 •商品销售量增长率=(实施促销策略后商品销售量/实施促销策 略前商品销售量-1)×100% •商品销售额增长率=(实施促销策略后商品销售额/实施促销策 略前商品销售额)×100% •商品利润增长率=(实施促销策略后商品利润/实施促销策略前 商品利润)×100% •商品促销策略门市影响率=不同门市相同促销策略商品利润增 长率之比 •商品促销策略时间影响率=不同时间相同促销策略商品利润增 长率之比等各种新的变量。
3.1 决策类数据挖掘工具的应用
1.挖掘数据源选择
2.挖掘事例表选择
3.挖掘技术选择
挖掘事件例关键字选择
4.挖掘参数选择
挖掘模型完成对话框
5.挖掘模型保存选择
挖掘模型的处理
挖掘模型编辑器
6.挖掘结果浏览
3.2 聚类分析的数据挖掘工具应用
多维数据集编辑
多维数据集成员属性添加
数据仓库应用实例
1数据仓库的数据加载与钻取
2数据挖掘模型的设计
3SQL Server中的数据挖掘工具
4数据仓库客户端界面的设计
1 数据仓库的数据加载与钻取
1.1 数据仓库的数据加载 1. SQL Server的数据复制工具与应用 5个有关复制的向导工具: 创建发布向导、 创建强制新订阅向导、 创建请求订阅发布、 禁用发布或分布向导、 配置发布和分布向导、
5.钻取数据的选择
6.钻取结果显示
1.5 数据仓库的多维表达式MDX应用
MDX启动顺序:开始→程序→Microsoft SQL Server→Analysis Services→MDX示例应用程序。启 动MDX以后将出现Connect对话框,在Server输入框中 输入Analysis Services服务器名称,Provider输入 框中输入MSOLAP,单击“OK”按钮后,出现示例应用程 序窗口
数 据 导 入 的 转 换 语 言
1.2 超市数据仓库系统的数据加载
数 据 导 入 任 务 包 的 保 存 与 调 度
1.2 超市数据仓库系统的数据加载
任 务 包 的 作 业 调 度
任务包的保存
任务包完成提示
任务包的浏览
1.3 多维数据集的更新
D T S 调 度 包 的 建 立
处理任务框架
1.2 超市数据仓库系统的数据加载
数 据 仓 库 的 数 据 导 入
1.2 超市数据仓库系统的数据加载
D T S 数 据 导 入 / 导 出 向 导
1.2 超市数据仓库系统的数据加载
数 据 导 入 源 的 选 择
1.2 超市数据仓库系统的数据加载
数 据 导 入 源 的 确 定
1.2 超市数据仓库系统的数据加载
销售分析主题展现界面设计表
分析 对象 商品 扩展 特性 商品 类型 商品 子类 商品 商标 商店 时间 客户 商品 界面名称 Prod_Stor.xl s Prod_Cust.x ls Brad_Area.x ls Time_Cust.x ls Cust_Area.x ls Prod_Area.x ls 地区 客户 基本 维 商店 钻取层次 1 客户 类型 客户 2 客户月 消费 家庭人 口 市 季度 市 商品类 型 3 客户 收入 家庭 同住 人口 县/区 月 县/区 商品 子类 型 活动 地域 日 活动 地域 商标 4 5
数 据 导 入 目 的 库 选 择
1.2 超市数据仓库系统的数据加载
数 据 导 入 方 式 选 择
1.2 超市数据仓库系统的数据加载
导 入 数 据 表 和 视 图 的 选 择
1.2 超市数据仓库系统的数据加载
数 据 导 入 源 和 目 的 的 映 射 确 定
1.2 超市数据仓库系统的数据加载
1.启动Microsoft Excel
2.数据源选择
3.数据的获取
4. OLAP多维数据集选择
5.新数据源创建
6.源数据的连接
7.多维数据集的选择
8.返回创建新数据源
创建新数据源对话框返回
数据展现内容安排
10.客户端数据展现的布局设计
10.客户端数据展现的布局设计
商品 商品 时间
客户 收入 会员 卡 客户 类型
客户家 庭人口
客户 住房
年
季度
月
日
4.2 客户端界面展现工具选择
一般在客户端开发中可以通过C++编程使用为OLAP 服务的OLE DB,在VB和ASP中使用ADO MD编写客户 端程序。 Microsoft Excel使用了许多为OLAP服务的OLE DB核 心API,使得Excel具有了强大的OLAP数据提取和分析 功能。可以采用Excel作为数据仓库的OLAP数据提取和 分析的主要工具。 在客户端界面展现中,有时为了对展现给用户的数据 仓库数据进行更好的控制,使一部分用户可以进行数据 的钻取,而禁止另外一部分用户进行同样的操作,对客 户按照其职能范围进行必要的安全控制,或能够使用户 进行动态的数据操作,或希望将数据仓库的应用与其它 的信息处理整合在一起,此时,Excel VBA就是一个很 好的编程工具。
3.创建强制新订阅向导
4.创建请求订阅向导
5.禁用发布或分布向导
在SQL Server的企业管理器中的“工具”菜 单中打开向导菜单项,调出“选择向导”对 话框,选择其中的“复制”节点,选择“禁 用发布或分布向导”菜单项。 进入“欢迎使用禁用发布或分布向导”对话 框。 利用该向导可以完成“除去所选服务器上的 所有发布”或“除去对应已除去发布的所有 订阅”这些设置不会影响到该服务器从其它 发布服务器接受到的订阅。
选择处理对象
调度任务处理选项确定
任务的建立
任务工作流确定
任务工作流属性设置
DTS包的保存
任务包的调度设置
任务包的运行时间设置
1.4 数据仓库的钻取访问
1. 数 据 钻 取 的 进 入
ቤተ መጻሕፍቲ ባይዱ 2.数据钻取选项的确定
3.钻取数据列的选择
4.数据钻取角色的管理
在进行数据钻取前,还需要利用与编辑命 令同一菜单中的“管理角色”命令确定可 以进行数据钻取的管理人员。
2.2 数据挖掘模型与相关数据的准备
1.挖掘模型的确定 • 映射:业务数据是否能够转换成多维的、可比较的、 地理的、时间的或不同的层次问题。 • 主要方法:分类、估计、关联分组、聚类、细分或 预测等 • 有时为了解决一些较大的业务问题,可能还需要对 业务问题进行分解,将业务问题分解成多个较小的问题。 如果这些问题能够使用分类、估计、关联分组、聚类、 细分或预测等挖掘方法来解决。那么这一较大的问题也 就可以用数据挖掘方法解决。
SQL Server数据复制向导
2.创建发布向导
利用发布向导可以完成这样一些操作: •选择发布数据库。 •使用发布模板。 •选择发布类型。 •选择可更新的订阅。 •可传送的订阅(快照复制或事务复制可使 用的选项)。 •指定订阅服务器类型。 •指定要发布的数据和数据库对象项目。 选择发布名称和描述。