当前位置:文档之家› 数据挖掘关联规则

数据挖掘关联规则

一、实验内容:
1、单一关联规则挖掘:产品之间
2、层次关联规则挖掘:产品类型之间或产品类型与产品之间
3、多维关联规则挖掘:客户类型与产品之间
4、序列规则挖掘
关联规则挖掘(Association rule mining)是数据挖掘中最活跃的研究方法之一,可以用来发现事情之间的联系。

如果两个或者多个事务之间存在一定的关联关系,那么,其中一个事务就能够通过其他事务预测到。

本实验要求根据提供的数据集实现单一关联规则挖掘,层次关联规则挖掘,多维关联规则挖掘,序列规则挖掘,并得出相关结论。

使用的数据集:
数据集名称:association2014.csv
数据集字段说明:
CUSTID-客户编号
userType-客户类型
NUMSRVID-产品编号
datetime-交易日期
srvClass-产品类型
二、实验过程:
从SAS顶端的【Solutions】菜单下调出企业数据挖掘【Enterprise Miner
点击【N e x t>】,选择c s v文件及相应的工作

区域之后再放开鼠标,此时S A S/E M界面如下
由于列NUMSRVID的类型为数值型,而列srvClass的类型为字符型,因此我将列srvClass的值编号代替。

对应关系如下表:
表格1. srvClass的值与编号对应关系
按照支持度降序排列:
原值动感地全球通神州行编号621622623
在SAS中导入处理后的数据集association2014 –zhangx2.csv,放在的ASSOCI
A
TION_ZHANGX2下。

在SAS EM中连接Input Node和Association Node,并设置Input Node的数据
源为association2014 –zhangx2.csv。

在General选项卡中,设置分析模式为Sequence,设置支持度为2%。

D h’g/
意义。

在关联规则挖掘时主要关注两个问题:找出交易数据库中所有大于或等于用户指定的最小支持度的频繁项集;以及利用频繁项集生成所需要的关联规则,根据用户设定的最小可信度筛选出强关联规则。

在关联规则挖掘中有几个指标需要注意,它们是置信度、支持度和提升度。

在进行关联规则的数据挖掘中,通过指定这三个标准的最小值,三个标准的值都大于临界值的关联规则就被列出。

而且以上这三个标准缺一不可,孤立地使用这三个标准中的任意一个,都可能导致错误结果。

相关主题