当前位置:文档之家› 实验7算法答案

实验7算法答案

一、实验名称:Apriori和Fp-growth算法
二、实验日期:2013年10 月18 日
三、实验目的:
通过本次实验掌握Apriori和Fp-growth算法的思想
四、实验用的仪器和材料:
硬件:PC电脑一台;
配置:内存,2G及以上硬盘250G及以上
软件环境:操作系统windows server 2003
数据库环境:Microsoft SQL SERVER 2005
五、实验的步骤和方法:
假设事务集合T如下表所示:
事务ID事务的项目集
T1A,B,E
T2B,D
T3B,C
T4A,B,D
T5A,C
T6B,C
T7A,C
T8A,B,C,E
1、根据以上事务集合,通过Apriori算法实现:
1)假定最小事务支持数是2,写出搜索所有频繁项集的过程。

2)假定最小置信度为60%,写出1)题中已求出的频繁3-项集的所有项组成的强关联规则。

在事务数据库中,频繁项集L={A,B,E},可以由L产生哪些关联规则?
L的非空子集S有:{A, B}, {A, E}, {B, E}, {A}, {B},{E}。

可得到关联规则如下:
A ∧
B → E conf=2/3=66%
A ∧ E →
B conf=2/2=100%
B ∧ E → A conf=2/2=100%
A →
B ∧ E conf=2/5=40%
B → A ∧ E conf=2/6=33%
E → A ∧ B conf=2/2=100%
假设最小置信度为60%,则最终输出的关联规则为:
A ∧
B → E 66%
A ∧ E →
B 100%
B ∧ E → A 100%
E → A ∧ B 100%
2、根据以上事务集合,通过Fp-growth算法实现:
1)画出FP树。

2)列出逐层递归产生的频繁项集。

六、数据记录和计算:指从实验中测到的数据以及计算结果。

七、实验结果或结论:即根据实验过程中所见到的现象和测得的数据,作出结论。

八、备注或说明:可写上实验成功或失败的原因,实验后的心得体会、建议等。

九、引用参考文献:
1. 张兴会.数据仓库与数据挖掘技术.清华大学出版社。

相关主题