当前位置:
文档之家› 数据仓库与数据挖掘实验报告 -
数据仓库与数据挖掘实验报告 -
1.2数据挖掘技术
关联规则、决策树、聚类分析。
第2章
2.1数据
2.1.1数据属性结构
如表2-1、2-2所示。
表2-1 超市数据交易表
表2-2 影响小学生自控能力的因素分析调查表
2.1.2 数据库的相关处理
1.创建数据库
2.数据集导入
3.设置主键
4.创建数据库关系图
2.1.3
3.1关联规则
3.1.1关联规则挖掘过程图解
1.商业智能项目创建过程图解
2.数据源的创建过程图解
3.数据源视图创建过程图解
4.数据集挖掘结构创建过程图解
5.设置算法参数
6.处理挖掘结构过程图解
2.主要开发软件:SQL Sever 2005
3.辅助软件:Office
2.2数据库的结构模块简介
本数据库有两个数据集组成,超市交易数据集和影响小学生自控能力的因素分析调查表两个数据集。超市交易中有ID和Items两个属性;影响小学生自控能力的因素分析调查表数据集中有年级、学号、姓名、年龄、性别、民族、是否单亲、是否独生子女、父母文化程度、家庭经济状况、是否为班委、教师要求、师生关系、兴趣、性格、自控能力等属性。
做决策树,聚类分析所用的数据集影响小学生自控能力的因素分析调查分析数据库主要父母文化程度,家庭经济状况,教师要求,民族,年纪,年龄,师生关系,是否单亲,是否是独生子女,兴趣,性别,姓名,学号,性格,自控能力属性组成。此表是用来调查影响小学生自控能力的因素有哪些。此数据集做决策树的目的是,可以根据小学生的基本情况大致了解他的自控能力。此数据集做聚类分析,可以从中挖掘出小学生基本情况的分类。
《数据挖掘》大作业
院(系)名称:信息技术学院
专业年级:11级网络工程(物联网方向)
学号:111124092
学生姓名:朱玉
第1章
1.1数据简介
我的数据集是由两个不同的数据库组成,因为做关联规则的时候,影响小学生自控能力的因素分析调查分析数据库,不具备关联规则一对多的条件,因此,我用了课本上的的超市交易数据集。所以做关联规则的超市数据集,在这里我就不多介绍了。