当前位置:文档之家› 数据挖掘考试题目——关联分析

数据挖掘考试题目——关联分析

知识可以有很多种表示形式,两种极端的形式是:①内部结构难以被理解的黑匣子, 人工神经网络训练得出的网络;②模式结构清晰的匣子,这种结构容易被人理解,
策树产生的树。那么,关联分析中输出的知识的表示形式主要是(
晰结构)。
1.啤酒与尿布的故事是聚类分析的典型实例。 算法是一种典型的关联规则挖掘算法。
3.支持度是衡量关联规则重要性的一个指标。
1.以下属于关联分析的是(B)
A. CPU性能预测B.购物篮分析
C.自动判断鸢尾花类别D.股票趋势建模
2.维克托?迈尔-舍恩伯格在《大数据时代:生活、工作与思维的大变革》一书中,持续强 调了一个观点:大数据时代的到来, 们更应该注重数据中的相关关系, 下哪个算法直接挖掘(D)
A. K-means
C.
C.缓冲D.并行
5.以下哪个会降低Apriori算法的挖掘效率(D)
A支持度阈值增大
C.事务数减少
算法使用到以下哪些东东(C)
A.格结构、有向无环图
C.格结构、哈希树
7.非频繁模式(D)
A其置信度小于阈值
C.包含负模式和负相关模式
B.项数减少
D.减小硬盘读写速率
B.二叉树、哈希树
D.多叉树、有向无环图
A. K-means
C.
3.置信度(confidence)是衡量兴趣度度量(
A.简洁性
C.实用性
算法的加速过程依赖于以下哪个策略(
A抽样
C.缓冲
使我们无法人为地去发现数据中的奥妙,与此同时,我
而不是因果关系。其中,数据之间的相关关系可以通过以
Bayes Network Ap riori
)的指标。
B.确定性
B)[注:分别以1、2、3代表之]B.2可以还原出无损的1
D.2与1是完全等价的
C)
B.查找
D.剪枝
B.Weka
D. Knime
二、10个填空
1.关联分析中表示关联关系的方法主要有:
2.关联规则的评价度量主要有:
3.关联规则挖掘的算法主要有:
4.购物篮分析中,数据是以
支持度
Ap riori
项集和关联规则。
B.令人不感兴趣D.对异常数据项敏感
8.对频繁项集、频繁闭项集、极大频繁项集的关系描述正确的是(A.3可以还原出无损的1
C.3与2是完全等价的
tree在Apriori算法中所起的作用是(
A存储数据
C.加速查找
10.以下不属于数据挖掘软件的是(C)
A. SPSS Modeler
C. Apache Spark
使我们无法人为地去发现数据中的奥妙,与此同时,我
而不是因果关系。其中,数据之间的相关关系可以通过以
B.Bayes Network D. Apriori
3.置信度(con fide nee)是衡量兴趣度度量(B)的指标。
A.简洁性B.确定性
C.实用性D.新颖性
算法的加速过程依赖于以下哪个策略(B)
A抽样B.剪枝
D.新颖性

B.剪枝
D.并行

B.
D.
5.以下哪个会降低Apriori算法的挖掘效率(
A支持度阈值增大
C.事务数减少
算法使用到以下哪些东东()
A.格结构、有向无环图
C.格结构、哈希树
7.非频繁模式()
A其置信度小于阈值
C.包含负模式和负相关模式
B.项数减少
D.减小硬盘读写速率
B.二叉树、哈希树
D.多叉树、有向无环图
和置信度。
禾nFP-Growth。
不对称二元变量的形式呈现。
5•—个项集满足最小支持度,我们称之为
频繁项集 。
6.—个关联规则同时满足最小支持度和最小置信度,我们称之为
7.在回归与相关分析中,因变量值随自变量值的增大 (减小)而减小(增大)的现象叫做 负相关。
8.极大频繁项集不能无损还原出频繁项集,是因为它不包含频繁项集的
B.
D.
)
B.
D.
)[注:分别以1、2、3代表之]
2可以还原出无损的1
2与1是完全等价的
查找
剪枝
B.
D.
Weka
Knime
二、10个填空
1.关联分析中表示关联关系的方法主要有:
2.关联规则的评价度量主要有:
3.关联规则挖掘的算法主要有:
4.购物篮分析中,数据是以
禾n_
禾n_
的形式呈现。
5.一个项集满足最小支持度,我们称之为o
数据挖掘考试题目一一关联分析
一、10个选择
1.以下属于关联分析的是()
A. CPU性能预测B.购物篮恩伯格在《大数据时代:生活、工作与思维的大变革》一书中,持续强
调了一个观点:大数据时代的到来, 们更应该注重数据中的相关关系, 下哪个算法直接挖掘()
4.可信度是对关联规则的准确度的衡量。
5.给定关联规则A B,意味着:若A发生,B也会发生。
6.频繁闭项集可用来无损压缩频繁项集。
7.关联规则可以用枚举的方法产生。 算法产生的关联规则总是确定的。
9.不满足给定评价度量的关联规则是无趣的。
10.对于项集来说,置信度没有意义。
5个简答
1.简述关联规则产生的两个基本步骤。
6•—个关联规则同时满足最小支持度和最小置信度,我们称之为
7.在回归与相关分析中,因变量值随自变量值的增大(减小)而减小(增大)的现象叫
做。
8.极大频繁项集不能无损还原出频繁项集,是因为它不包含频繁项集的
9.经典的Apriori算法是逐层扫描的,也就是说它是(
10.数据挖掘大概步骤包括:输入数据预处理 挖 — 理 输出知识。其中,
算法是从事务数据库中挖掘布尔关联规则的常用算法,该算法利用频繁项集性质的先验知 识,从候选项集中找到频繁项集。请简述Apriori算法的基本原理。
3.简述Apriori算法的优点和缺点。
4.针对Apriori算法的缺点,可以做哪些方面的改进
5.强关联规则一定是有趣的吗为什么
数据挖掘考试题目
一、10个选择
9.经典的Apriori算法是逐层扫描的,也就是说它是
强规则 。
支持度信息。 宽度(选:深度/宽度)优先的。
输出的 比如说 比如说决
10.数据挖掘大概步骤包括:输入数据预处理 挖掘 后处理 输出知识。其中,
知识可以有很多种表示形式,两种极端的形式是:①内部结构难以被理解的黑匣子, 人工神经网络训练得出的网络;②模式结构清晰的匣子,这种结构容易被人理解,
B.令人不感兴趣
D.对异常数据项敏感
8.对频繁项集、频繁闭项集、极大频繁项集的关系描述正确的是(
A.3可以还原出无损的1
C.3与2是完全等价的
tree在Apriori算法中所起的作用是(
A存储数据
C.加速查找
10.以下不属于数据挖掘软件的是(
A. SPSS Modeler
C. Apache Spark
相关主题