当前位置：文档之家› 大学数据挖掘期末考试题

大学数据挖掘期末考试题

大学数据挖掘期末考试题
学院试题
密封期限：学期末
本试题共三部分，满分100分，考试时间120分钟。

第一部分：选择题（共40分，每小题2分）
1.下列哪个选项是正确的？
A.选项A
B.选项B
C.选项C
D.选项D
2.下列哪个选项是错误的？
A.选项A
B.选项B
C.选项C
D.选项D
3.以下哪项描述不正确？
A.选项A
B.选项B
C.选项C
D.选项D
4.以下哪项描述正确？
A.选项A
B.选项B
C.选项C
D.选项D
第二部分：填空题（共30分，每小题3分）
1.我国现行的宪法于（1）年（2）月（3）日颁布。

2.我国的国家根本大法是（4）。

3.《中华人民共和国宪法》规定：中华人民共和国的一切
权力属于（5）。

4.全国人民代表大会是我国的最高国家权力机关，它的最
高领导机构是（6）。

5.中华人民共和国主席、副主席由全国人民代表大会选举，任期（7）年。

第三部分：简答题（共30分，每小题10分）
1.请简要介绍我国的政治制度。

我国的政治制度是社会主义制度，是以工人阶级为领导的以工农联盟为基础的人民民主专政。

我国最高国家权力机关是全国人民代表大会和它的常委会，国家行政机关是国务院和它的组成部门，最高审判机关是XXX，最高检察机关是XXX。

2.请简要介绍我国的经济发展情况。

我国的经济发展取得了长足的进步，成为世界第二大经济体。

我国实行的是社会主义市场经济，通过改革开放，吸引了大量的外资，推动了经济的快速发展。

我国的GDP连续多年以高速增长，人民生活水平不断提高。

3.请简要介绍我国的文化传统。

我国的文化传统源远流长，拥有悠久的历史和丰富的文化遗产。

我国的文化包括中华文化、儒家文化、道家文化、XXX文化等等。

中华文化是我国的主要文化，它包括了诗、书、画、印、琴、棋、剑等七艺，是我国的传统文化精髓。

儒家文化是我国的传统文化之一，它强调仁爱、诚信、孝道等道德观念。

道家文化是我国的哲学文化，它强调道、德、天、地等观念。

文化是我国的宗教文化，它强调慈悲、般若等观念。

一、判断题（每题1分，10分）
1.从点作为个体簇开始，每一步合并两个最接近的簇，这是一种分裂的层次聚类方法。

（错误，应为凝聚的层次聚类方法）
2.数据挖掘的目标不在于数据采集策略，而在于对已经存在的数据进行模式的发掘。

（正确）
3.在聚类分析当中，簇内的相似性越大，簇间的差别越大，聚类的效果就越差。

（错误，应为簇内的相似性越大，簇间的差别越小，聚类的效果越好）
4.当两个点之间的邻近度取它们之间距离的平方时，Ward 方法与组平均非常相似。

（正确）
5.DBSCAN是相对抗噪声的，并且能够处理任意形状和
大小的簇。

（正确）
6.属性的性质不必与用来度量他的值的性质相同。

（正确）
7.全链对噪声点和离群点很敏感。

（正确）
8.对于非对称的属性，只有非零值才是重要的。

（正确）
9.K均值可以很好的处理不同密度的数据。

（错误，应为
K均值对密度敏感，难以处理不同密度的数据）
10.单链技术擅长处理椭圆形状的簇。

（正确）
二、选择题（每题2分，30分）
1.当不知道数据所带标签时，可以使用哪种技术促使带同
类标签的数据与带其他标签的数据相分离？(B.聚类)
2.(C.组平均)将两个簇的邻近度定义为不同簇的所有点对
邻近度的平均值，它是一种凝聚层次聚类技术。

3.数据挖掘的经典案例“啤酒与尿布试验”最主要是应用了
(D.关联规则分析)数据挖掘方法。

4.关于K均值和DBSCAN的比较，以下说法不正确的是
(A.K均值丢弃被它识别为噪声的对象，而DBSCAN一般聚类所有对象。

)
5.下列关于Ward’s Method说法错误的是：(A.对噪声点和离群点敏感度比较小)
6.下列关于层次聚类存在的问题说法正确的是：(D.Max
对噪声点和离群点很敏感)
7.下列关于凝聚层次聚类的说法中，正确的是：（B）算法的终止条件是仅剩下一个簇。

（A）一旦两个簇合并，该操作可以撤销。

（C）空间复杂度为O(m^2)。

（D）具有全局优化目标函数。

8.规则{牛奶，尿布}→{啤酒}的支持度和置信度分别为：（C）0.4,0.67.
9.下列（B）Max是属于分裂层次聚类的方法。

（A）Min （C）Group Average （D）MST
10.对下图数据进行凝聚聚类操作，簇间相似度使用MAX 计算，第二步是哪两个簇合并：（C）{2,3}和{4,5}合并。

11.将原始数据进行集成、变换、维度规约、数值规约是
在以下哪个步骤的任务？（C）数据预处理。

12.决策树中不包含以下哪种结点？（C）外部结点（external node）。

13.建立一个模型，通过这个模型根据已知的变量值来预
测其他某个变量值属于数据挖掘的哪一类任务？（C）预测建模。

14.下列哪个描述是正确的？（C）分类是有指导的研究，聚类是无指导的研究。

（A）分类和聚类都是有指导的研究。

（B）分类和聚类都是无指导的研究。

（D）分类是无指导的
研究，聚类是有指导的研究。

15.下面购物篮能够提取的3-项集的最大数量是多少？（B）2.
三、XXX
1.数据挖掘是从大量的数据中自动提取未知的、有用的、
可理解的模式和知识的过程。

它的功能包括分类、聚类、关联规则挖掘、异常检测、预测建模等方面。

2.数据预处理是指在进行数据挖掘之前对原始数据进行处理，包括数据清洗、数据集成、数据变换、数据规约等内容。

3.聚类是将数据集中相似的对象归为一类的过程。

与分类不同的是，聚类没有给定类别标签，是一种无监督研究方法。

聚类的目标是发现数据中的内在结构，而分类的目标是将数据集中的对象划分到已知的类别中。

4.决策树是一种基于树形结构的分类模型。

通过对数据集进行分析，决策树可以生成一颗树，其中每个内部节点表示一个属性上的判断，每个叶子节点表示一个类别。

进行分类时，从根节点开始，按照属性上的判断逐步向下，最终到达叶子节点，得到分类结果。

e商务文档

大学数据挖掘期末考试题

相关文档推荐：