当前位置:文档之家› 大学数据挖掘期末考试题

大学数据挖掘期末考试题

大学数据挖掘期末考试题
学院试题
密封期限:学期末
本试题共三部分,满分100分,考试时间120分钟。

第一部分:选择题(共40分,每小题2分)
1.下列哪个选项是正确的?
A.选项A
B.选项B
C.选项C
D.选项D
2.下列哪个选项是错误的?
A.选项A
B.选项B
C.选项C
D.选项D
3.以下哪项描述不正确?
A.选项A
B.选项B
C.选项C
D.选项D
4.以下哪项描述正确?
A.选项A
B.选项B
C.选项C
D.选项D
第二部分:填空题(共30分,每小题3分)
1.我国现行的宪法于(1)年(2)月(3)日颁布。

2.我国的国家根本大法是(4)。

3.《中华人民共和国宪法》规定:中华人民共和国的一切
权力属于(5)。

4.全国人民代表大会是我国的最高国家权力机关,它的最
高领导机构是(6)。

5.中华人民共和国主席、副主席由全国人民代表大会选举,任期(7)年。

第三部分:简答题(共30分,每小题10分)
1.请简要介绍我国的政治制度。

我国的政治制度是社会主义制度,是以工人阶级为领导的以工农联盟为基础的人民民主专政。

我国最高国家权力机关是全国人民代表大会和它的常委会,国家行政机关是国务院和它的组成部门,最高审判机关是XXX,最高检察机关是XXX。

2.请简要介绍我国的经济发展情况。

我国的经济发展取得了长足的进步,成为世界第二大经济体。

我国实行的是社会主义市场经济,通过改革开放,吸引了大量的外资,推动了经济的快速发展。

我国的GDP连续多年以高速增长,人民生活水平不断提高。

3.请简要介绍我国的文化传统。

我国的文化传统源远流长,拥有悠久的历史和丰富的文化遗产。

我国的文化包括中华文化、儒家文化、道家文化、XXX文化等等。

中华文化是我国的主要文化,它包括了诗、书、画、印、琴、棋、剑等七艺,是我国的传统文化精髓。

儒家文化是我国的传统文化之一,它强调仁爱、诚信、孝道等道德观念。

道家文化是我国的哲学文化,它强调道、德、天、地等观念。

文化是我国的宗教文化,它强调慈悲、般若等观念。

一、判断题(每题1分,10分)
1.从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。

(错误,应为凝聚的层次聚类方法)
2.数据挖掘的目标不在于数据采集策略,而在于对已经存在的数据进行模式的发掘。

(正确)
3.在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。

(错误,应为簇内的相似性越大,簇间的差别越小,聚类的效果越好)
4.当两个点之间的邻近度取它们之间距离的平方时,Ward 方法与组平均非常相似。

(正确)
5.DBSCAN是相对抗噪声的,并且能够处理任意形状和
大小的簇。

(正确)
6.属性的性质不必与用来度量他的值的性质相同。

(正确)
7.全链对噪声点和离群点很敏感。

(正确)
8.对于非对称的属性,只有非零值才是重要的。

(正确)
9.K均值可以很好的处理不同密度的数据。

(错误,应为
K均值对密度敏感,难以处理不同密度的数据)
10.单链技术擅长处理椭圆形状的簇。

(正确)
二、选择题(每题2分,30分)
1.当不知道数据所带标签时,可以使用哪种技术促使带同
类标签的数据与带其他标签的数据相分离?(B.聚类)
2.(C.组平均)将两个簇的邻近度定义为不同簇的所有点对
邻近度的平均值,它是一种凝聚层次聚类技术。

3.数据挖掘的经典案例“啤酒与尿布试验”最主要是应用了
(D.关联规则分析)数据挖掘方法。

4.关于K均值和DBSCAN的比较,以下说法不正确的是
(A.K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象。

)
5.下列关于Ward’s Method说法错误的是:(A.对噪声点和离群点敏感度比较小)
6.下列关于层次聚类存在的问题说法正确的是:(D.Max
对噪声点和离群点很敏感)
7.下列关于凝聚层次聚类的说法中,正确的是:(B)算法的终止条件是仅剩下一个簇。

(A)一旦两个簇合并,该操作可以撤销。

(C)空间复杂度为O(m^2)。

(D)具有全局优化目标函数。

8.规则{牛奶,尿布}→{啤酒}的支持度和置信度分别为:(C)0.4,0.67.
9.下列(B)Max是属于分裂层次聚类的方法。

(A)Min (C)Group Average (D)MST
10.对下图数据进行凝聚聚类操作,簇间相似度使用MAX 计算,第二步是哪两个簇合并:(C){2,3}和{4,5}合并。

11.将原始数据进行集成、变换、维度规约、数值规约是
在以下哪个步骤的任务?(C)数据预处理。

12.决策树中不包含以下哪种结点?(C)外部结点(external node)。

13.建立一个模型,通过这个模型根据已知的变量值来预
测其他某个变量值属于数据挖掘的哪一类任务?(C)预测建模。

14.下列哪个描述是正确的?(C)分类是有指导的研究,聚类是无指导的研究。

(A)分类和聚类都是有指导的研究。

(B)分类和聚类都是无指导的研究。

(D)分类是无指导的
研究,聚类是有指导的研究。

15.下面购物篮能够提取的3-项集的最大数量是多少?(B)2.
三、XXX
1.数据挖掘是从大量的数据中自动提取未知的、有用的、
可理解的模式和知识的过程。

它的功能包括分类、聚类、关联规则挖掘、异常检测、预测建模等方面。

2.数据预处理是指在进行数据挖掘之前对原始数据进行处理,包括数据清洗、数据集成、数据变换、数据规约等内容。

3.聚类是将数据集中相似的对象归为一类的过程。

与分类不同的是,聚类没有给定类别标签,是一种无监督研究方法。

聚类的目标是发现数据中的内在结构,而分类的目标是将数据集中的对象划分到已知的类别中。

4.决策树是一种基于树形结构的分类模型。

通过对数据集进行分析,决策树可以生成一颗树,其中每个内部节点表示一个属性上的判断,每个叶子节点表示一个类别。

进行分类时,从根节点开始,按照属性上的判断逐步向下,最终到达叶子节点,得到分类结果。

相关主题