请认真阅读完再下载:预览的题目顺序完全和您自己的试题顺序完全相同再下载!
大数据技术-0001
浙江广播电视大学形成性测评系统课程代码:3306847 参考资料
试卷总分:100
单选题(共10题,共40分)
1.(4分)
数据约简主要有特征约简、样本约简、()和数值约简等。
A、维数约简
B、归一化
C、数据变换
D、一致性
参考答案:A
2.(4分)
下列哪项不属于大数据离线处理的特点()
A、数据具有实时性,不易长时间保存
B、在大量数据上进行复杂的批量运算
C、数据在计算之前已经完全到位,不会发生变化
D、能够方便地查询批量计算的结果。
参考答案:A
3.(4分)
以下关于云计算、大数据和物联网之间的关系,论述错误的是:()
A、云计算侧重于数据分析
B、云计算、大数据和物联网三者紧密相关,相辅相成
C、物联网可以借助于云计算实现海量数据的存储
D、物联网可以借助于大数据实现海量数据的分析
参考答案:A
4.(4分)
数据挖掘是从数据集(可能是不完全的、有噪声的、不确定性的、各种存储形式的)中挖掘出隐含在其中的、人们事先不知的、对决策有用的()的过程。
A、语义网
B、产生式
C、知识与信息
D、规则
参考答案:C
5.(4分)
网页数据是()。
A、网站外部数据
B、日志数据
C、网站内部数据
D、高速缓存数据
参考答案:A
6.(4分)
HDFS的命名空间不包含:( )
A、目录
B、文件
C、块
D、字节
参考答案:D
7.(4分)
以下对HADoop的说法错误的是:( )
A、HADoop的核心是HDFS和MApREDuCE
B、HADoop是基于JAvA语言开发的,只支持JAvA语言编程
C、HADoop2.0增加了NAmENoDE HA和WirE-CompATiBiliTy两个重大特性
D、HADoop MApREDuCE是针对谷歌MApREDuCE的开源实现,通常用于大规模数据集的并行计算
参考答案:B
8.(4分)
下列关于计算机存储容量单位的说法中,错误的是()。
A、1KB<1MB<1GB
B、基本单位是字节(ByTE)
C、一个汉字需要一个字节的存储空间
D、一个字节能够容纳一个英文字符
参考答案:C
9.(4分)
数据预处理过程中,关于最大最小标准化说法正确的是()
A、变换后变量的取值范围为【-1,1】
B、变换后变量的取值范围为(-1,1)
C、消除了量纲的影响
D、改变了数据的偏度
参考答案:C
10.(4分)
除了简单随机抽样外,其他抽样方法具有等概率思想的是()
A、两阶段集群抽样
B、等距抽样
C、集群抽样
D、以上都对
参考答案:D判断题(共10题,共30分)
11.(3分)
数据集成是指将不同来源、不同格式、不同特点与不同性质的数据在逻辑上或物理上有机地集中,存放在不一致的数据存储(如数据仓库)中。
√
×
参考答案:×
12.(3分)
数据规范化可将原来的度量值转换为无量纲的值,通过将属性数据按比例缩放,将一个函数给定属性的整个值域映射到一个新的值域中,即每个旧的值都被一个新的值替代。
√
×。