当前位置:文档之家› 2017年广东省公需课大数据考试

2017年广东省公需课大数据考试

大数据体系结构单选·下面不是HDFS优点的是B.适合单线程处理·下面不是HDFS缺点的是D.流式文件访问·大数据处理框架Spark最大的集群来自B.腾讯·大数据处理框架Spark诞生于A.伯克利大学AMPLab·提供资源的网络被称为B.云·以下不属于服务器及桌面虚拟化技术的是D. 虚拟SAN技术多选·前端数据中心虚拟化技术包括A.组件虚拟化B.交换系统虚拟化C.网络虚拟化D.网络服务器虚拟化 ABCD·能解决大数据存储效率的两方面有A.容量B.吞吐量 AB ·Hadoop的缺点有A.延迟大B.相应缓慢C.运维复杂 ABC·分布式数据库的特点是A.是一个有序、稀疏、多维度的映射表B.有良好的伸缩性和高可用性 C.用来将数据库存储或部署到各个计算节点上 ABC·云计算的优势包括 A.数据在云端:不怕丢失,不必备份,可以任意点的恢复B.软件在云端:不必下载自动升级C.无所不在的计算:在任何时间,任意地点,任何设备登录后就可以进行计算服务 D.无线强大的计算:具有无线空间的,无线速度 ABCD ·SaaS模式的优点有A.不用承担软件项目定制、开发、实施费用B.不用支付软件许可费用 C.不需要支付采购服务器等硬件设备费用D.不需要支付购买操作系统、数据库等平台软件费用ABCD·大数据处理框架-Spark的优点是()A. Spark是基于内存的迭代计算框架,适用于需要多次操作特定数据集的应用场合B. Spark不适用那种异步细粒度更新状态的应用 D. Spark的适用面比较广泛且比较通用 ABD判断·编程模型不适合用来处理大量数据的分布式运算,用于解决问题的程序开发模型,也是开发人员拆解问题的方法(错误)·HDFS是一个不可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用(错误)·目前大数据在互联网公司主要把Spark应用在广告、报表、推荐系统等业务上(正确)·Hadoop主要的使用场景在于实时系统(错误)·Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架(正确)·政务云是为政府机构应用现代信息通信技术(正确)·Spark与Hadoop无缝结合(正确)·流计算关注的是数据多次处理一次写入(正确)·云计算将所有的计算资源集中起来,并由软件实现自动管理,无需人为参与(正确)大数据概述和基本概念单选·以下观点错误的是 D.内部大数据与外部大数据的相对独立能保证企业的数据安全·大数据技术的战略意义是 C.对这些含有意义的数据进行专业化处理·以下数据单位最大的是C. TB·以下不属于推动大数据分析平台发展技术的是B.数据管理技术·主要承担搭建大数据平台上层建筑任务的是B.数据开发技术·下列单位不是数据单位的是 B.NB··信息技术是指有关信息的收集、识别、提取、变换、存贮、传递、处理、检索、检测、分析和利用等的技术。

凡涉及到这些过程和技术的工作部门,都可称作()部门C.信息·下列不属于商业大数据类型的是()D. 电子商务数据多选·大数据技术的出现实现了巨大的社会价值,主要表现在 A.能够推动实现巨大经济效益C.能够推动增强社会管理水平D.如果没有高性能的分析工具,大数据的价值就得不到释放 ACD·“大数据”的特点是A.数据体量大B.数据类别大C.数据处理速度快D.数据真实性高 ABCD·数据是一种未经加工的原始资料,下列属于数据的是A.数字B.符号C.文字D.图像 ABCD·云计算包括有三个部分,分别是A.基础设施服务B.平台服务C.软件服务 ABC·大数据处理流程可以概括为A.采集B.导入和预处理C.统计和分析D.数据挖掘 ABCD·互连网上出现的海量信息可以划分为三种,分别为()A. 结构化信息B. 非结构化信息C. 半结构化信息 ABC·企业大数据分析包括()A. 内容B. 关系C. 时空 ABC·美国哈佛大学的研究小组给出了著名的资源三角形,分别是()A. 信息C. 物质D. 能量 ACD判断·大数据或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合力时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯(正确)·结构化数据是指不方便用数据库二维逻辑来表现的数据(错误)·全球数据的90%产生于过去2年内(正确)·信息资源的创造和管理,从以往以经营和运作为核心的中心化模式,转化为以分散创造、自由传播、灵活汇聚为特征的众创模式(正确)·对企业而言,大数据实质上是一种管理手段(错误)·除了传统的报表、图形之外,我们还可以结合现代化的可视化工具及人机交互手段(正确)·信息是数据的表达,数据是信息的内涵(错误)·可视化是给机器看的,数据挖掘就是给人看的(错误)大数据应用案例单选·以下算法中,不属于分类预测的典型算法的是C. K-means算法·英国发布《把握数据带来的机遇:英国数据能力战略》的时间是B. 2013年·常应用于市场细分方面的数据挖掘是B.聚类分析·在激烈竞争的市场中,()是一个可能根据服务质量、优惠条件等因素而不断流动的团体 D. 客户·美国治理警察超速行驶是通过()发现问题的 B. 通过对不同高速口收费站的原始数据记录的比对挖掘分析·拥有全球第一大互联网用户群体的国家是()A. 中国多选·以B.物联网C.云计算D.大数据为代表的信息时代,将逐步改变人类的传统工作生活方式 BCD·翼云平台主要研究内容包括 A. Hadoop架构及源码分析 B .HDFS 文件存储和传输的机制 C .NameNode的伸缩性问题D.负载均衡ABCD·安全生产大数据当前面临的主要问题有A.缺乏标准B.部门协调能力不足C.企业信息化能力弱D.分析工具及大数据专业分析人员缺乏 ABCD·大数据时代的城市研究、规划与管理需要从()层面去挖掘大数据的学术及应用价值 A. 政府B 企业C.居民 ABC·谷歌推出流感趋势监测系统是()产生作用的 A. 美国人在去医院前,喜欢在谷歌搜索类似“流感症状”的词汇 B. 谷歌据此预测流感趋势,比美国疾病控制和预防中心(CDC)的流感通报提早一周到10天 C. 政府由此可提前准备应对措施 ABC判断·翼云产品平台是一个机遇Hadoop架构进行开发的云存储系统(正确)·聚类是指把一组个体按照相似性归成若干类别(正确)·大数据的研究,能够更好底为智慧城市的建设提供条件(正确)·通过大数据挖掘分析,探索舆情传播规律,构建舆情预警指标体系,可及时发现舆情危机苗头并预警(正确)·2013年10月,澳大利亚政府发布又信息管理办公室成立的“大数据工作组”制定的公共服务大数据战略(正确)·广州市教育异构资源整合平台是为了深化“广州市教育e时代”的工程建设(正确)·大数据分析是对总体数据,尤其是针对传统手段捕捉到的数据之外的非结构化数据进行分析(正确)·目前,我国已经有三分一的地级和三分二的县级安全监管机构接入安全生产专网(错误)·中国已成为全球最大的大数据市场(错误)大数据安全与存储单选·下面哪种不是数据库的分类B.开放式数据库·B.数据结构是指数据的组织形式或数据之间的联系·B.主存储器用于存放计算机运行期间的大量程序和数据·下列哪条不属于隐私保护防护策略B.安全检查·不属于基于大数据的威胁发现技术的优点是哪项( ) B. 对已知威胁的检测多选·隐私保护关键技术有A.基于大数据的威胁发现技术B.基于大数据的认证技术C.基于大数据的数据真实性分析 ABC·现有的许多威胁分析技术的限制有A内存大小B无法应对持续性D 潜伏性攻击 ABD·目前影响大数据产业发展主要大问题有A.大数据应用场景C.大数据隐私保护 AC·NoSQL数据库的分类有A.键值(Key-Value)存储数据库B.列存储数据库C.文档型数据库D.图形(Graph)数据库 ABCD ·目前大数据存储面临的问题有A.存储数据的成本在不断地增加B.数据存储容量爆炸性增长且难以预估 C.越来越复杂的环境使得存储的数据无法管理 ABC·建立数据仓库的基本条件 A.该行业有较为成熟的联机事务处理系统,它为数据仓库提供客观条件 B.该行业面临市场竞争的压力,它为数据仓库的建立提供外在的动力 C.该行业为数据密集型行业ABC·构造数据仓库的方式有()A. 自上而下 B. 自下而上 AB ·磁带存储技术的优点是()A. 每GB价格比磁盘便宜B. 扩展容易C. 存储时间长 ABC·属于光盘优点的是()A. 单位存储容量成本低,携带方便,数据查询时间短B. 容量大,保存时间长C. 数据读取、写入数据快,操作方便 ABC·数据库系统结构模型包括()A. 层次结构模型B. 网状结构模型C. 关系结构模型 ABC判断·HBase是一个构建在HDFS上的分布式列存储系统(正确)·NAS是一种专业的网络文件存储及文件备份设备,它是基于LAN(局域网)的,按照TCP/IP协议进行通信,以文件的I/O(输入/输出)方式进行数据传输(正确)·基于大数据的认证技术是建立在大量用户行为和设备行为数据分析的基础上,而初始阶段不具备大量的数据。

因此,无法分析出用户行为特征,或者分析的结果不够准确(正确)·存储虚拟化的核心工作是物理存储设备到单一逻辑资源池的映射,通过虚拟技术,为用户和应用程序提供了虚拟磁盘或虚拟卷(正确)·光盘存储技术是一种光学信息存储技术,通过调制激光束在光学圆盘镀膜介质中把信息编码以光点的形式记录下来(正确)·基于大数据的数据真实性分析技术能够提高垃圾信息的鉴别能力(正确)·大规模并行分析数据库最擅长对大容量的主流结构化数据提供离线的分析( 错误 )·数据结构又分为数据的逻辑结构和数据的物理结构( 正确 )大数据技术与发展前景单选·作为老牌商业中心,吸引着短期来京者的重点地点是A.北京西单B.流式计算是一种高实时性的计算模式·数据的可用性取决于C.数据质量·()是一种高实时性的计算模式 B. 流式计算多选·对大数据的使用者、研究者、开发者以及上级主管部门,提出如下建议由A.提高用户对大数据可用性的重要性的认识B.加强对大数据可用性评估和保证的关键技术的研究和开发C.注重大数据可用性的评估,加强数据质量保证软件的开发和推广D.尽快建立关于大数据可用性的标准,保证大数据的统一质量 ABCD·大数据时代企业对数据的管理、查询及分析的需求变化主要集中在A.数据规模的增长B.吞吐量的上升C.数据类型的变化D.应用多样性的变化 ABCD·实时流式大数据的处理的需求是A.大数据系统实现低延迟处理B.强大而又灵活的复杂事件处理引擎C.具有容错和去重能力D.对流量进行控制和动态节点增加和删除的能力 ABCD·大数据给存储系统带来的挑战有()A. 存储规模大B. 存储管理复杂C. 数据服务的种类和水平要求高 ABC·大数据查询分析计算的典型系统包括()A. Hadoop36下的HBase 和Hive B. Facebook开发的Cassandra C. Google 公司的Dremel D. Cloudera 公司的实时查询引擎Impala ABCD·在科学大规模数据的并行可视化工作中,主要涉及基本技术有()A. 数据流线化 B. 任务并行化C. 管道并行化D. 数据并行化 ABCD·大数据环境下的分析和挖掘方法具有的挑战是()A. 数据量的膨胀B. 数据深度分析需求的增长C. 自动化、可视化分析需求的出现 ABC判断·大数据环境下的分析和挖掘方法与传统的小样本统计分析,在本质上是一致的(正确)·最适合于完成大数据批处理的计算模式是Spark(错误)·流式计算是一种高实时性的计算模式,需要对一定时间窗口内应用系统产生的新数据完成实时的计算处理,避免造成数据堆积和丢失(正确)·随着政府和行业数据的开放,更多的外部数据将进入企业级数据仓库(正确)·云计算为大数据提供了可以弹性扩展的存储空间和计算资源,但价格比较贵(错误)·北京的批发市场是外地人最密集的区域(错误)·经分析,北京首都化的过程就是外地人进三环、北京土著出五环的过程(错误)·MapReduce适用于处理数据关系较为复杂的计算任务(错误)·目前,北京无论常住外来人口还是“外来人才”,都主要集中在城市北、东、南三个区域的三环、四环外围(错误)·云计算为大数据提供了可以弹性扩展的存储空间和计算资源,但价格比较贵(错误)·为了保证大数据的可用性,首先必须在数据的源头上把好质量关,做好从原始数据到高质量信息的预处理(正确)大数据分析与数据挖掘单选·用户评论文本数据以及客服系统的语音数据和评价文本数据,可以统称为A.用户反馈数据·商业智能的概念在B.1996年最早由加特纳集团提出·数据挖掘需要的人员不包括A.业务管理人员·渠道分析不包括()D. 用户属性·功能设备创建或生成的数据被称为()D. 机器和传感器数据·()是指通过互联网采集大量的行为数据 A. 大数据营销多选·在传统数据仓库中,数据仓库管理员的工作包括A.创建计划B.定期计算仓库中的标准化数据C.将产生的报告分配到各业务部门D.为管理人员创建仪表板和其他功能有限的可视化工具ABCD·社会媒体对预测的作用有 A.社会信号的采集 C.大众预测的融合AC·用户属性分析主要从A.用户使用的设备终端B.网络及运营商分析C.用户画像角度方面进行分析 ABC·商业智能技术提供使企业迅速分析数据的技术和方法,包括()A. 收集、管理和分析数据B. 将这些数据转化为有用的信息D. 分发到企业各处 ABD·电子商务的优势有()A. 不受地域限制,一网覆盖全国乃至全球B. 不受时间限制,它可以7×24小时服务C. 可以有无穷的货架,增加商品只是增加服务器 ABC·大数据要分析的数据类型包括()A. 交易数据B. 人为数据C. 移动数据D. 机器和传感器数据 ABCD判断·在地里学研究中,空间交互指的是两个以上的场所之间的联系(错误)·建立数据仓库的过程一般包括清洗、抽取数据操作、统一数据格式、设定自动程序以定时抽取操作数据并自动更新数据仓库,预先执行合计计算等步骤(正确)·消费意图是指消费者通过显式或隐式的方式来表达对于某一产品或服务的购买意愿(正确)·社会感知就是借助于各类空间大数据研究人类时空间行为特征,进而揭示社会经济现象的时空分布、联系及过程的理论和方法(正确)·大数据具备能够提高特定类型的企业及众多不同部门内部工作效率并改进运营的潜力(错误)·移动互联网是互联网发展最重要的方向(正确)·专业用户通过前端的商业智能工具对数据仓库进行基础的数据可视化和有限的分析(错误)·移动互联网是互联网发展最重要的方向(正确)·不同类型的大数据可以揭示一个区域或城市的活动以及人口分布状态(正确)·商业智能能够辅助的业务经营决策,既可以是操作层的,也可以是战术层和战略层的决策(正确)。

相关主题