当前位置:文档之家› 《探索大数据与人工智能》习试题库完整

《探索大数据与人工智能》习试题库完整

《探索大数据与人工智能》习题库单选1、Spark Streaming是什么软件栈中的流计算?A. SparkB. StormC. HiveD. Flume2、下列选项中,不是大数据发展趋势的是?A. 大数据分析的革命性方法出现B. 大数据与与云计算将深度融合C. 大数据一体机将陆续发布D. 大数据未来可能会被淘汰3、2011年5月是哪家全球知名咨询公司在《Big data: The next frontier for innovation, competition and productivity 》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔·恩门B. 麦肯锡C. 扎克伯格D. 乔图斯4、以下哪个属于大数据在电信行业的数据商业化方面的应用?A.精准广告B. 网络管理C. 网络优化D. 客服中心优化5、以下哪个不属于大数据在电信行业的应用?A.数据商业化B. 物流网络C. 企业运营D. 客户关系管理6、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。

A.首席数据官B. 首席科学家C. 首席执行官D. 首席架构师7、下列选项中,不是kafka适合的应用场景是?A.日志收集B. 消息系统C. 业务系统D.流式处理8、下列选项中,哪个不是HBASE的特点?A.面向行B. 多版本C. 扩展性D. 稀疏性9、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?A.数量越多处理时间越长B. 数量越多处理时间越短B.数量越小处理时间越短D.没什么关系10、在Spark的软件栈中,用于机器学习的是A.Spark StreamingB. MllibC. GraphXD.SparkSQL11、Spark是在哪一年开源的?A.1980B. 2010C. 1990D. 200012、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是? A结构化数据B. 非结构化数据C. 半结构化数据D. 全结构化数据13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A.机器性能B. 语言歧义性C. 知识依赖D. 语境14、语音识别常用的应用有四个,下列不是常用应用的是?A.聊天B. 拨号C. 导航D. 设备控制15、以下哪种学习方法不属于人工智能算法?A.迁移学习B. 对抗学习C. 强化学习D.自由学习16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B. 表结构C. 结果D. 报表17、总体来说,人工智能发展的未来趋势是?A.上升B. 下降C. 不动D. 大幅度下降18、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC. 移娃D.大云19、以下数据单位从小到大排列的顺序是?A.GB、B、KBB. B、KB、MBC. KB、ZB、PBD.B、MB、KB20、以下数据单位换算错误的是?A.1KB=1024BB. 1GB=1024MBC. 1TB=1000GBD. 1MB=1024KB21、以下不是非结构化数据的项是?A.图片B. 音频C. 数据库二维表数据D. 视频22、整个MapReduce的过程大致分为Map、Shuffle、Combine、()?A.ReduceB. HashC. CleanD. Loading23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是?A.AIB. BIC. ALD. AF24、下列选项中,哪项是由谷歌开发的人工智能算法框架?A.KafkaB. TensorflowC. CaffeD.T orch25、BP神经网络的学习规则是?A.梯度上升法B.梯度下降法C. 梯度提升法D. 梯度曲线法26、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B. 语音播放C. 语音识别D. 语义理解27、数据生态中,算法模型分为两代,那么第一代算法模型是?A.TezB. SparkC. PigD.MapReduce28、Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。

需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但是计算密集度较大的场合,受益就相对较小;A.内存B. 硬盘C. 磁带D. 显卡29、下列选项中,哪项是分布式文件存储系统?A.HDFSB. FlumeC. KafkaD. Zookeeper30、工信部官网正式发布大数据产业”十三五“发展规划是在哪一年?A.1987B. 1997C.2007D. 201731、学习没有标签的数据集的机器学习方法是?A.监督学习B. 无监督学习C. 半监督学习D. 强化学习32、当前世界产生的数据总量的单位是?A.KBB. ZBC. GBD. TB33、下列选项中正确说明价值密度低的是?A.100TB数据中有50TB有效数据B. 1TB数据中有1KB有效数据C.100PB数据中有100PB有效数据D. 10EB数据中有10EB有效数据34、中国移动研发了智能客服问答机器人(),使业务流程自动化,更加智能的回答用户解决业务咨询、业务办理、流量查询等问题。

A.精灵B. 阿尔法蛋C. 小度D. 移娃35、IBM的()是第一个在国际象棋上战胜人类棋手的人工智能计算机。

A.AlphaGoB. 深蓝C. 图灵机模型D. 深度学习机器人36、在HDFS中存在NameNode、DataNode、Client,而NameNode是管理者,DataNode 是文件存储者,那么Client是什么呢?A.连接器B. 客户端C. 接口提供者D. 数据采集37、mapreduce计算模型适用于哪种任务?A.多线程处理B. 有关联的行处理C. 批处理D. 实时数据变化处理38、大数据特征有几种(不包括IBM提出的新特征)?A.1B.2C.3D.439、Hadoop是()年诞生的?A.1985-1985B.1995-1996C.2005-2006D.2015-201640、以下哪个不属于大数据在电信行业的数据商业化方面的应用?A.精准广告B.网络管理C.营销洞察D.大数据检测和决策41、传统的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。

请问标签为离散的类型,称为分类,标签为连续的类型,称为什么?A.给定标签B.离散C.分类D.回归42、下列选项中,正确描述Flume对数据源的支持的是?A.只能使用HDFS数据源B.可以配置数据源C.不能使用文件系统D.不能使用目录方式43、IBM提出的大数据5V特征包括()、更快(Velocity)、更多(Variety)、更值钱(Value)和更真实(Veracity)A.更有效B.更大(Volume)C.更充分D.更直观44、下列选项中,不是大数据的一部分的是?A.海量计算B.大量数据管理C.数据分析D.单机计算45、Flume采用了三层架构,分别为agent,collector和()A.MapB.storageC.ShuffleD.Hash46、HBASE的特点不包括?A.面向列B.稀疏性C.多版本D.低可靠性47、mapreduce计算模型适用于哪种任务?A.多线程处理B. 有关联的行处理C. 批处理D.实时数据变化处理48、最初的大数据概念还比较模糊,只是隐约的知道像个性化推荐、搜索引擎之类的处理需理需要大量数据,那么在搜索引擎方面,谁是世界上最大的厂商?A.谷歌B. 百度C. 360D. bing49、今年,大数据分析将出现革命性的新方法,从前的很多算法和基础理论可能会产生理论级别的突破。

而哪项技术将继续成为大数据智能分析的核心技术?A.机器学习B. 智能物流C. 脑科学D. 智能终端50、下列选项中,正确描述Flume对数据源的支持的是?A.只能使用HDFS数据源B. 可以配置数据源C. 不能使用文件系统D. 不能使用目录方式51、HBASE的特点不包括哪些?A.面向行B. 稀疏性C. 多版本D. 高可靠性52、下列选项中,不是用于数据存储的技术是哪一个?A.MongoDBB. MySQLC. HDFSD. Java53、属于“人造智能”,具有意识,达到或超越人类智慧水平的人工智能称为()A. 高人工智能B. 低人工智能C. 强人工智能D. 弱人工智能54、下列选项中,不是人工智能的基础设施的是?A. CPU服务器B. GPU服务器C. 专用芯片D. 游戏显卡54、以下不是大数据特征的是?A.数据体量大B. 数据种类多C. 价值密度高D. 处理速度快55、以下应用没有使用你的地理位置信息的是?A.美团B. 滴滴C. 高德地图D. word56、下列选项中,不是Flume的特点的是?A. 可靠性B. 集中式架构C. 可扩展性D. 可管理性57、在Spark的软件栈中,用于交互式查询的是A.SparkSQLB. MllibC. GraphXD. Spark Streaming58、下列选项中,不是大数据的一部分的是?A.海量计算B. 大量数据管理C. 数据分析D单机计算59、人工智能、机器学习、深度学习的包含关系是()A.机器学习>深度学习>人工智能B. 人工智能>深度学习>机器学习C.人工智能>机器学习>深度学习D. 深度学习>人工智能>机器学习60、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A. 机器性能B. 语言歧义性C. 知识依赖D. 语境61、BP神经网络模型拓扑结构不包括A.输入层B. 隐层C. 输出层D. 显层62、以下哪个不是语音识别的范畴?A.语音听写B. 语音合成C. 语音转写D. 语音唤醒63、Alpha Go是第一个击败人类职业()选手的人工智能程序。

A. 国际象棋B. 围棋C. 中国象棋D. 五子棋64、随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商正在改变商业模式,向着什么靠拢?A.闭源B. 开源C. 独立D. 封闭65、“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应()、高增长率和多样化的信息资产。

A. 海量B. 少数C. 小量D. 结构化66、Spark Streaming是什么软件栈中的流计算?A. SparkB. StormC. HiveD. Flume67、客服中心是运营商和客户接触较为频繁的通道,我们可以利用()在后端给客服中心建立庞大的知识库,供接线员们使用帮忙他们快速精准的找到答案。

相关主题