一、选择题30‘云计算Software as a Service Platform-as-a-Service Platform-as-a-Service云计算的特点:○1通用○2高扩展○3按需服务○4极其廉价云计算的三大核心技术GFS中的每一个文件被划分成多个Chunk,Chunk的默认大小是64MB,每个Chunk 又划分为若干Block(64KB),每个Block对应一个32bit的校验码,保证数据正确(若某个Block错误,则转移至其他Chunk副本)二、名词解释15’1.企业信息化:企业信息化是指企业利用现代信息技术,通过对信息资源的深化开发和广泛利用,不断提高企业生产、经营、管理、决策的效率和水平,进而提高企业经济效益和企业市场竞争力的过程。
2.云计算:是一种商业计算模型。
它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够按需获取计算力、存储空间和信息服务。
3.hadoop:Apache开源组织的一个分布式计算框架,可以在大量廉价的硬件设备组成的集群上运行应用程序,为应用程序提供了一组稳定可靠的接口,旨在构建一个具有高可靠性和良好扩展性的分布式系统4.企业信息系统PS:管理信息系统是一个以人为主导,利用计算机硬件、软件、网络通讯设备以及其它办公设备,进行信息收集、传输、加工、存储、更新和维护,以提高企业竞争力、提高效益和效率为目的,支持企业高层决策、中层控制、基层运作的集成化的人机系统。
4、决策支持信息系统DSS是一种以计算机为工具,应用决策科学及有关学科的理论与方法,以人机交互方式辅助决策者解决半结构化和非结构化决策问题的信息系统。
5.客户关系管理:通过信息技术使企业在营销、销售和服务业务范围内实现以客户为中心的管理理念的软件系统,其中涉及销售、市场营销、客户服务以及支持应用等软件三、简答题30‘1.hadoop 的三大关键技术,了解GFS的构成以及作用,实现机制。
三大关键技术:mapreduce,hbase,hdfs.○1实现机制:○2架构:GFS将容错的任务交给文件系统完成,利用软件的方法解决系统可靠性问题,使存储的成本成倍下降。
GFS将服务器故障视为正常现象,并采用多种方法,从多个角度,使用不同的容错措施,确保数据存储的安全、保证提供不间断的数据存储服务○重构成作用Client(客户端):应用程序的访问接口Master(主服务器):管理节点,在逻辑上只有一个,保存系统的元数据,负责整个文件系统的管理Chunk Server(数据块服务器):负责具体的存储工作。
数据以文件的形式存储在Chunk Server上。
Ps:技术1.大规模集2.群安装技术3.故障检测技术4.节点动态加入技术5.节能技术特点:采用中心服务器模式/不缓存数据/在用户态下实现/只提供专用接口2.MapReduce基本功能,任务要求,实现过程。
任务基本要求:待处理的数据集可以分解成许多小的数据集,而且每一个小数据集都可以完全并行地进行处理实现过程:(1)输入文件分成M块,每块大概16M~64MB(可以通过参数决定),接着在集群的机器上执行分派处理程序(2)M个Map任务和R个Reduce任务需要分派,Master选择空闲Worker 来分配这些Map或Reduce任务(3)Worker读取并处理相关输入块,Map函数产生的中间结果<key,value>对暂时缓冲到内存(4)中间结果定时写到本地硬盘,分区函数将其分成R个区。
中间结果在本地硬盘的位置信息将被发送回Master,然后Master负责把这些位置信息传送给Reduce Worker(5)当Master通知执行Reduce的Worker关于中间<key,value>对的位置时,它调用远程过程,从Map Worker的本地硬盘上读取缓冲的中间数据。
当Reduce Worker读到所有的中间数据,它就使用中间key进行排序,这样可使相同key 的值都在一起(6)Reduce Worker根据每一个唯一中间key来遍历所有的排序后的中间数据,并且把key和相关的中间结果值集合传递给用户定义的Reduce函数。
Reduce函数的结果写到一个最终的输出文件(7)当所有的Map任务和Reduce任务都完成的时候,Master激活用户程序。
此时MapReduce返回用户程序的调用点3、专家系统,三库,四库系统,概念,组成,(描述),每部分的作用。
专家系统就应该是:应用于某一专门领域,拥有该领域相当数量的专家级知识,问题的计算机(软件)系统。
四、设计题15‘Hbase 的数据行中有几种类型,(列簇,时间戳,列名)行关键字是数据行在表中唯一标识,时间戳是每次数据操作对应关联的时间戳,列定义为:<family>:<label>(<列族>:<标签>)Hbase 概念视图设计与物理视图设计转化。
物理模型实际上就是把概念模型中的一个行进行分割,并按照列族存储五、案例分析10’2个企业ERP的案例分析(课本)PS:1. 云计算是对( D )技术的发展与运用A. 并行计算B网格计算C分布式计算D三个选项都是2. IBM在2007年11月退出了“改进游戏规则”的(A )计算平台,为客户带来即买即用的云计算平台。
A. 蓝云B. 蓝天C. ARUZED. EC23. 微软于2008年10月推出云计算操作系统是(C )A. Google App EngineB. 蓝云C. AzureD. EC24. 2008年,( A )先后在无锡和北京建立了两个云计算中心A. IBMB. GoogleC. AmazonD. 微软5. 将平台作为服务的云计算服务类型是( B )A. IaaSB.PaaSC.SaaSD.三个选项都不是6. 将基础设施作为服务的云计算服务类型是(A )A. IaaSB.PaaSC.SaaSD.三个选项都不是7. IaaS计算实现机制中,系统管理模块的核心功能是(A )A. 负载均衡 B 监视节点的运行状态C应用API D. 节点环境配置8. 云计算体系结构的(C )负责资源管理、任务管理用户管理和安全管理等工作A.物理资源层B. 资源池层C. 管理中间件层D. SOA构建层9. 云计算按照服务类型大致可分为以下类(A、B、C )A.IaaSB. PaaSC. SaaSD.效用计算10. 下列不属于Google云计算平台技术架构的是(D )A. 并行数据处理MapReduceB.分布式锁ChubbyC. 结构化数据表BigTableD.弹性云计算EC211. 在目前GFS集群中,每个集群包含(B )个存储节点A.几百个B. 几千个C.几十个D.几十万个12. 下列选项中,哪条不是GFS选择在用户态下实现的原因(D )A.调试简单B.不影响数据块服务器的稳定性C. 降低实现难度,提高通用性D. 容易扩展13. GFS中主服务器节点存储的元数据包含这些信息(BCD )A.文件副本的位置信息B.命名空间C. Chunk与文件名的映射D. Chunk副本的位置信息14. 单一主服务器(Master)解决性能瓶颈的方法是(ABCD )A.减少其在数据存储中的参与程度B. 不适用Master读取数据C.客户端缓存元数据D. 采用大尺寸的数据块15. (B )是Google提出的用于处理海量数据的并行编程模式和大规模数据集的并行运算的软件架构。
A. GFSB.MapReduceC.ChubbyD.BitTable16. Mapreduce适用于( D )A. 任意应用程序B. 任意可在windows servet2008上运行的程序C.可以串行处理的应用程序D. 可以并行处理的应用程序17. MapReduce通常把输入文件按照(C )MB来划分A. 16 B32 C64 D12818. 与传统的分布式程序设计相比,Mapreduce封装了(ABCD )等细节,还提供了一个简单而强大的接口。
A. 并行处理B. 容错处理C. 本地化计算D. 负载均衡19. (D )是Google的分布式数据存储于管理系统A. GFSB. MapReduceC. ChubbyD.Bigtable20. 在Bigtable中,(A )主要用来存储子表数据以及一些日志文件A. GFSB. ChubbyC.SSTableD.MapReduce21. Google APP Engine使用的数据库是(C )A. 改进的SQLServerB. OrackC. Date storeD. 亚马逊的SimpleDB22. Google APP Engine目前支持的编程语言有(AD )A. Python语言B. C++语言C. 汇编语言D. JAVA语言23. 亚马逊AWS采用(A )虚拟化技术A. 未使用B. Hyper-VC. VmwareD. Xen24. 亚马逊将区域分为(AC )A地理区域B不可用区域C可用区域D隔离区域25. 下面选项属于Amazon提供的云计算服务是(ABC )A.弹性云计算EC2 B简单存储服务S3c简单队列服务SQS 服务26. 不属于弹性计算云EC2包含的IP地址的是(C )A. 公共IP地址B. 私有IP地址C.隧道IP地址D. 弹性IP地址27. 在EC2的安全与容错机制中,一个用户目前最多可以创建(B )安全组。
A. 50B. 100C. 150D. 20028. EC2常用的API包含下列哪些类型的操作(ABCD )A.AMIB. 安全组C实例D弹性IP地址29. S3的基本存储单元是(B )A.服务B.对象C.卷D. 组30. S3采用的专门安全措施是(AB )A.身份认证B.访问控制列表C防火墙D防木马病毒技术31. 在云计算系统中,提供“云端”服务模式是(D )公司的云计算服务平台。
A. IBMB. GOOGLEC. AmaxonD. 微软32. 下列四种云计算方案中,服务间的耦合度最高的是(C )A. 亚马逊AWSB. 微软AZUREC. Google APP EngineD. IBM的“蓝云”33. 云格可以完成的服务有(ABCD )A. 数据处理服务B. 格处理服务C. 高性能计算服务D. 协作服务34. 亚马逊AWS提供的云计算服务类型是(D )A. IaaSB.PaaSC.SaaSD.三个选项都是35. Google文件系统将整个系统的节点分为(ABC )的角色A.客户端B.主服务器C.数据块服务器D.监测服务器36. Google文件系统具有(ABD )特点A.采用中心服务器模式B不缓存数据C.采用边缘服务器模式D在用户态下实现37. Google不缓存数据的原因是(ABCD )A. OFS的文件操作大部门是流式读写;B. 维护缓存与实际数据之间的一致性太复杂C. 不存在大量的重复读写D. 数据块服务器上的数据存取使用本地文件系统38.从研究现状上看,下面不属于云计算特点的是(C )A. 超大规模B. 虚拟化C.私有化D. 高可靠性39.与网络计算相比,不属于云计算特征的是(B )A.资源高度共享B.适合紧耦合科学计算C. 支持虚拟机D. 适用于商业领域1 云计算的计算模式为( D ). A W/S B C/S C B/SD B/C 2( B )是公有云计算基础架构的基石。