一、选择题1、数据仓库是随时间变化的,下面的描述不正确的是:A、数据仓库随时间变化不断增加新的数据内容。
B、捕捉到的新数据会覆盖原来的快照。
C、数据仓库随时间变化不断删去旧的数据内容。
D、数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合。
答案: B2、关于基本数据的元数据是指:A、基本元数据包括与数据源、数据仓库、数据集市和应用程序等结构相关的信息。
B、基本元数据包括与企业相关的管理方面的数据和信息。
C、基本元数据包括日志文件和建立执行处理的时序调度信息。
D、基本元数据包括关于装载和更新处理、分析处理以及管理方面的信息。
答案:A3、下面有关数据粒度的描述不正确的是:A、粒度是指数据仓库小数据单元的详细程度和级别。
B、数据越详细,粒度就越小,级别也就越高。
C、数据综合度越高,粒度就越大,级别也就越高。
D、粒度的具体划分将直接影响数据仓库中的数据量以及查询质量。
答案:B4、有关数据仓库的开发特点,不正确的描述是:A、数据仓库开发要从数据出发。
B、数据仓库使用的需求在开发出去就要明确。
C、数据仓库的开发是一个不断循环的过程,是启发式的开发。
D、在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据的分析和处理更灵活,且没有固定的模式。
答案: B5、RAID技术具有容错能力,能够满足对存储能力、性能和可靠性不断提高的要求。
其实,实现原理是将数据写入多张磁盘中,如果—张磁盘发生故障,就从其他存放冗余数据的磁盘上访问数据。
有关RAID不同级别的描述不正确的是:A、在RAID 0这一级别上,数据记录通过在多组驱动器的扇区上交错地分布着实现,没有奇偶校验,不提供任何冗余。
B、RAID 1称为镜像。
在这一级别上,数据被冗余地写入成对的驱动器中,可以独立地从每个驱动器提取该数据。
这种方法没有什么缺点,是备份时候经常用到的技术。
C、RAID 3数据记录在成组驱动器上,位交错,只有一个驱动器仍有奇偶校验信息。
D、RAID 5如果采用这一水平的技术,则数据记录在成组的驱动器上扇区交错地存放着,所有驱动器都有奇偶校验信息。
答案: B6、有关数据仓库测试,下列说法不正确的是:答案: DA、在完成数据仓库的实施阶段中,需要对数据仓库进行各种测试。
测试工作中要包括单元测试和系统集成测试。
B、当数据仓库的每个单独组件完成后,就需要对它们进行单元测试。
C、系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试。
D、在测试之前没必要制定详细的测试计划。
7、OLAP技术的核心是:A、在线性B、对用户的快速响应C、互操作性D、多维分析答案: D8、关于OLAP的特性,下面正确的是:①快速性②可分析性③多维性④信息性⑤共享性A、①、②、③B、②、③、④C、①、②、③、④D、①、②、③、④、⑤答案: D9、关于OLAP和OLTP的区别的描述,不正确的是:A、OLAP主要是关于如何理解聚集的大量不同的数据。
它与OLAP应用程序不同。
B、与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务。
C、OLTP的特点在于事务量大,但事务内容比较简单且重复率高。
D、OLAP是以数据仓库为基础的,其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的。
答案: D10、OLAM技术一般简称为“数据联机分析挖掘”,下面说法正确的是:A、OLAP和OLAM都基于客户机/服务器模式,只有后者有与用户的交互性。
B、由于OLAM的立方体和用于OLAP的立方体有本质的区别。
C、基于Web的OLAM是Web技术与OLAM技术的结合。
D、OLAM服务器通过用户图形接口接收用户的分析指令,在元数据的指导下,对超级立方体作一定的操作。
答案: D11、数据仓库的数据具有四个基本特征,下列不正确的是:A、面向主题的。
B、集成的。
C、不可更新的。
D、不随时间变化的。
答案: D12、下列是关于OLAP的描述,不正确的是:A、一个多维数组可以表示为:(维1,维2,……,维n)缺少【变量】B、维的一个取值称为该维的一个维成员C、OLAP是联机分析处理D、OLAP是以数据仓库进行分析决策的基础答案: A13、关于OLAP和OLTP的说法,下列不正确的是:答案:BA、OLTP事务量大,但事务内容比较简单且重复率高B、OLAP的最终数据来源与OLTP不一样C、OLAP面对的是决策人员和高层管理人员D、OLTP以应用为核心,是应用驱动的14、关于数据仓库元数据的描述,下列不正确的是:A、元数据描述了数据的结构、内容、码、索引等项内容。
B、元数据内容在设计数据仓库时确定后,就不应该再改变。
C、元数据包含对数据转换的描述。
D、元数据是有效管理数据仓库的重要前提。
答案: B15、下列描述不正确的是:A、模型辅助决策系统一般可以使用若干个模型来解决同一问题。
B、人机交互系统是决策支持系统的一个组成部分。
C、决策支持系统包含模型库和模型库管理系统。
D、智能决策支持系统包含知识库系统。
答案: A16、决策支持系统可以用不同的方法进行构造,下列的说法不正确的是A、可以用生命周期法和原型法构造决策支持系统。
B、原型法是一个迭代过程。
C、原型法中不存在对用户的反馈。
D、SDLC即是系统开发的生命周期法答案: C17、数据清洗是数据转移的一种基本类型,它不能通过下列的那种方法来完成:A、范围检验B、枚举清单C、相关检验D、删除不合格的数据答案: D18、下列不是数据转移的基本类型的是:A、简单转移B、清洗C、集成D、继承答案: D19、开展数据挖掘的基本目的是:A、建立数据仓库。
B、帮助用户作决策。
C、从大量数据中提取有用信息。
D、对数据进行统计和分析。
答案: C20、产生数据挖掘的根本原因是:A、数据统计分析。
B、技术的发展。
C、商业推动。
D、数据仓库的产生。
答案: A21、()是通过数据库中的一些属性来预测另一个属性,它在验证用户提出的假设的过程中提取信息。
A、文本数据挖掘B、发现驱动的数据挖掘C、验证驱动的数据挖掘D、Web数据挖掘答案:C22、对于在数据仓库中设计、使用OLAP的用户来说,下面不属于OLAP的衡量标准的是:A、解释性批处理提取。
B、弹性报告和一致性能报告。
C、对物理层的自动调整。
D、体系结构。
答案: D23、对MOLAP和ROLAP的比较,不正确的说法是:A、MOLAP的查询能力一般较好,而在ROLAP中进行查询,往往很难预料查询结果。
B、MOLAP所需要的数据加载时间比较长,而ROLAP的加载时间要比MOLAP短。
C、ROLAP比MOLAP的查询速度都要快很多。
D、MOLAP在分析过程中的精度较高,具有分析的优势。
答案: C24、关于OLAP服务器及其工具,说法正确的是:A、只有Oracle提供了OLAP功能。
B、评价OLAP服务器的标准不包括全局结构视图。
C、OLAP的服务引擎都应满足分析模型及应用在功能、规模和技术特征上的要求。
D、对OLAP服务器的管理能力没有特别的要求。
答案: C25、数据挖掘工具按照使用方式分类,可以分为:A、分为基于神经网络的工具,基于规则和决策树的工具,基于模糊逻辑的工具和综合性数据挖掘工具等。
B、分成决策方案生成工具,商业分析工具和研究分析工具三类。
C、分成专用型数据挖掘工具和通用型数据挖掘工具两大。
D、分成基于神经网络的工具和研究分析工具。
答案:B二、填空题1、数据仓库是_____、______、______、______有组织的数据集合,支持管理的决策过程。
答案:面向主题、集成的、时变的、非易失的2、一般来说,可将数据仓库的开发和应用过程细分为_____、______、______、______。
答案:设想阶段、规划和成长阶段、控制阶段和稳定阶段3、_____是对现实世界进行抽象的工具,需要将现实世界的事物及其有关特征转换为信息世界的数据,才能对信息进行处理与管理,这就需要依靠_____作为这种转换的桥梁。
这种转换经历了从现实到_____,从_____到_____,最后从_____到物理模型的转换。
答案:数据模型、数据模型、概念模型、概念模型、逻辑模型、逻辑模型4、元数据是关于数据、_____和应用程序的结构和意义的描述信息,其主要目标是_____。
其范围可以是某个特别的数据库管理系统中从现实世界的概念上的一般概括,到_____。
答案:操纵数据的进程、提供数据资源的全面指南、详细的物理说明5、按对象级别对元数据进行分类,可以从三个抽象级别上来认识:_____、逻辑级和_____。
答案:概念级、物理级6、数据库系统的特点主要体现在下面几个方面:_____、数据的共享性、_____和_____。
答案:数据的结构化、数据的独立性、数据统一由DBMS管理和控制。
7、依据数据仓库数据量大但是操作单一的特点,可以采取一些技术来进行数据仓库的物理数据模型设计,如:合并表、_____、引入冗余、_____、建立广义索引等等。
答案:建立数据序列、表的物理分割、生成导出数据8、数据仓库的接口技术包含多技术接口技术、_____和数据的高效率加载技术。
答案:语言接口技术9、数据仓库中数据的组织方式与数据库不同,通常采用分级的方式进行组织。
—般包括早期细节数据、_____、轻度综合数据、_____以及_____五部分。
答案:当前细节数据、高度综合数据、元数据10、数据仓库的需求分析根据不同领域可以划分为_____、设计的需求、_____和最终用户的需求等方面。
答案:投资者的需求、开发者的需求11、数据仓库虽然是从数据库发展而来的,但两者存在大的差异,从数据存储内容看,数据库只存放_____,而数据仓库则存放_____,数据库中的数据的目标是面向_____,而数据仓库则面向_____。
答案:当前值、历史值、业务操作人员、高层管理人员12、数据库内的数据是_____的,只要有业务发生,数据就会更新,而数据仓库则是_____的历史数据,只能定期添加、刷新。
答案:动态变化、静态13、数据仓库主要是供决策分析用的,所涉及的数据操作主要是_____,一般情况并不进行_____答案:数据查询、修改操作14、数据仓库创建后,首先从_____中抽取所需要的数据到数据准备区,在数据准备区中经过_____的净化处理,再加载到数据仓库数据库中,最后根据用户的需求将数据发布到_____。
答案:数据源、数据、数据集市/知识挖掘库中15、“主题”在数据仓库中由一系列_____实现的。
一个主题之下表的划分可按_____、数据所属时间段进行划分。
主题在数据仓库中可用_____方式进行存储,如果主题存量大为提高处理效率可采用_____方式进行存储。
答案:列表、数据的综合、多维数据库、关系数据库三、简答题1、什么是数据挖掘(Data Mining)? (简答题必考)答案:数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。