当前位置:
文档之家› CET高级商务分析期末考试复习资料
CET高级商务分析期末考试复习资料
4、什么情况下需要用到数据集市?
参考答案:1)遗留数据库2)来自非数据源的数据3)无物理连接的数据4)脏数据
5、数据仓库、联机分析处理和数据挖掘之间有什么关系?
参考答案:
数据仓库是在数据库基础上发展而来的,它通常有三个部分:数据仓库(data warehousing)、联机分析处理(olap)及数据挖掘(datamining),它们之间具有极强的互补关系。
12、数据仓库元数据描述了数据的结构、内容、码、索引等项内容。
答案:√
13、模型辅助决策系统一般可以使用若干个模型来解决同一问题。
答案:×
不同模型一般不能解决同一问题。
14、数据清洗是数据转移的一种基本类型,它能通过范围检验、枚举清单、相关检验等方法来来完成。
答案:√
15、继承不是数据转移的基本类型的是:
7、OLAP的特性是快速性、可分析性、多维性、信息性、独占性
答案:×
快速性、可分析性、多维性、信息性、共享性
8、关于OLAP和OLTP的区别的描述是否正确:与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务;OLAP的特点在于事务量大,但基本特征为:面向主题的、集成的、不可更新的、不随时间变化的。
答案:√
4、在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据的分析和处理更灵活,且没有固定的模式。
答案:√
5、数据仓库的测试,在测试之前没必要制定详细的测试计划。
答案:×
数据仓库的测试,在测试之前要制定详细的测试计划。
6、OLAP技术的核心是对用户的快速响应。
答案:×
OLAP技术的核心是多维分析。
12、立方体(CUBE)结构
答案:立方结构指用三维或更多的维数来描述一个对象,每个维彼此垂直。数据的测量值发生在维的交叉点上,数据空间的各个部分都有相同的维属性。
13、ROLAP
答案:ROLAP方案以二维关系表为核心表达多维概念,通过将多维结构划分为两类表:维表和事实表,使关系型结构能较好地适应多维数据的表示和存储;通过关系表间的连接来查询数据的ROLAP系统,系统性能成为最大问题。
答案:√
37、报表结构包括数据定义、报表布局、报表定义语言。
答案:√
38、在星型架构中,层次结构的所有信息都存储在相同的表中。父维度(组维度或曾祖维度等)的信息被添加到层次结构的最高层维度的维度表中。
答案:×
在星型架构中,层次结构的所有信息都存储在相同的表中。父维度(组维度或曾祖维度等)的信息被添加到层次结构的最低层维度的维度表中。
4、粒度
答案:数据仓库的数据单位中保存数据的细化或综合程度的级别。细化程度越高,粒度越小。
5、分割
答案:数据分散到各自的物理单元中去,它们能独立地处理。
6、维
答案:是人们观察数据的特定角度,是考虑问题时的一类属性,属性集合构成一个维(时间维、地理维等)。
7、维的层次
答案:人们观察数据的某个特定角度(即某个维)可以存在细节程度不同的各个描述方面(时间维:日期、月份、季度、年)。
答案:√
24.粒度指的是数据仓库中数据单元的细节程度或综合程度的级别。细节程度越高,粒度级别就越低,查询范围越广泛。
答案:×
粒度指的是数据仓库中数据单元的细节程度或综合程度的级别。细节程度越高,粒度级别就越低,查询范围越狭窄。
25. OLAP的基本操作包括:上卷、.下钻、切片、联合
答案:×
不包括联合。
答案:×
面向主题的、集成的、不可更新的、随时间变化的。
10、OLAP是联机分析处理,以数据仓库进行分析决策的基础
答案::√
11、关于OLAP和OLTP的说法,是否正确:OLTP事务量大,但事务内容比较简单且重复率高;OLAP的最终数据来源与OLTP不一样
答案:×
OLTP事务量大,但事务内容比较简单且重复率高;OLAP的最终数据来源与OLTP一样
1)数据仓库是为了满足人们在高度数据积累基础上进行数据分析的需要而产生的,数据仓库是进行分析决策的基础,因而还必须有强有力的工具辅助管理决策者进行分析和决策。
2)联 机分析处理是专门为支持复杂的分析操作而设计的,侧重于对决策人员和高层管理人员的决策支持,可以应分析人员的要求快速、灵活地进行大数据量的复杂查询处 理,并且以一种直观易懂的形式将查询结果提供给决策人员,以便准确掌握企业的经营状况,了解市场需求,制定正确方案,增加效益。
26、OLAM技术一般简称为“数据联机分析挖掘”,OLAM服务器通过用户图形接口接收用户的分析指令,在元数据的指导下,对超级立方体作一定的操作。
答案:√
27、基本数据的元数据包括与数据源、数据仓库、数据集市和应用程序等结构相关的信息。
答案:√
28、数据流任务为将数据从一个或多个源转移到一个或多个目标提供了直接的路径。
答案:×
必须以中括号括起来。
32、DISTINCTCOUNT函数和COUNT函数的结果和功能基本相同,唯一不同的是对于集合中多次出现的同一成员,DITINCTCOUNT函数只计算一次。
答案:√
33、数据挖掘能完成的任务包括:分类、回归、分割、关联、序列分析、概率预测等。
答案:√
34、数据挖掘结构中的每一列必须是下列用法之一:键、输入、输出、预测、但预测、忽略。
数据挖掘与 OLAP(联机分析处理)和区别:OLAP 可以为您提供实际的信息,而数据挖掘可以帮助您预测和预报结果或特性。
6、OLTP和OLAP有何区别?
8、维属性
答案:描述维特征的设置,对应于维表的字段。
9、维成员
答案:维的一个取值。是数据项在某维中位置的描述。(“某年某月某日”是在时间维上位置的描述)
10、多维数组
答案:维和变量的组合表示。一个多维数组可以表示为:(维1,维2,…,维n,变量)。(时间,地区,产品,销售额)
11、数据单元
答案:多维数组的取值。(2000年1月,上海,笔记本电脑,$100000)
一、名词解释题(20题)
1、数据仓库
答案:数据仓库就是一个用以更好地支持企业或组织的决策分析处理的,面向主题的,集成的,不可更新的,随时间不断变化的数据集合。
2、ETL
答案:ETL(Extract/Transformation/Load)—数据装载、转换、抽取工具。
3、元数据
答案:关于数据的数据,用于构造、维持、管理、和使用数据仓库,在数据仓库中尤为重要。
3)数据挖掘是数据库中知识发现、知识抽取、数据发掘、数据探索、数据模式处理、数据获取、信息获取的软件。其目的是帮助决策者寻找数据间潜在的关联,发现被忽略的要素,而这些信息对预测趋势和决策行为是十分有用的。
数据仓库和数据挖掘之间有什么关系:数据仓库实现数据的存储,并消除很多的数据冗余以及与系统管理有关的问题,从而允许使用数据挖掘的人将工作集中于分析方面。
2、数据挖掘研究内容是什么?
参考答案:
主要研究内容包括基础理论、发现算法、数据仓库、可视化技术、定性定量互换模型、知识表示方法、发现知识的维护和再利用、半结构化和非结构化数据中的知识发现以及网上数据挖掘等。
3、数据挖掘提取出的知识主要由哪些类型?
参考答案:
数据挖掘所发现的知识最常见的有以下四类:广义知识(Generalization),关联知识(Association),分类知识(Classification&Clustering),预测型知识(Prediction),偏差型知识(Deviation)。
二、判断分析题(40题)
1、数据仓库是随时间变化的,它捕捉到的新数据会覆盖原来的快照。
答案:×
数据仓库不断更新数据,但保留了历史数据,不会将其覆盖。
2、基本数据的元数据包括与数据源、数据仓库、数据集市和应用程序等结构相关的信息。
答案:√
3、数据粒度的具体划分将直接影响数据仓库中的数据量以及查询质量。
18、KPI
答案:
关键性能指标。可以定义简单的图示方法,一分析组织中重要的商务智能。KPI必须能让决策制洞察组织运行的一些主要方面。KPI通常认为是数字仪表板概念的一部分。
19、事实表
答案:事实表是进行分析的实体表,里面包含维表关键字与度量值。
20、聚合
答案:聚合是通过给定的维度汇总出来的一个值,或者是组合一系列维度所创建的单一值。
16、直接数据挖掘
答案:直接数据挖掘指的是,挖掘目标可利用可用的数据建立一个模型,这个模型对剩余的数据,对一个特定的变量(可以理解成数据库中表的属性,即列)进行描述,可以根据数据项的值精确确定某种结果。
17、间接数据挖掘
答案:间接数据挖掘指的是目标中没有选出某一具体的变量,用模型进行描述;而是在所有的变量中建立起某种关系,对数据中存在的规则做一种描述,或者根据数据的相似性把数据分组。
14、MOLAP
答案:MOLAP方案是以多维方式来组织数据,以多维方式来存储数据;在多维数据模型的表达方面,多维矩阵比关系表更清晰且占用的存储更少。
15、数据挖掘
答案:数据挖掘(Data Mining),又称数据库中的知识发现(Knowledge Discovery in Database,KDD),是指从大型数据库或数据仓库中抽取出潜在的、有价值的知识(模型或规则)的过程
答案:√
29、用于商业智能的数据可以分为三个类别:度量、维度、层次结构。
答案:×
用于商业智能的数据可以分为四个类别:度量、维度、属性和层次结构。
30、UMD的优点包括:在事务数据上建立OLAP系统,较少的延迟,方便创建和维护,使用源代码控制设计版本。
答案:√
31、MDX中的标识符(成员名称、维度名称、层次级别等)包含空格或其他特殊字符,或者以数字开头时,必须以圆括号括起来。
答案:√
21、OLAP的服务引擎都应满足分析模型及应用在功能、规模和技术特征上的要求。但其对OLAP服务器的管理能力没有特别的要求。