数据仓库-期末考试复习题复思考题(重点)
一、单项选择题
1)一般信息管理中,采用哪种方式的概念模型最多
A。
ce模型B.实体-关系模型C.02O模型D.B/S模型(2)在关系表中,下列哪种属性不能承担主列关键字(Key)?A.身份证号B.银行卡号C.加密电文D.企业标识码(3)数据仓库的生命周期中,不包含下列哪个阶段?
A.规划分析阶段
B.设计实施阶段
C.使用维护阶段
D.反馈提升阶段(4)多维切片是指:
A.在多个维度上观察全员操作
B.多个成员的操作片段
C.旋转数据集的部分维度
D.在线分析或联机分析(5)一般信息管理中,采用哪种方式的分布式物理模型最多A。
ce模型 B.实体-关系模型C.02O模型D.B/S模型(6)在关系表中,下列哪种属性可以成为外键(Key)?
A.客户信用程度
B.银行卡行号
C.加密的身份证号
D.实体商户地址(7)数据仓库的生命周期中,不包含下列哪个阶段排在第三阶段?A.规划分析阶段 B.设计实施阶段 C.使用维护阶段D.反馈提升阶段(8)多维报表是指:
A.在多个维度上观察全员操作
B.分歧维度花式分歧叠加展示
C.旋转数据集的部分维度
D.在线阐发或联机阐发(9)数据表的多维索引的感化是:
A.使数据表更节省存储空间
B.加快数据存储速率
C.表格花式美观大方C.加快数据查找效率
10)de布局中的MAP职能是?
A.钻取
B.汇聚
C.分发
D.结晶
11)下列哪种客户需求能够直接成为数据堆栈的多维报表?
A.客户销售业绩清单
B.客户根本名册
C.客户关系图表
D.客户反馈信息(12)数据堆栈开辟强调哪种主体特征?
A.信息安全性
B.业务流程
C.操作事务性
D.数据实时性(13)数据仓库与数据库系统相比,更加提倡:
A.空间换时间
B.数据范式更严格
C.冗余度更小C.更加适用于分布式结构(14)透视表属于OLAP中的哪种能力范畴?
A.存储本领
B.展示本领
C.稳定性本领
D.安全性本领
(15)OLAP的系统布局分为:
A.胖客户端系统和瘦客户端系统B。
OLAP服务器和多维数据存储C。
OLAP服务器和传输阐发处置惩罚后结果C.多维数据存储和阐发处置惩罚后结果(16)ce职能是?
A.钻取
B.汇聚
C.分发
D.结晶
17)下列哪种信息不能直接成为数据仓库的元数据?
A.客户姓名的花式
B.客户根本信息
C.客户关系图
D.客户反馈法则(18) noSQL数据库更强调哪种特征?
A.不兼容SQL敕令
B.非关系布局
C.非事件性
D.分布式计算(19)下列哪种关于数据堆栈开辟的概念是错误的?
A.数据仓库开发的初期不能确定客户需求
B.数据仓库开发过程是循环往复的
C.数据仓库开发不以客户需求为中心 C.数据仓库开发是从基础数据出发的(20)客户关系图表属于下列哪种模型的范畴?
A.概念模型
B.物理模型
C.逻辑模型D。
Odoo模型(21)C/S 网络布局中的C表示:
A.瘦客户
B.客户
C.客户端
D.直连线路
22)CRM的含义是:
A.企业级数据仓库
B.客户关系管理
C.客户群
D.决策管理系统(23)企业中对含义不一致的信息进行纠正的操作,叫做:A.数据清洗B.数据冗余C.数据降维D.数据转置(24)数据库高级管理员的职责不包括:
A.输入业务数据
B.设置操作员角色
C.设置业务套账B.系统数据备份(25)数据仓库按照不同的主体进行组织,可形成
A.数据聚类
B.数据分布
C.数据集市
D.数据链路(26)数据聚类中的聚簇中心是:
A.事先制定的
B.搜索的方针
C.静态产生的
D.数据主题(27)数据代码要解决的主要题目是:
A.节约信息存储空间
B.解决名称混乱问题
C.信息格式整齐
D.方便排序(28)数据仓库中,下列哪种说法错误?
A.消灭冗余,才能提高效率
B.稳定性比集成性重要
C.集成性直接提高系统的冗余度
D.稳定性促进高效率(29)数据粒度是指:
A.数据处理的分割单位
B.数据采集的单元
C.数据抽样的单位
D.数据记录的大小
二、名词
1)数据堆栈
2)SQL
3)OLAP
4)noSQL
5)DSS
6)支持度
7)大数据
8)E_R图
9)逻辑模型
10)O2O
11)MIS
12)关键字索引
13)数据颗粒度
14)元数据
15)数据连接
16)数据颗粒度
17)概念模型
18)数据挖掘
19)聚类
20)事件性
21)B2B
22)B2C
23)DBMS
24)ERP
25)数据粒度与数据分割的区别
26)时标法
27)自顶向下法
28)雪花模型
29)数据表主键
三、模型设计
1.某航空公司具有如下概念数据模型,请分析出适用的逻辑模型。
2.数据集约简
基础数据表花式以下:
列名
no
id
name
sn
classid
class
XXX
XXX
XXX
说明
流水号
客户编号
客户姓名
身份证号
地点行业编号
地点行业名称
所购产品编号
所购产品名称
中介机构id
XXX
th
suid
XXX
cj
xq
xqm
中介机构名称
中介机构资质
选购类型代码
选购形式名称
商品价值量
区域编号
区域名
3.数据堆栈逻辑模型设想
基础数据表花式以下:
列名说明
no流水号
id学号
name学生姓名
sn学生身份证号
classid地点班级编号
class所在班级名称
koid课程编号
koname课程名称
XXX讲课教师id
XXX教师名称
th教师职称
suid选修类型代码
XXX选修名称
cj测验成绩
xq学期编号
xqm学期名
请对上述数据表,进行约简设想,写出约简表布局,并做必要说明。
四、书写SQL敕令(4分*4=16分)
根本数据表花式以下:表:customer表:SP 列名
cn
name
sn
addr
ph
说明
客户标号
客户姓名
客户身份证号
客户地址
客户电话
列名
spid
spname
sp
ddr
suid
sps
说明
购买商品ID
商品名称
商品批号
产地
供给商标号
商品价格表:suyr表:wids表Pay列名XXX
XXX
sny
addy
time
XXX
请按如下要求填写一条SQL命令。
1.统计供应商的个数?
2.统计每个供应商的供货品种数?
3.列举无商品批号的商品清单。
4.统计有实际售后服务的客户数量
5.统计出货量最大的供应商名称
6.统计有效客户数量
7.统计出:未发生供货的供货商名单说明
供应商标号
供应商姓名
供应商证号
供给商地址
供货时间
供应商电话
列名
wid
wname
wn
wddr
wuid
说明
售后商标号
售后商名称
售后商证号
售后店址
售后电话
列名
cn
spid
wid
说明
客户标号
购买商品ID
售后商标号8.统计购买次数大于5次的客户数量
9.统计出与售后商联系最多的客户
10.统计出未发生服务的售后商名单
5、数据模型设想
1)
站在一个理想的手机产品集成商的角度看,有大规模的客户,也有大规模的供给商,请设想出阐发客户对供给商的实时支持度的检测模型。
供应商的实时支持度
目标供应商的有效交易客户数
产生生意业务客户总数
请绘制检测中适用的概念模型和逻辑模型,并进行实例分析。
2)
站在一个学生的角度看,有大量的课程,也有大规模的教室,请设计出分析教室对课程的实时支持度的检测模型。
教室的实时支持度(%)
目标教室的授课数量
课程总数
请绘制检测中合用的概念模型和逻辑模型,并进行SQL 实例计算。
六、问答题
1)相比DBMS而言,数据仓库的优点?
2)概念模型与逻辑模型的主要区别?
3)计算机分布式结构的优势因素。