1.数据仓库概述
1.数据仓库定义
”面向主题”的数据 在数据仓库中 数据是按主题而不是按照应用程序存储的。 数据是跨应用程序的 在操作型系统中,各行业的数据集合都是单独的应用程序进行组织的
1.数据仓库定义
“集成的”是指DW中的数据不是事物处理系统数 据的简单拼凑,而是经过系统地加工整理,是相互一 致的、具有代表性的全局数据。
1.数据仓库定义
“随时间变化的”指DW中存储的是-一个时间段的 数据,而不仅仅是某一个时间点的数据,所以主要用 于进行时间趋势分析。-般DW的数 据时限为5~10年, 数据量也比较大,一般为10GB左右。
1.数据仓库定义
“ 数据的非易变性(相对稳定) “ :指数据一旦进入 DW后一般情况下将被长期保留,极少有更新或删除 操作。
交通大数据处理与分析——
数据仓库概述
数据仓库概述
知识目标:
1.掌握数据仓库的定义 2.掌握数据仓库的特点 3.掌握数据仓库与数据库的区别 4.掌握数据仓库架构
数据仓库概述
数据仓库定义 数据仓库的特点 数据仓库与数据库的区别 数据仓库架构分层
1.数据仓库定义
数据仓库(Data Warehouse,DW)是支持管理决策过程的、面向主题的、 集成的、随时间变化的、但信息本身是相对稳定的数据集合。 DW的最终目标是把企业范围内的所有数据集成在一个大仓库中,让用户能 运行查询、产生报告、执讲主要讲解了数据仓库定义、数据仓库的特点、数据仓 库与数据库的区别、数据仓库架构分层等内容。
通过本讲的学习,希望大家能够对数据仓库有一个初步的认
识,掌握数据仓库的定义及架构分层。
谢谢观看
数据仓库概述
2.数据仓库的特点
面向主题 集成的 随时间变化 数据仓库的数据是不可更新的
3 .数据仓库与数据库的区别
出发点不同: 数据库是面向事务的设计;数据仓库是面向主题设计的。
存储的数据不同: 数据库一般存储在线交 易数据;数据仓库存储的一般是历史数据。
容量不同、设计规则不同: 数据库设计是尽量避免冗余, -般采用符合范式的规则来设计;数
据仓库在设计是有意引入冗余,采用反范式的方式来设计。
3 .数据仓库与数据库的区别
提供的功能不同: 数据库是为捕获数据而设计,数据仓库是为分析数据而设计。
基本元素不同: 数据库的基本元素是事实表,数据仓库的基本元素是维度表。
服务对象不同: 数据库是为了高效的事务处理而设计的, 服务对象为企业业务处
理方面的工作人员;数据仓库是为了分析数据进行决策而设计的,服务 对象为企业高层决策人员。