当前位置:文档之家› 我对数据库和数据挖掘的理解

我对数据库和数据挖掘的理解

我对数据仓库和数据挖掘的理解
柏拉图说过“需要是发明之母”。

数据仓库和数据挖掘是数据技术的进一步延伸。

近年来,这两项技术引起了信息产业界和整个社会的极大关注,其主要原因是存在可以广泛使用的大量数据,并且迫切需要将这些数据转换成有用的信息和知识。

人类社会所产生的海量数据没有什么价值,但是,这些数据中蕴藏的信息是珍宝。

这些知识和信息可以广泛用各种应用,包括市场分析、欺诈检测、顾客保有、产品控制和科学探索等等。

在过去的30年中,计算机硬件技术稳步的、令人吃惊的进步导致了功能强大的和价格可以承受的计算机、数据收集设备和存储介质的大量供应。

这些技术大大推动了数据库和信息产业的发展,使得大量数据库和信息存储库用于事务管理、信息检索和数据分析。

最近出现的一种数据储存库的系统结构是数据仓库,这是一种多个异构数据源在单个站点以统一模式组织的储存库,以支持管理决策。

数据仓库技术包括数据清理、数据集成和联机分析处理。

尽管olap工具支持多维分析和决策,但对于深层次的分析,如数据分类、聚类和数据随时间变化的特征,仍然需要其他数据分析工具。

这种需要导致了数据挖掘技术的诞生。

简单地说,数据挖掘是指从大量数据中提取或“挖掘”知识,许多人把他视为数据中的知识发现过程。

从数据仓库的观点看,数据挖掘可以看成联机分析处理的高级阶段。

他和数据仓库的区别我们可以从下面这个图中得到启发:
简单点讲,数据挖掘就是在数据仓库的基础上进行知识发现的过程。

相关主题