关于数据库新技术
作者:计11-1 冷英松16号
摘要 :
随着计算机应用领域的不断拓展和多媒体技术的发展, 数据库已是计算机科学技术中发展最快、应用最广泛的重要分支之一,数据库技术的研究也取得了重大突破,目前,它已成为计算机信息系统和计算机应用系统的核心技术和重要的基础。
数据库技术产生于20世纪60年代中期,到今天为止仅仅40多年的历史,却已经历经了3代变化,造就了C.W.Bachman、E.F.Codd和James Gray三位图灵奖得主,发展了以数据建模和DBMS核心技术为主,内容丰富的一门学科,带动了一个巨大的软件产业——DBMS产品及其相关工具和解决方案。
这40多年可谓成就辉煌。
关键字: 数据库新技术 XML数据库 DW OLAP
正文:
随着各类信息系统与数据库的建立,在过去若干年的时间里都积累了海量的、不同形式存储的各类数据。
这些数据十分繁杂,仅仅依靠目前数据库的查询检索机制和数据处理方法,已经远远不能满足现实的需要。
数据中隐藏的深层次的丰富资源没有得到充分地发掘和利用。
人们迫切地需求把数据变成知识,把知识变成决策,把决策变成利润(财富)。
使之有效地在管理和决策中发挥作用,是急需解决的问题。
而且,随着信息化的不断深入发展,信息资源开发利用,已成为当前信息化的核心任务之一。
然而,随着用户应用需求的提高、硬件技术的发展和Internet/Intranet提供的丰富多彩的多媒体交流方式,促进了XML数据库、数据仓库技术、联机分机处理技术和数据挖掘技术相互渗透,互相结合,成为当前数据库技术发展的主要特征,形成了数据库新技术。
1、XML数据可库
随着Web应用的发展,越来越多的应用都在将数据表示成XML的形式,XML已成为网上数据交换的标准。
所以当前数据库管理系统都扩展了对XML 的处理,存储XML数据,支持XML和关系数据中间的相互转换。
XML数据库是一个能够在应用中管理XML数据和文档的集合的数据库系统。
XML数据库是XML文档及其部件的集合,并通过一个具有能力管理和控制这个文档集合本身及其所表示信息的系统来维护。
XML数据库不仅是结构化数据和半结构化数据的存储库,像管理其它数据一样,持久的XML数据管理包括数据的独立性、集成性、访问权限、视图、完备性、冗余性、一致性以及数据恢复等。
这些文档是持久的并且是可以操作的。
与传统数据库相比,XML数据库能够对半结构化数据进行有效的存取和管理。
如网页内容就是一种半结构化数据,而传统的关系数据库对于类似网页内容这类半结构化数据无法进行有效的管理。
提供对标签和路径的操作。
传统数据库语言允许对数据元素的值进行操作,不能对元素名称操作,半结构化数据库提供
了对标签名称的操作,还包括了对路径的操作。
当数据本身具有层次特征时,由于XML数据格式能够清晰表达数据的层次特征,因此XML数据库便于对层次化的数据进行操作。
XML数据库适合管理复杂数据结构的数据集,如果己经以XML格式存储信息,则XML数据库利于文档存储和检索;可以用方便实用的方式检索文档,并能够提供高质量的全文搜索引擎。
另外XML数据库能够存储和查询异种的文档结构,提供对异种信息存取的支持。
2、数据仓库技术(DW)
数据仓库(Data Warehouse,DW)是信息领域中近年来迅速发展起来的数库新技术,基于信息技术业务发展的需要,基于数据库系统技术发展而来,并逐步独立的一系列新的应用技术。
数据仓库最根本的特点是物理地存放数据,而且这些数据并不是最新的、专有的,而是来源于其它数据库的。
数据仓库的建立并不是要取代数据库,它要建立在一个较全面和完善的信息应用的基础上,用于支持高层决策分析,而事务处理数据库在企业的信息环境中承担的是日常操作性的任务。
数据仓库是数据库技术的一种新的应用,而且到目前为止,数据仓库还是用关系数据库管理系统来管理其中的数据。
数据仓库的建立,能充分利用已有的数据资源,把数据转换为信息,从中挖掘出知识,提炼成智慧,最终创造出效益。
所以,越来越多的企业开始认识到数据仓库应用所带来的好处。
数据仓库是支持管理决策过程、面向主题、集成的、稳定的时变的数据集合。
它将大量用于事务处理的传统数据库进行数据的清理、抽取和转换,并按决策主题的需要进行重新组织。
数据仓库的逻辑结构可分为近期基本数据层、历史数据层和综合数据层,其中综合数据是为决策服务的。
数据仓库中数据的物理存储形式,有多维数据库组织形式和基于关系数据库组织形式两种。
前者的数据组织以空间超立方体形式存在,后者由关系型事实表和维表组成。
这种高度集中的数据为各种不同决策需求提供了有用的分析基础和有效的支持平台。
3、联机分析处理技术(OLAP)
联机分析处理技术(On-Line Analytical Processing OLAP)是以海量数据为基础的复杂分析技术。
它通过对信息的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。
决策数据是多维数据,多维数据就是决策的主要内容。
OLAP专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便他们准确掌握企业(公司)的经营状况,了解对象的需求,制定正确的方案。
联机分析处理具有灵活的分析功能、直观的数据操作和分析结果可视化表示等突出优点,从而使用户对基于大量复杂数据的分析变得轻松而高效,以利于迅速做出正确判断。
它可用于证实人们提出的复杂的假设,其结果是以图形或者表格的形式来表示的对信息的总结。
它并不将异常信息标记出来,是一种知识证实的方法。
OLAP支持各级管理决策人员从不同的角度、快速灵活地对数据仓库中的数据进行复杂查询和多维分析处理,辅助各级领导进行正确决策,提高企业的竞争力。
4、数据挖掘技术
面对日益激烈的市场竞争,客户对迅速应答各种业务问题的能力的要求不提高,不仅要求回答发生什么,为何发生,还要回答将发生什么。
数据挖掘技术正是支持回答“将发生了、什么”这类业务问题。
数据挖掘是从大量数据中发现并提取隐藏内在的、人们事先不知道的但又可能有用的信息和知识的一种新技术。
数据挖掘的目的是帮助决策者寻找数据间潜在的关联,发现经营者被忽略的要素,而这些要素对预测趋势、决策行为也许是十分有用的信息。
数据挖掘技术涉及数据库技术、人工智能技术、机器学习、统计分析等多种技术,它使决策支持系统(DSS)跨入了一个新阶段。
总结:
数据库系统已经发展成为一个大家族,数据库技术的核心技术是数据管理。
随着新应用领域不断涌现,数据对象趋于多样化,数据库工作者也应该不断扩宽数据库的研究领域,在众多新领域中勇敢地承担起其中的数据管理研究开发任务。
数据库工作者应该具有这样的意识,哪里有数据,哪里有数据管理的任务,哪里就有数据库研究和开发的课题。
面对新的挑战,我们要继承数据库技术和其他技术相结合的优良传统,努力探索新的途径、新的方法、新的技术,来提高和改善对数据和信息的使用。
参考文献:
王珊萨师煊数据库系统概论高等教育出版社。