当前位置:文档之家› 数据库新技术及其发展趋势

数据库新技术及其发展趋势

数据库新技术及其发展趋势公司内部编号:(GOOD-TMMT-MMUT-UUPTY-UUYY-DTTI-数据库新技术及其发展趋势数据库技术是计算机科学的重要分支,主要研究如何安全高效地管理大量、持久、共享的数据。

数据库的研究始于20世纪60年代中期,它的发展有着三大标志性事件。

第一件大事, 1969年IBM公司研制开发了基于层次模型的数据库管理系统的商品化软件InformationManagement System,即IMS系统,是首例成功的数据库管理系统软件。

第二件大事,美国数据系统语言协会CODASYL (Conference On DataSystem Language)下属的数据库任务组DBTG(Data Base TaskGroup)对数据库方法进行系统的研究和讨论后,于20世纪60年代末到70年代初提出了若干报告。

DBTG报告确定并建立了数据库系统的许多概念、方法和技术。

DBTG所提议的方法是基于网状结构的,它是数据库网状模型的基础和典型代表。

第三件大事, 1970年IBM公司San Jose研究实验室的研究员E. F. Codd博士发表了题为“大型共享数据库数据的关系模型”的论文,提出数据库的关系模型,从而开创了数据库关系方法和关系数据理论的研究领域,为关系数据库技术奠定了理论基础, E. F. Codd因此在1981年获得ACM图录奖。

20世纪80年代几乎所有新开发的系统都是关系系统。

随着计算机系统硬件、Internet和Web技术的发展,数据库系统所管理的数据格式、数据处理方法以及应用环境不断变化,同时人工智能、多媒体技术和其他学科技术的发展,数据库技术面临着前所未有的挑战。

当前数据库技术发展的现状,关系数据库技术仍然是主流国内数据库的发展趋势也是飞速的,在数据库技术的当前及未来发展里程中, 数据仓库以及基于此技术的商业智能无疑将是大势所趋。

IBM的实验室在这方面进行了10 多年的研究, 并将研究成果发展成为商用产品。

除了用于OLAP(联机分析处理) 的后台服务器DB20LAP Server 外, IBM还提供了一系列相关的产品, 包括前端工具, 形成一整套解决方案。

其它数据库厂商在数据仓库领域也毫不示弱方法各有不同。

Informix 也是类似, 在其动态服务器IDS(Informix Dynamic Server)中提供一系列相关选件,如高级决策支持选件AdvancedDecision Support Option,OLAP 选件扩展并行选件Extended Parallel Option等, 并认为这种体系结构严谨, 管理方便, 索引机制完善, 并行处理的效率更高, 其中数据仓库和数据库查询的SQL 语句的一致使用户开发更加简便;而微软则是在其中集成了代号为Plato 柏拉图)的OLAP 服务器, 与上述公司不同的是, Sybase提供了专门的0LAP 服务器SybaselQ,并将与数据仓库相关工具打包成Warehouse Studio。

从中国的数据库市场来看, 大部分数据库系统的建立是用来进行传统的OLTP 业务。

也有一些企业建立了数据仓库系统, 但真正发挥效用的却不多见。

和TCP/IP,SMTP,Java 等相比, 尚不存在可靠的、完善的、被广泛接受的数据仓库标准, 影响了数据仓库项目的实施。

关系数据库技术出现在20 世纪70 年代, 经过80 年代的发展到90 年代已经比较成熟, 在90 年代初期曾一度受到面向对象数据库的巨大挑战, 但是市场最后还是选择了关系数据库。

无论是《ORACLE 公司的Oracle 9i、IBM 公司的DB2, 还是微软的SQLServer 等都是关系型数据库。

Gartner Dataquest 的报告显示关系数据库管理系统(RDBMS)的市场份额最大, 2000 年RDBMS 的市场份额占整个数据库市场的80%, 这个比例比1999 年增长了15%。

这组数据充分说明RDBMS 仍然是当今最为流行的数据库软件。

下一代数据库技术的发展主流—面向对象的数据序技术与关系数据序技术针对关系数据库技术现有的局限性, 理论界现在主要有三种观点:(1) 面向对象的数据库技术将成为下一代数据库技术发展的主流。

(2) 将面向对象的数据库技术引入关系数据库中。

即面向对象的关系数据库技术。

(3)演绎面向对象数据库技术。

目前来说,非结构化数据库也是数据库发展新趋势的一个新的方向,非结构化数据库是部分研究者针对关系数据库模型过于简单, 不便表达复杂的嵌套需要以及支持数据类型有限等局限, 从数据模型人手而提出的全面基于因特网应用的新型数据库理论。

他们认为这种数据库的最大区别就在于它突破了关系数据库结构定义不易改变和数据定长的限制, 支持重复字段、子字段以及变长字段并实现了对变长数据和重复字段进行处理和数据项的变长存储管理, 在处理连续信息(包括全文信息)和非结构信息(重复数据和变长数据)中有着传统关系型数据库所无法比拟的优势。

但研究者认为此种数据库技术并不会完全取代现在流行的系数据库, 而是它们的有益的补充。

与多学科技术的有机结合有学者指出:数据库与学科技术的结合将会建立一系列新数据库, 如分布式数据库、并行数据库、知识库、多媒体数据库等、这将是数据库技术重要的发展方向。

其中, 许多研究者都对多媒体数据库作为研究的重点, 并认为多媒体技术和可视化技术引人多媒体数据库将是未来数据库技术发展的热点和难点。

未来数据库技术及市场发展的两大方向—数据仓库和电子商务,部分学者在对各个数据库厂商的发展方向和应用需求的不断扩展的现状进行分析的基础上,提出数据库技术及市场在向数据仓库和电子商务两个方向不断发展的观点。

他们指出:从去年开始, 许多行业如电信、金融、税务等逐步认识到数据仓库技术对于企业宏观发展所带来的巨大经济效益, 纷纷建立起数据仓库系统。

在我国提供大型数据仓库解决方案的厂商主要有。

Oracle, IBM, Sybase, CA 以及Informix 等厂商,巳经建设成功并已收回投资的项目主要有招商银行系统和国信证券系统等。

目前, 国内外学者对数据仓库的研究正在继续深人。

与此同时, 一些学者将数据库技术及市场发展的视角瞄准电子商务领域, 他们认为:现在的信息系统逐渐要求按照以客户为中心的方式建立应用框架, 因此势必要求数据库应用更加广泛地接触客户, 而Internet 给了我们一个非常便捷的连接途径, 通过Internet 我们可以实现所谓的。

One-One Marketing 和。

One- One business, 进而实现ebusines。

因此, 电子商务将成为未来数据库技术发展的另一方向。

许多研究者从实践的角度对数据库技术进行研究, 提出了适合应用领域的数据库技术, 如工程数据库、统计数据库、科学数据库、空间数据库、地理数据库等。

这类数据库在原理上也没有多大的变化, 但是它们却与一定的应用相结合, 从而加强了系统对有关应用的支摔能力, 尤其表现在数据模型、语言、查询方面。

部分研究者认为, 随着研究工作的继续深人和数据库技术在实践工作中的应用, 数据库技术将会更多朝着专门应用领域发展。

随着计算机网络技术及Internet 应用的日趋普及, 势必要求数据库系统的应用平台向Web 平台迁移, 最终达到全球数据信息共享的目的, 如何实现数据库平台与Web 平台的无缝对接即对Web 数据库技术的研究已成为近期研究的热点.国内外学者对数据仓库技术以及与之相关的数据挖掘和知识发现进行了大量的研究和论述。

从数据库中发现知识(KDD)(即知识发现)的核心技术就是数据挖掘(DM)。

数据挖掘是目前发展极为迅速的一个研究领域, 它综合了机器学习、统计分析和数据库技术, 是为数据库中数据的决策型使用服务的。

如何扩充数据库系统的功能, 使之包括数据挖掘能力, 是当前数据库界的一个热点,具体说来, 就是研究简单的查询原语和新一代查询优化技术。

实际上, 数据仓库技术所要研究和解决的问题就是从OLAP 系统、异构分散的外部数据源、脱机的历史业务数据中获取数据, 处理后为数据分析和管理决策提供应用服务。

部分研究者认为要推动数据仓库技术的发展就需要将数据挖掘和数据仓库协同起来工作。

他们认为:一方面, 数据仓库技术可以迎合和简化数据挖掘过程中的重要步骤, 提高数据挖掘的效率和能力, 确保数据挖掘中数据来源的广泛性和完整性。

另一方面, 数据挖掘技术已经成为数据仓库应用中极为重要和相对独立的方面和工具。

目前, 国内对数据仓库、数据挖掘等数据库技术的研究正在紧锣密鼓地进行, 该技术的发展无疑将会推动新一轮的数据库技术的发展。

计算机科学主要目标是使计算机与人的界面尽量靠近人这边。

因此, 要尽量提高计算机的智能水平。

智能化是计算机科学各个分支的研究前沿。

在数据库方面, 智能化的工作是将人工智能技术与数据库技术相结合, 即演绎数据库知识库研究。

目前的主要困难在于递归查询处理无法取得满意的性能, 硬件技术的革命(大内存、并行机、高速存取的外存储器)将是提高知识库查询效率的重要因素。

多媒体数据处理的困难很多, 即使是一般的复杂对象目前也还不能很好地处理。

多媒体数据的建模、存储和多媒体数据库的查询及查询处理等都是需要我们研究解决的内容。

信息分布方面主要是分布式数据库系统的研究。

分布式数据库从20 世纪70 年代开始研究, 但是一直没有出现商品化的分布式数据库系统, 这说明了它的难度。

当前比较好的具有数据分布特征的数据库管理系统是Client/Server 体系结构的系统(如:SYBASE,ORACLE7等)。

但新的计算机应用又对它提出了新的要求, 智能化、新型事务模型、多媒体数据的处理、高速信息通讯、数据源的高度透明性等将是新型的分布式数据库系统的重要研究内容。

到目前为止, 数据库设计与应用程序设计是分离的, 并且在具体的应用系统开发中, 往往由2 个小组各行其事。

其后果是一方面的优良设计不得不放弃,导致系统性能低下或用户要求无法满足。

面向对象技术是二者结合的有效手段。

但是, 良好地结合还需要很长时间的努力。

处理的数据越来越庞大、计算机网络越来越复杂、系统的智能水平越来越高是计算机系统发展的总趋势。

因此, 未来的信息管理系统的特征将是处理复杂对象、分布、智能。

在复杂对象处理方面, 面向对象数据库、多媒体数据库将会由于广泛的应用背景和强大系统实验而迅速发展。

在数据分布方面, 客户/服务器数据库系统将快速发展, 并在应用上取得良好效果。

在智能化方面, 数据库和人工智能将在各自的领域不断发展、不断取得新的成果。

二者结合方面的研究将不断地利用二者的成果研制出新型的系统。

任何时候两方面的结合都是必要的。

相关主题