当前位置:文档之家› 大数据库技术现状及其发展趋势

大数据库技术现状及其发展趋势

院系:生命科技学院班级:农学122班目录一、引言 (2)二、数据库技术的基本概述 (2)三、数据库技术发展历史 (3)1.第一代数据库系统 (3)2.第二代数据库系统 (3)3.第三代数据库系统 (4)四、当今主流数据库技术发展状况 (4)1.信息集成 (4)2.传感器数据库技术 (5)3.网格数据管理 (6)4.移动数据管理 (6)5.微小型数据库技术 (7)6. 数据加密技术 (7)1)数据加密方法 (8)2)基于公钥的加密算法 (8)五、数据库技术在今后的发展趋势 (9)1.性能与易用性仍是数据库完善的必经之路 (9)2.搜索是数据库的未来之路 (9)3.开源数据库有望走向应用主流 (10)4.未来数据库发展主要趋势 (10)四、结束语 (11)数据库技术现状及其发展趋势内容摘要:由于数据库技术在特殊领域的应用和其他相关学科技术的发展,促使数据库技术不断创新、发展。

本文阐述了一些新的数据库技术及新一代数据库技术的发展方向。

关键词:数据库信息集成网格数据管理移动数据库数据加密技术发展趋势一、引言[1]数据库技术是计算机科学的重要分支,主要研究如何安全高效地管理大量、持久、共享的数据。

数据库的研究始于20世纪60年代中期,从诞生到现在,在不到半个世纪的时间里,形成了坚实的理论基础、成熟的商业产品和广泛的应用领域,目前数据库成为一个研究者众多且被广泛关注的研究领域。

随着信息管理内容的不断扩展和新技术的层出不穷,数据库技术面临着前所未有的挑战。

面对新的数据形式,人们提出了丰富多样的数据模型(层次模型、网状模型、关系模型、面向对象模型、半结构化模型等),同时也提出了众多新的数据库技术(XML 数据管理、数据流管理、Web 数据集成、数据挖掘等)。

在Web 大背景下的各种数据管理问题成为人们关注的热点。

本文讨论目前数据库研究领域中最热门的几个研究方向的发展现状、面临的问题和未来趋势。

二、数据库技术的基本概述数据库技术是信息系统的一个核心技术。

是一种计算机辅助管理数据的方法,它研究如何组织和存储数据,如何高效地获取和处理数据。

是通过研究数据库的结构、存储、设计、管理以及应用的基本理论和实现方法,并利用这些理论来实现对数据库中的数据进行处理、分析和理解的技术。

即:数据库技术是研究、管理和应用数据库的一门软件科学。

数据库技术是现代信息科学与技术的重要组成部分,是计算机数据处理与信息管理系统的核心。

数据库技术研究和解决了计算机信息处理过程中大量数据有效地组织和存储的问题,在数据库系统中减少数据存储冗余、实现数据共享、保障数据安全以及高效地检索数据和处理数据。

数据库技术研究和管理的对象是数据,所以数据库技术所涉及的具体内容主要包括:通过对数据的统一组织和管理,按照指定的结构建立相应的数据库和数据仓库;利用数据库管理系统和数据挖掘系统设计出能够实现对数据库中的数据进行添加、修改、删除、处理、分析、理解、报表和打印等多种功能的数据管理和数据挖掘应用系统;并利用应用管理系统最终实现对数据的处理、分析和理解。

数据库技术涉及到许多基本概念,主要包括:信息,数据,数据处理,数据库,数据库管理系统以及数据库系统等。

数据库技术是现代信息科学与技术的重要组成部分,是计算机数据处理与信息管理系统的核心。

数据库技术研究和解决了计算机信息处理过程中大量数据有效地组织和存储的问题,在数据库系统中减少数据存储冗余、实现数据共享、保障数据安全以及高效地检索数据和处理数据。

数据库技术的根本目标是要解决数据的共享问题。

三、数据库技术发展历史数据模型是数据库技术的核心和基础,因此,对数据库系统发展阶段的划分应该以数据模型的发展演变作为主要依据和标志。

按照数据模型的发展演变过程,数据库技术从开始到现在短短的30年中,主要经历了三个发展阶段:第一代是网状和层次数据库系统,第二代是关系数据库系统,第三代是以面向对象数据模型为主要特征的数据库系统。

数据库技术与网络通信技术、人工技能技术面向对象程序设计技术、并行计算技术等相互渗透、有机结合,成为当代数据库技术发展的重要特征。

1.第一代数据库系统第一代数据库系统是20世纪70年代研制的层次和网状数据库系统。

层次数据库系统的典型代表是1969年IBM公司研制出的层次模型的数据库管理技术IMS。

20世纪60年代末70年代初,美国数据库系统语言协会CODASYL(Conference on Data System Language)下属的数据库任务组DBTG(Data Base Task Group)提出了若干报告,被称为DBTG报告。

DBTG 报告确定并建立了网状数据库系统的许多概念、方法和技术,是网状数据库的典型代表。

在DBTG思想和方法的指引下数据库系统的实现技术不断成熟,开发了许多商品化的数据库系统,它们都是基于层次模型和网状模型的。

可以说,层次数据库是数据库系统的先驱,而网状数据库则是数据库概念、方法、技术的奠基者。

2.第二代数据库系统第二代数据库系统是关系数据库系统。

1970年IBM公司的San Jose研究试验室的研究员Edgar F. Codd发表了题为《大型共享数据库数据的关系模型》的论文,提出了关系数据模型,开创了关系数据库方法和关系数据库理论,为关系数据库技术奠定了理论基础。

Edgar F. Codd于1981年被授予ACM图灵奖,以表彰他在关系数据库研究方面的杰出贡献。

20世纪70年代是关系数据库理论研究和原型开发的时代,其中以IBM 公司的San Jose研究试验室开发的System R和Berkeley大学研制的Ingres 为典型代表。

大量的理论成果和实践经验终于使关系数据库从实验室走向了社会,因此,人们把20世纪70年代称为数据库时代。

20世纪80年代几乎所有新开发的系统均是关系型的,其中涌现出了许多性能优良的商品化关系数据库管理系统,如DB2、Ingres、Oracle、Informix、Sybase等。

这些商用数据库系统的应用使数据库技术日益广泛地应用到企业管理、情报检索、辅助决策等方面,成为实现和优化信息系统的基本技术。

3.第三代数据库系统从20世纪80年代以来,数据库技术在商业上的巨大成功刺激了其他领域对数据库技术需求的迅速增长。

这些新的领域为数据库应用开辟了新的天地,并在应用中提出了一些新的数据管理的需求,推动了数据库技术的研究与发展。

1990年高级DBMS功能委员会发表了《第三代数据库系统宣言》,提出了第三代数据库管理系统应具有的三个基本特征:应支持数据管理、对象管理和知识管理。

必须保持或继承第二代数据库系统的技术。

必须对其他系统开放。

四、当今主流数据库技术发展状况[3]1.信息集成随着Internet 的飞速发展,网络迅速成为一种重要的信息传播和交换的手段,尤其是在Web 上,有着极其丰富的数据来源。

信息集成系统的方法可以分为:数据仓库方法和Wrapper/Mediator 方法。

在数据仓库方法中,各数据源的数据按照需要的全局模式从各数据源抽取并转换,存储在数据仓库中。

用户的查询就是对数据仓库中的数据进行查询。

对于数据源数目不是很多的单个企业来说,该方法十分有效。

另一种方法是Wrapper/Mediator 方法。

该方法并不将各数据源的数据集中存放,而是通过Wrapper/Mediator 结构满足上层集成应用的需求。

这种方法的核心是中介模式(mediatedschema)。

信息集成系统通过中介模式将各数据源的数据集成起来,而数据仍存储在局部数据源中,通过各数据源的包装器(wrapper)对数据进行转换使之符合中介模式。

用户的查询基于中介模式,不必知道每个数据源的特点,中介器(mediator)将基于中介模式的查询转换为基于各局部数据源的模式查询,它的查询执行引擎再通过各数据源的包装器将结果抽取出来,最后由中介器将结果集成并返回给用户。

Wrapper/Mediator 方法解决了数据的更新问题,从而弥补了数据仓库方法的不足。

不过,这种框架结构正受到来自3 个方面的挑战。

第1个挑战是如何支持异构数据源之间的互操作性(interoperability)。

另一个挑战是如何模型化源数据内容和用户查询。

第三个挑战是当数据源的查询能力受限时,如何处理查询和进行优化。

2.传感器数据库技术随着微电子技术的发展,传感器的应用越来越广泛。

根据传感器在一定的范围内发回的数据,在一定的范围内收集有用的信息,并且将其发回到指挥中心。

当有多个传感器在一定的范围内工作时,就组成了传感器网络。

传感器网络由携带者所捆绑的传感器及接收和处理传感器发回数据的服务器所组成。

传感器网络中的通信方式可以是无线通信,也可以是有线通信。

在传感器网络中,传感器数据就是由传感器中的信号处理函数产生的数据。

信号处理函数要对传感器探测到的数据进行度量和分类,并且将分类后的数据标记时间戳,然后发送到服务器,再由服务器对其进行处理。

传感器数据可以通过无线或者光纤网存取。

无线通信网络采用的是多级拓扑结构,最前端的传感器节点收集数据,然后通过多级传感器节点到达与服务器相连接的网关节点,最后通过网关节点,将数据发送到服务器。

传感器节点上数据的存储和处理方法有两种:第 1 种类型的处理方法是将传感器数据存储在一个节点的传感器堆栈中,这样的节点必须具有很强的处理能力和较大的缓冲空间;第 2 种方法适用于一个芯片上的传感器网络,传感器节点的处理能力和缓冲空间是受限制的:在产生数据项的同时就对其进行处理以节省空间,在传感器节点上没有复杂的处理过程,传感器节点上不存储历史数据;对于处理能力介于第1 种和第2 种传感器网络的网络来说,则采用折衷的方案,将传感器数据分层地放在各层的传感器堆栈中进行处理。

传感器网络越来越多地应用于对很多新应用的监测和监控。

新的传感器数据库系统需要考虑大量的传感器设备的存在,以及它们的移动和分散性。

因此,新的传感器数据库系统需要解决一些新的问题。

主要包括:传感器数据的表示和传感器查询的表示、在传感器节点上处理查询分片、分布查询分片、适应网络条件的改变、传感器数据库系统等。

3.网格数据管理网格是把整个网络整合成一个虚拟的巨大的超级计算环境,实现计算资源、存储资源、数据资源、信息资源、知识资源和专家资源的全面共享。

目的是解决多机构虚拟组织中的资源共享和协同工作问题。

按照应用层次的不同可以把网格分为3 种:计算网格,提供高性能计算机系统的共享存取;数据网格,提供数据库和文件系统的共享存取;信息服务网格则支持应用软件和信息资源的共享存取。

高性能计算的应用需求使计算能力不可能在单一计算机上获得,因此,必须通过构建“网络虚拟超级计算机”或“元计算机”获得超强的计算能力,这种计算方式称为网格计算。

相关主题