(发展战略)数据库新技术及其发展方向数据库新技术及其发展趋势数据库技术是计算机科学的重要分支,主要研究如何安全高效地管理大量、持久、共享的数据。
数据库的研究始于20世纪60年代中期,它的发展有着三大标志性事件。
第壹件大事,1969年IBMXX公司研制开发了基于层次模型的数据库管理系统的商品化软件InformationManagementSystem,即IMS系统,是首例成功的数据库管理系统软件。
第二件大事,美国数据系统语言协会CODASYL(ConferenceOnDataSystemLanguage)下属的数据库任务组DBTG(DataBaseTaskGroup)对数据库方法进行系统的研究和讨论后,于20世纪60年代末到70年代初提出了若干方案。
DBTG方案确定且建立了数据库系统的许多概念、方法和技术。
DBTG所提议的方法是基于网状结构的,它是数据库网状模型的基础和典型代表。
第三件大事,1970年IBMXX公司SanJose研究实验室的研究员E.F.Codd 博士发表了题为“大型共享数据库数据的关系模型”的论文,提出数据库的关系模型,从而开创了数据库关系方法和关系数据理论的研究领域,为关系数据库技术奠定了理论基础,E.F.Codd因此于1981年获得ACM图录奖。
20世纪80年代几乎所有新开发的系统均是关系系统。
随着计算机系统硬件、Internet和Web技术的发展,数据库系统所管理的数据格式、数据处理方法以及应用环境不断变化,同时人工智能、多媒体技术和其他学科技术的发展,数据库技术面临着前所未有的挑战。
当前数据库技术发展的现状,关系数据库技术仍然是主流国内数据库的发展趋势也是飞速的,于数据库技术的当前及未来发展里程中,数据仓库以及基于此技术的商业智能无疑将是大势所趋。
IBM的实验室于这方面进行了10多年的研究,且将研究成果发展成为商用产品。
除了用于OLAP(联机分析处理)的后台服务器DB20LAPServer外,IBM仍提供了壹系列关联的产品,包括前端工具,形成壹整套解决方案。
其它数据库厂商于数据仓库领域也毫不示弱方法各有不同。
Informix也是类似,于其动态服务器IDS(InformixDynamicServer)中提供壹系列关联选件,如高级决策支持选件AdvancedDecisionSupportOption,OLAP选件扩展且行选件ExtendedParallelOption等,且认为这种体系结构严谨,管理方便,索引机制完善,且行处理的效率更高,其中数据仓库和数据库查询的SQL语句的壹致使用户开发更加简便;而微软则是于其SQIServer7.0中集成了代号为Plato柏拉图)的OLAP服务器,和上述XX公司不同的是,Sybase提供了专门的0LAP服务器SybaselQ,且将和数据仓库关联工具打包成WarehouseStudio。
从中国的数据库市场来见,大部分数据库系统的建立是用来进行传统的OLTP业务。
也有壹些企业建立了数据仓库系统,但真正发挥效用的却不多见。
和TCP/IP,SMTP,Java 等相比,尚不存于可靠的、完善的、被广泛接受的数据仓库标准,影响了数据仓库项目的实施。
关系数据库技术出当下20世纪70年代,经过80年代的发展到90年代已经比较成熟,于90年代初期曾壹度受到面向对象数据库的巨大挑战,可是市场最后仍是选择了关系数据库。
无论是《ORACLEXX公司的Oracle9i、IBMXX公司的DB2,仍是微软的SQLServer等均是关系型数据库。
GartnerDataquest的方案显示关系数据库管理系统(RDBMS)的市场份额最大,2000年RDBMS的市场份额占整个数据库市场的80%,这个比例比1999年增长了15%。
这组数据充分说明RDBMS仍然是当今最为流行的数据库软件。
下壹代数据库技术的发展主流—面向对象的数据序技术和关系数据序技术针对关系数据库技术现有的局限性,理论界当下主要有三种观点:(1)面向对象的数据库技术将成为下壹代数据库技术发展的主流。
(2)将面向对象的数据库技术引入关系数据库中。
即面向对象的关系数据库技术。
(3)演绎面向对象数据库技术。
目前来说,非结构化数据库也是数据库发展新趋势的壹个新的方向,非结构化数据库是部分研究者针对关系数据库模型过于简单,不便表达复杂的嵌套需要以及支持数据类型有限等局限,从数据模型人手而提出的全面基于因特网应用的新型数据库理论。
他们认为这种数据库的最大区别就于于它突破了关系数据库结构定义不易改变和数据定长的限制,支持重复字段、子字段以及变长字段且实现了对变长数据和重复字段进行处理和数据项的变长存储管理,于处理连续信息(包括全文信息)和非结构信息(重复数据和变长数据)中有着传统关系型数据库所无法比拟的优势。
但研究者认为此种数据库技术且不会完全取代当下流行的系数据库,而是它们的有益的补充。
和多学科技术的有机结合有学者指出:数据库和学科技术的结合将会建立壹系列新数据库,如分布式数据库、且行数据库、知识库、多媒体数据库等、这将是数据库技术重要的发展方向。
其中,许多研究者均对多媒体数据库作为研究的重点,且认为多媒体技术和可视化技术引人多媒体数据库将是未来数据库技术发展的热点和难点。
未来数据库技术及市场发展的俩大方向—数据仓库和电子商务,部分学者于对各个数据库厂商的发展方向和应用需求的不断扩展的现状进行分析的基础上,提出数据库技术及市场于向数据仓库和电子商务俩个方向不断发展的观点。
他们指出:从去年开始,许多行业如电信、金融、税务等逐步认识到数据仓库技术对于企业宏观发展所带来的巨大经济效益,纷纷建立起数据仓库系统。
于我国提供大型数据仓库解决方案的厂商主要有。
Oracle,IBM,Sybase,CA以及Informix等厂商,巳经建设成功且已收回投资的项目主要有招商银行系统和国信证券系统等。
目前,国内外学者对数据仓库的研究正于继续深人。
和此同时,壹些学者将数据库技术及市场发展的视角瞄准电子商务领域,他们认为:当下的信息系统逐渐要求按照以客户为中心的方式建立应用框架,因此势必要求数据库应用更加广泛地接触客户,而Internet给了我们壹个非常便捷的连接途径,通过Internet我们能够实现所谓的。
One-OneMarketing和。
One-Onebusiness,进而实现ebusines。
因此,电子商务将成为未来数据库技术发展的另壹方向。
许多研究者从实践的角度对数据库技术进行研究,提出了适合应用领域的数据库技术,如工程数据库、统计数据库、科学数据库、空间数据库、地理数据库等。
这类数据库于原理上也没有多大的变化,可是它们却和壹定的应用相结合,从而加强了系统对有关应用的支摔能力,尤其表当下数据模型、语言、查询方面。
部分研究者认为,随着研究工作的继续深人和数据库技术于实践工作中的应用,数据库技术将会更多朝着专门应用领域发展。
随着计算机网络技术及Internet应用的日趋普及,势必要求数据库系统的应用平台向Web平台迁移,最终达到全球数据信息共享的目的,如何实现数据库平台和Web平台的无缝对接即对Web数据库技术的研究已成为近期研究的热点.国内外学者对数据仓库技术以及和之关联的数据挖掘和知识发现进行了大量的研究和论述。
从数据库中发现知识(KDD)(即知识发现)的核心技术就是数据挖掘(DM)。
数据挖掘是目前发展极为迅速的壹个研究领域,它综合了机器学习、统计分析和数据库技术,是为数据库中数据的决策型使用服务的。
如何扩充数据库系统的功能,使之包括数据挖掘能力,是当前数据库界的壹个热点,具体说来,就是研究简单的查询原语和新壹代查询优化技术。
实际上,数据仓库技术所要研究和解决的问题就是从OLAP系统、异构分散的外部数据源、脱机的历史业务数据中获取数据,处理后为数据分析和管理决策提供应用服务。
部分研究者认为要推动数据仓库技术的发展就需要将数据挖掘和数据仓库协同起来工作。
他们认为:壹方面,数据仓库技术能够迎合和简化数据挖掘过程中的重要步骤,提高数据挖掘的效率和能力,确保数据挖掘中数据来源的广泛性和完整性。
另壹方面,数据挖掘技术已经成为数据仓库应用中极为重要和相对独立的方面和工具。
目前,国内对数据仓库、数据挖掘等数据库技术的研究正于紧锣密鼓地进行,该技术的发展无疑将会推动新壹轮的数据库技术的发展。
计算机科学主要目标是使计算机和人的界面尽量靠近人这边。
因此,要尽量提高计算机的智能水平。
智能化是计算机科学各个分支的研究前沿。
于数据库方面,智能化的工作是将人工智能技术和数据库技术相结合,即演绎数据库知识库研究。
目前的主要困难于于递归查询处理无法取得满意的性能,硬件技术的革命(大内存、且行机、高速存取的外存储器)将是提高知识库查询效率的重要因素。
多媒体数据处理的困难很多,即使是壹般的复杂对象目前也仍不能很好地处理。
多媒体数据的建模、存储和多媒体数据库的查询及查询处理等均是需要我们研究解决的内容。
信息分布方面主要是分布式数据库系统的研究。
分布式数据库从20世纪70年代开始研究,可是壹直没有出现商品化的分布式数据库系统,这说明了它的难度。
当前比较好的具有数据分布特征的数据库管理系统是Client/Server体系结构的系统(如:SYBASE,ORACLE7等)。
但新的计算机应用又对它提出了新的要求,智能化、新型事务模型、多媒体数据的处理、高速信息通讯、数据源的高度透明性等将是新型的分布式数据库系统的重要研究内容。
到目前为止,数据库设计和应用程序设计是分离的,且且于具体的应用系统开发中,往往由2个小组各行其事。
其后果是壹方面的优良设计不得不放弃,导致系统性能低下或用户要求无法满足。
面向对象技术是二者结合的有效手段。
可是,良好地结合仍需要很长时间的努力。
处理的数据越来越庞大、计算机网络越来越复杂、系统的智能水平越来越高是计算机系统发展的总趋势。
因此,未来的信息管理系统的特征将是处理复杂对象、分布、智能。
于复杂对象处理方面,面向对象数据库、多媒体数据库将会由于广泛的应用背景和强大系统实验而迅速发展。
于数据分布方面,客户/服务器数据库系统将快速发展,且于应用上取得良好效果。
于智能化方面,数据库和人工智能将于各自的领域不断发展、不断取得新的成果。
二者结合方面的研究将不断地利用二者的成果研制出新型的系统。
任何时候俩方面的结合均是必要的。
从对有关数据库技术发展文献的调研和综述能够见出:目前,国内外大部分研究者对数据库技术集中于以下几方面当前数据库技术发展的主流问题;未来数据库技术的发展主流问题;数据库技术和学科技术结合发展的问题;数据库技术于专业应用领域中的发展向题;数据库技术发展的新趋势问题;数据仓库技术和数据挖掘技术。
我们从信息集成、数据流管理、传感器数据库技术、半结构化数据和XML数据管理、网格数据管理、DBMS自适应管理、移动数据管理、微小型数据库、数据库用户界面等方面分别讨论目前数据库领域研究方向的发展现状、面临的问题和未来趋势。