当前位置:文档之家› 关系数据库毕业论文

关系数据库毕业论文

摘要随着Internet的发展和人们对数据标准性、平台无关性的要求越来越高,XML(Extensible Markup Language)得到了广泛的应用,同时人们对于XML的存储方式提出了更高的要求。

本课题意在设计一种将XML数据存入关系数据库中的方法,并按照该方法开发一个XML 数据装入关系数据库的软件。

本文首先对XML的基本知识进行介绍,随后讨论用关系数据库存储XML数据的原因,并对目前已经提出的一些XML文档在关系数据库中的存储方式进行研究讨论,在此基础上提出一个无模式的XML文档对于关系数据库的存储方法。

这个方法将XML数据分为文档、元素、属性、文本四种节点,并将这四种节点映射为数据库中四个关系表。

另外将DOM树中的元素节点关系映射为一个数据库关系表,这五个表是本课题中数据库设计的核心。

五个表中包含的属性信息要求方便于DOM接口和SAX接口两种方式访问。

提出存储方法后,我们将利用这种存储方法开发一个关系数据库中XML数据装入系统。

文章后半部分将详细说明该软件的需求分析、设计、具体开发细节以及测试。

该软件的测试结果验证了这种存储方法能够有效的将无模式的XML文档存入关系数据库。

关键词:关系数据库、XMLAbstractWith the development of Internet and the people’s higher and higher requirement for data’s standardization and its independent of platform,XML(extensible markup language) is widely used,in the mean time the higher requirement for the storage of XML data is asked.This research group designed a method to store XML data into RDB(Relational Data Base) of which the technology have been very mature and widely used.Then we developed an application that can store the XML data into RDB using this method.At first this article will introduce basical knowledge of XML,and then discuss why store XML data using RDB.After that we’ll research and discuss the some methods for storing XML data into RDB that have been put forward.Based on them we’ll design a storage method from non-schema XML data to RDB.We classified XML data as four kind of nodes such as Document,Element,Atribute and Text.These four nodes are mapped to four tables in the RDB and we mapped the DOM Tree into a table too.The five tables is the core of the RDB design.The attribute information involved in the tables is required that both DOM and SAX interface can be easy to get information from the tables.After giving the method we designed we’ll develop an application that can storing the XML data into RDB using that method.It’s requirement analyse,design details and test result well be described in the second half part of the article.The test result will show that using the storage method we can storing the non-schema XML data into the RDB effectively.Key words:RDB(Relational Data Base),XML目录摘要 (1)Abstract (2)目录 (3)1 绪论 (5)1.1 课题背景及研究意义 (5)1.2 XML知识简介 (5)1.2.1 XML (5)1.2.2 DTD和Schema (7)1.2.3 DOM (7)1.2.4 SAX (8)1.3 基于关系数据库的XML存储技术 (9)1.3.1现存的基于关系数据库的XML存储技术 (10)1.3.2一个模式驱动映射实例 (10)1.4 作者的工作 (11)1.5 本章小结 (11)2 无模式映射的设计 (12)2.1方案设计要求 (12)2.2设计思想 (12)2.3方案详细设计 (12)2.3.1E-R图(实体集中只画主码) (13)2.3.2 实体集和联系 (13)2.3.3 设计方法与策略 (14)2.3.4 数据库基本表设计 (16)2.3.5数据库优化 (16)2.3.6数据字典 (16)2.4 本章总结 (18)3 关系数据库中XML装入系统 (19)3.1 任务概述 (19)3.2 设计思想概述 (19)3.3 需求规定 (20)3.3.1系统用例图 (20)3.3.2用例事件流 (20)3.3.3 开发环境需求 (21)3.4 系统设计 (21)3.4.1 系统体系结构 (21)3.4.2 序列图设计 (21)3.4.3 类设计 (23)3.4.4 类关系图 (29)3.4.5 算法的实现策略 (30)3.4.6 异常处理 (31)3.5 系统测试 (32)3.5.1 系统功能测试 (32)3.5.2 测试总结 (37)3.5.3 与模式映射XML-RDB装入系统的分析对比 (38)3.6 本章小节 (38)结论 (39)致谢 (40)参考文献 (41)1 绪论1.1 课题背景及研究意义XML(eXtensible Markup Language)是W3C于1998年提出的数据文件格式标准,它是SGML(Standard Generalize MarkupLanguage)的受限子集,但更简练易用。

自被提出以来就由于其标准性、可扩展性和半结构化等特征得到了各方面的关注和使用。

随着Internet 的高速发展和人们对数据标准性、平台无关性的要求的提高,其应用也更加广泛。

目前XML文档的存储方式主要有三种:1.作为普通文件存储于文件系统中2.存储于专门为XML设计的XMLDB中3.存储于关系数据库中第一种方法由于文件系统在组织、管理、检索等各种数据服务功能上的固有不足而基本不被使用。

后两种方法各有优缺点,但由于目前关系数据库管理系统在各种应用中仍占主体地位,因此如何更加合理地将XML文档进行转换并存储到关系数据库中具有很大的研究价值。

本课题主要研究如何有效的将XML数据存储到关系数据库中,并设计一种可以尽量避免或简化上述问题的存储方法,用此方法开发一个关系数据库中XML数据装入系统以验证该方法的正确性和可行性。

1.2 XML知识简介这一节主要介绍XML的基本知识,包括XML概念、文档类型定义(DTD)、XML模式(Schema)、文档对象模型(DOM)、SAX(Simple API for XML)接口等等。

1.2.1 XMLXML即为可扩展的标记语言(eXtensible Markup Language)。

XML是一套定义语义标记的规则,这些标记将文档分成许多部件并对这些部件加以标识。

XML是标记语言。

理解XML,首先要理解标记。

先说说HTML的标记(Markup),通俗地讲,它就是一种用来给文本添加标记的语言。

在HTML里每个标志都是有确切含义的。

例如,在HTML 中,标签〈B〉的含义是要求HTML浏览器将一段文本加粗表示,而标签〈CENTER〉的含义是告诉浏览器将这段文本在一行的中间显示。

而XML并非象HTML那样,提供了一组事先已经定义好了的标签,而是提供了一个标准,利用这个标准,你可以根据实际需要定义自己的新的置标语言,并为你的这个置标语言规定它特有的一套标签。

准确的说,XML 是一种源置标语言,它允许你根据它所提供的规则,制定各种各样的置标语言。

XML有两个先驱——SGML和HTML,这两个语言都是非常成功的标记语言,SGML的全称是标准通用化标记语言,它从80年代初开始使用。

正如XML一样,SGML也可用于创建成千上万的标记语言,它为语法置标提供了异常强大的工具,同时具有极好的扩展性,因此在分类和索引数据中非常有用。

目前,SGML多用于科技文献和政府办公文件中。

SGML 非常之复杂,其复杂程度对于网络上的日常应用简直不可思议。

不仅如此,SGML非常昂贵。

HTML免费、简单,而且它获得了广泛的支持。

它是一个非常简单的SGML语言,可以方便普通人的使用。

1996年人们开始致力于描述一个置标语言,它既具有SGML的强大功能和可扩展性,同时又具有HTML的简单性。

W3C于1998年2月批准了XML的1.0版本,一个崭新而大有前途的语言诞生了。

XML具有以下优点:1.XML具有自说明性。

XML能够应用于各种领域的原因,就是XML具有到目前为止其他方法所不具备的数据描述特点,控制信息不是采用应用软件的独有形式,而是采用谁都可以看得懂的标记形式来表现,所以XML最适合作为数据交换的标准,这也是 XML受人关注的原因。

允许各种不同的专业(如音乐、化学、数学等)开发与自己的特定领域有关的标记语言。

这就使得该领域中的人们可以交换笔记、数据和信息,而不用担心接收端的人是否有特定的软件来创建数据。

2.XML具有通用性。

由于XML是非专有的并易于阅读和编写,就使得它成为在不同的应用间交换数据的理想格式.XML使用的是非专有的格式,不受版权、专利、商业秘密或是其他种类的知识产权的限制。

相关主题