38电子展望与决策1997年第4期摘要:超文本超媒体是一种新型的信息管理技术。
本文系统地描述了超文本、超媒体系统的概念原理。
综述了超文本、超媒体系统的研究中所涉及到的关键技术及其发展现状。
在此基础上讨论了超文本、超媒体系统的发展方向及有待于解决的问题。
关键词:超文本超媒体超媒体网络计算A b s t r a c t :H yp ertext /H yp ermedia is a new t yp e of information mana g ement tech 2ni q ue.This p a p er makes a s y stematic descri p tion of t he conce p t and p rinci p le of t he h yp ertext /h yp ermedia s y stems ,and makes a summar y of t he research sit uation of t he ke y techni q ues of t he h yp ertext /h yp ermedia.Furt her discussion on t he develo p in g direction and t he existin g p roblems durin g t he h p ertext /h yp ermedia research will be g iven based on t he descri p tion and t he summar y made before.K e y W o r d s :H yp ertext ,H yp ermedia ,Co m p utin g in h yp ermedia net work.超文本超媒体技术及其发展中国科学院网络信息中心杨雅群张建中刘兵一、引言超文本(H yp ertext )这个概念最早是由美国的Ted Nelson 在60年代提出的,超文本是对信息进行表示和管理的一种方法。
超文本系统类似于人的联想记忆结构,采用一种非线性网状结构组织信息。
它在本质上是由结点和链组成语义网络加上浏览机制构成。
这种组织信息的结构早期用于存储、管理文本信息,所以称之为超文本。
但是随着多媒体应用的出现和发展,超文本这种组织管理信息的方式自然被引入到对多媒体信息的管理中。
这种系统就被称为超媒体(H yp ermedia )系统。
在Ted Nelson 提出超文本概念之后的十几年中,超文本属于概念研究阶段。
此时超文本以研究为目的,并未投入市场。
进入八十年代后期,超文本研究迅速发展。
出现了许多商业化、实用化的超文本系统,例如:H yp ercard 、Guide 、Intermedia 等。
1987年~1989年几次超文本国际会议最终确定了超文本领域的形成,标志着超文本进入了成熟期。
九十年代后,随着多媒体技术和计算机网络的进展,超文本技术得到了进一步的发展。
出现了许多超媒体系统,其应用也从集中式的超媒体系统向分布式超媒体系统发展。
尤其是随着Internet 应用的发展,出现了全球最大的分布式超媒体系统———WWW 系统(全球范围信息系统)。
这样超媒体系统的应用得以空前的普及和发展。
本文首先介绍超文本超媒体系统模型的研究概况及存在的问题。
之后对超文本、超媒体系统中所涉及到的关键技术及研究现状进行探讨。
最后对超文本超媒体系统的发展方向及有待于进一步研究和解决的问题进行了讨论。
二、超文本超媒体系统模型Cambell 和G oodman 提出了一个比较标准的超文本、超媒体信息系统结构模型,但由于国际标准尚未形成,所以实际上现有超文本超媒体系统大都没有完全遵循这个模型。
目前正在从事超文本标准化研究的Dexter 小组也提出了一种Dexter 参考模型。
与上述模型比较,Dexter 模型除术语不同并且更加明确了层次之间的接口之外,两个模型基本相似。
下图给出了两个模型的层次图。
在Cambell 和G oodman 模型中,划分三个层次:数据库层、超文本抽象机层和表现层。
数据库层处理所有信息存储中的传统问题,保证信息的存储对高层是透明的。
例如,信息的正确存取、并发访问、版本维护、响应速度、对结点和链建立索引等。
抽象机层决定了结点和链的基本特征,记录了结点和链的关系,并保存了结点的结构信息。
表现层处理抽象机层中信息的表现,是人机交互的窗口。
电子展望与决策1997年第4期39Cambell 和G oo dman 模型Dext er 模型Dexter 模型中包括了三层模型:内部组件层、存储层和运行层,分别与前述模型相对应。
模型中组件是存储层提供的基本对象,它由内容表现规范和锚接口集合组成。
存储层是用于标准化的主要层次,它描述了组件和链的网络。
内部组件层描述了超文本组件的内容。
运行层是支持超文本交互作用的机制。
Dexter 模型还引入了两个接口。
存储层是通过锚定点机制中的锚接口点来引用内部组件。
而运行层则是通过各组件的表现规范来进行表现的。
超文本模型是对现实世界的简化,并不能恰当表示信息的结构。
表现在结点和其内容被不恰当地分开;一个结点是一个信息集合,没有任何结构化的信息。
因此在多数应用中不能按要求捕捉它的语义,导致用户难于观察应用的概念模型,造成额外的认识负担。
因此许多人提出了对模型的改进方法。
例如,Gra y 提出对象数据模型,在该模型中,信息被一组预先定义的“域”对象集合所描述,而实际超文本内容应该被一组信息对象的集合所表示,每个信息对象是域对象的一个实例,缺省继承所有域对象的属性。
Hull 和Kin g 提出了语义数据模型。
语义模型企图能对指定的数据库模式提供更强大的抽象和结构化机制,以便能克服传统数据库系统的有限的模型能力。
D.L uarella 和A.Zanzi 提出了一种高语义表达能力的基于图形的面向对象的超媒体模型,并且使用它作为概念模型和对象直接操作的统一框架。
三、超媒体系统中的关键技术1.超媒体系统的浏览和导航机制浏览是沿链在超媒体信息空间中航行,是超媒体信息访问的基本方法。
浏览访问在一些诸如小的、熟悉的超媒体系统中及面向显示的表现任务中是非常合适的。
但在多灵敏应用中仅有浏览机制是不够的,尤其在大信息空间中浏览会造成信息空间迷路或找不到所需要的信息。
导航是在信息空间中指导航行以避免迷路的机制。
导航机制有如下几种实现方法:(1)导游方法(Guided Tours ):它是最简单的航行方法,去掉了用户的航行需求,一个“导游”可认为是连接一串结点的“超链”。
只要用户停留在一“导游”线路上,他们就可以发出“下一结点”的命令去看更相关的信息。
(2)回溯方法(Back Track ):是最重要的航行设施,它保证无论用户走到哪里,都能回到熟悉的区域。
(3)历史列表(Historial List ):是指记录所有前面访问过的结点,用户可以直接返回到前面任意一结点。
(4)书签(boo kmark ):在某些结点上定义书签,以便于返回。
利用它还可提供特殊用途,例如附加信息以防止迷路。
(5)概况图(Overview dia g ram ):它显示了信息空间的信息结构及它们之间的相互关系,指明“我在哪里”及如何到达目的地。
有元导航(meta -navi g ation )、鱼眼(fishe y e )、地界(landmark )及结构化概况图等方法。
2.超文本系统搜索和查询机制基于查询的访问机制是对浏览和导航机制的补充。
它可直接快速得到所要访问的信息。
在超媒体信息系统中,它应作为与导航平行的基本访问机制。
包括内容查询和结构查询。
(1)内容查询:它是用于超媒体信息库的标准信息检索。
它将给定的查询条件与整个信息网络中的信息实体(结点、链、媒体等)进行相似性匹配,以寻找出所要检索的内容。
但是,按内容查询忽略了超媒体网络的结构,与浏览体系相脱节,自成系统。
按内容查询的方法有:a.全文检索:它是文本信息检索的有效方法,是指以文本信息中的字或词为入口点进行检索。
b.图像、声音等的检索。
c.基于规则的检索机制。
d.简单的统计技术。
(2)结构查询:专门查询超媒体结构中哪些子结构匹配于给定的模式,以确定结点和链通过这种结构而构造出的语义信息。
例如查询被一支持链连接的两个结点的子网,其中目的结点包含“超文本”。
当然,有些复杂的查询条件,涉及到不确定的链序列,例如环型结构。
研究结构化查询机制涉及到两个相互关联的子任务。
要设计一种查询语言,适合于可描述的超文本网络结构。
这种模式语言需要包括标准规范表达算子。
例如:联合操作、串操作、轮流隔离和否定操作等。
要提供超媒体用户可访问的简单接口,使用户易于使用这一查询语言。
一些超文本系统采用图形查询语言,例如I.F.Gruz 和A.O.Mendelzon 设计了一种支持递归的图形查询语言。
在这种查询语言中,搜索引擎是不可能执行前面所讨论的全部模式匹配能力的。
所以,关键问题是定义一限制的模式匹配能力,使之能够易于执行,同时又能满足一般超媒体模式匹配要求的一个重要子集。
运行层表现描述存储层锚定点机制内部组件层表现层抽象机层数据库层3.超媒体网络计算超媒体网络计算是指超媒体网络主动指导、创建和修改超媒体网络所包含的信息。
现有超媒体系统一般是被动存储和检索信息,它们为用户提供定义、存储和操纵超媒体网络的工具。
系统只对网络和它们所包含的信息作一定的处理,例如,计算链类型的集合,然而它们不具有计算能力,例如,它们没有主动获取信息并加入超媒体网络的“推理引擎”。
实现计算引擎的方法有两种:外部引擎和内部计算组件。
外部引擎是指系统与计算引擎是分离的,它是独立的外部实体,通过标准的程序接口创建、访问、修改信息。
内部计算组件是系统的一部分,它能自动处理存储于超媒体网络中的信息。
这种系统更象基于知识的A I系统,具有存储和主动处理信息的能力。
这种系统更灵活、较少约束、也更有效。
4.版本化版本化是超媒体网络的重要特征,允许用户维护和操作它们网络变动的历史;也允许用户为单一网络同时开发几种配置。
在现有超文本系统中有几种版本化机制。
(1)基于时间的线性版本化机制。
每个结点和链都是由一系列随时间而变动的不同版本组成,这样结点或链的不同版本可组成非循环的线性有向图。
如Ne p t une系统就是采用这种版本化机制。
(2)分支化版本机制,是指从某一版本可同时发展多个版本。
这种机制会引起复杂的问题,例如选定哪一个链将直接影响到整个超文本系统。
在设计组合结点时尤为重要。
(3)网状版本。
例如Itermdia系统,在这种结构中,每个结点只有单一版本,但是它有一“信息版本”的概念,即有一将所有文档集合互连起来的集合。