★课前索引【本章提要】本章主要讲解了网络信息资源这种重要而又独特的信息资源的管理。
在介绍网络信息资源类型和特点的基础上,从多个层次对网络信息资源的组织进行了探讨,并着重对网络信息资源的检索进行了详细论述。
介绍了网络信息检索的过程、网络信息检索的工具,并对搜索引擎这一众所周知的最常用网络检索工具进行了多角度探讨。
在此基础上,本章从检索技术的角度,对网络检索技术做了较大篇幅的讨论,并结合常用的搜索引擎进行了案例分析。
本章最后对网络信息资源的评价进行了研究。
【学习目标】1、网络信息资源的类型及特点;2、网络信息资源组织的方法;3、网络信息检索的过程;4、网络信息检索的工具;5、搜索引擎的基本概念、类型及其作用;6、网络信息资源的评价。
【学习指南】本章的重点是第1节、第3节、第4节。
【预习思考题】1、网络信息资源主要有哪些类型?2、和传统信息资源相比,网络信息资源具有什么特点?3、目前网络信息资源的组织主要有哪些方法?4、请简述网络信息检索的过程。
具体的网络信息检索技术主要有哪些?5、网络信息检索的工具有哪些?6、搜索引擎主要有哪些类型?各类搜索引擎各有什么特点?7、网络信息资源评价主要从哪几个方面进行考虑?◇第一节网络信息资源概述本节内容一、网络信息资源类型二、网络信息资源的特点一、网络信息资源的类型★网络信息资源的分类有多种标准,根据不同的分类标准,可以将网络信息资源分为不同的类型。
第一,网络信息资源从内容范围上可以分为五个大类:学术信息,教育信息,政府信息,文化信息,有害和违法信息等。
第二,按信息源提供信息的加工深度分,可分为一次信息源、二次信息源、三次信息源等。
第三,依据信息源的信息内容则可将网络信息资源分为以下类型:一是联机数据库,即各类数据库是联机存储电子信息源的主体。
二是联机馆藏目录。
三是电子图书。
四是电子期刊。
五是电子报纸。
六是软件与娱乐游戏类。
七是教育培训类。
八是动态性信息。
第四,如果认为网络中的信息存取方式所要达到的功能是在简单地模拟和再生人类信息传播方式的话,那么参照非网络环境中信息存取方式的方法对网络信息资源进行归类,主要有六种网络信息资源的类型。
一是邮件型,以电子邮件和电子邮件群体服务(mailinglist)为代表的。
二是电话型,代表性的手段有会话(talk)和交互网中继对话(IRC Internet Relay Chat)。
三是揭示板型,比较具有代表性的是网络新闻和匿名FTP。
四是广播型,可以在网络上向特定的多数的利用者即时提供图像和声音的信息的传播方式。
五是图书馆型。
六是书目型,主要用于检索网络信息资源的各种检索工具,如查人物机构团体的finger和Whois,查FTP文件的提供者的Archie和WAIS,以及在WWW上的Yahoo,Infoseek 等。
这样的分类方法尽管考虑到了网络信息资源的特点,但是比较粗糙,有的地方也不尽合理。
第五,如果从科学的正式交流渠道与非正式交流渠道的思想出发,网络信息资源可以分为稳定的信息资源和不稳定的信息资源两类。
稳定性的信息资源的特点是:一是从信息来源上讲,由一定的机构运营,相对来说,信息资源的提供比较稳定;二是从信息内容来讲,经过一定的加工和处理,相对来说,信息的精度和准确度是可以信赖的;三是从信息存取的方式来讲,有比较稳定的存取途径和手续,可以重复进行操作。
二、网络信息资源的特点第一、以网络为传播媒体。
第二,以多媒体为内容特征。
第三,以超文本形式组织信息。
第四,传播方式的多样性、交互性。
第五,变化更新快。
◇第二节网络信息资源的组织本节内容一、网络信息资源组织的概念与组织的必要性二、网络信息资源类型三、网络信息资源的特点一、网络信息资源组织的概念与组织的必要性★网络信息资源的组织是指对网上的各种概念、数据(包括声音、图像、软件等)、事实、文献等,通过分析、标引(分类的和语词的)、著录(信息特征的描述)、链接(把相关的信息加以联系)、排序、存储等手段,形成一个有序的、便于用户理解和查询的信息系统的过程。
★组织网络信息资源的必要性:主要表现在以下三个方面:一是在Intemet上存在着大量可获得的有价值、可利用的信息。
二是为了检索的便易,这些资源需要组织。
人们希望能够方便快捷地检索到他们所需要的网络信息资源,这时,组织这些资源就十分必要了。
三是为了方便人们对网络信息资源进行管理与控制。
利用一定的数据格式将这些资源组织起来不仅是获得它们的最有效的方式,也是管理与控制它们的有效方式。
从宏观角度来看,网络信息资源的组织通常是由Internet、局域网上的各种网站来实现的,而网站信息资源的组织则是通过各个网页来完成的。
和传统的印刷型文献相比,一个网站就相当于一本书籍,而构成网站的各个网页则相当于构成书籍的各个页面。
网页承载着具体的信息内容,并通过相互之间的各种链接关系达到对网络信息资源的组织,因此,网页链接结构的组织就显得相当重要。
二、网页的组织★网页的链接结构主要是指各网页间的链接形式,反映的是网页彼此间的关联状况,网站中各网页的链接形式决定了用户在访问该网站时的浏览次序和效率。
在实际的网页制作中,网页结构的设计直接影响到网页的版面布局。
★网页的链接结构通常可以分为两种基本形式:树状结构(层级结构)和网状结构(平级结构)。
●树状结构类似于目录结构,网页按内部逻辑分为不同层次,一个上级网页指向一个或多个下级网页,层层进入,层层退出。
这种结构的优点是条理清晰,用户可以很容易地知道自己所处的位置,但是这种层次分明的结构使得用户浏览时,必须按部就班、逐步进行,因而浏览效率较低。
●网状结构是一种很少具有或者根本不具有总体结构的文档结构,网页之间也无所谓等级,只要有相互关系的任何两个网页都可以建立超链接。
网状结构有利于用户对所需信息的快速定位,从而提高浏览速度,但是由于这种结构的无序性,容易使用户迷路,而且随着网站信息量的增加,会使得网站的维护工作日益困难。
★在实际的设计中,通常采用树状结构和网状结构混合使用的方式来组织网页之间的链接。
三、文件的组织★文件的目录结构则是网页在服务器上的存放状况;文件的目录结构影响的则是管理者对网站的日常维护。
文件目录结构合理与否,将直接影响到文件的增加、删除、修改、更新、上传等。
文件的组织通常有以下方法:一是将文件分级存放,这样在寻找某一特定文件时可以减少搜索时间;二是按文件所属的栏目进行存放,如可以将一级网页存放在一级子目录下,二级网页存放在二级子目录下,依此类推。
网页的链接结构和目录结构不存在一一对应的关系,但如果按照链接结构所划分的栏目内容设立相应的目录,存放相应的文件,将会给维护管理工作带来极大的便利。
★目前Internet上最为通用的组织方法有以下几种。
1.主题树方式主题树方式(subject Tree)是一种可供检索和查询的等级式主题目录。
以超文本链接的方式将不同学科、专业、行业和区域的信息按照分类或主题目录的方式组织起来,也有人把它称为“基于目录的搜索引擎”,如Yahoo!,Medweb等。
目前主题树系统与关键词检索系统相结合,是大型网络搜索引擎普遍采用的一种形式,以弥补各自的不足。
2.文件组织方式以文件方式组织网络信息资源简单方便,但随着网络信息资源利用的不断普及和信息量的不断增多,以文件为单位共享和传输信息会使网络负载越来越大;而且当信息结构较为复杂时,文件系统难以实现有效的控制和管理。
因此,文件方式只能是组织网络信息资源的辅助形式。
3.数据库组织方式就是将所有获得的信息资源按照固定的记录格式存储组织,用户通过关键词及其组配查询就可以找到所需要的信息线索,再通过信息线索连接到相应的网络信息资源。
数据库技术是对大量的规范化数据进行管理的技术,它可以大大提高信息管理的效率。
因为数据库的最小存取单位是字段,所以可根据用户需求灵活地改变查询结果集的大小,从而大大降低网络数据传输的负载。
数据库方式是当前普遍使用的网络信息资源的组织方式之一。
4.网络信息指引库所谓指引库是指所建立的数据库,从物理上讲并不存储各种实际的信息资源,它存放的是有关主题的数据库或服务器的地址等信息,可指引用户到特定的地址获取所需的信息。
专业指引库类似于网上专业搜索引擎,它将因特网上与某主题相关的站点进行集中,按照方便用户检索的原则,用用户熟悉的方法组织起来,向用户提供这些资源的分布情况,指导用户查找。
如图书馆的网页,它们以字母顺序、时间顺序、地理区域、主题或混合方式排列资源。
5.超媒体组织方式就是将超文本与多媒体技术结合起来。
它将文字、表格、声音、图像、视频等多媒体信息以超文本方式组织起来,使人们可以通过高度链接的网络结构在各种信息库中自由航行,找到所需要的信息。
超媒体的组织方式通过节点和链来实现其对信息的组织。
节点是某一信息的片段,它存储的是信息本身以及被链接对象的地址。
链用来连接节点,以描述信息之间的关系,链的一般结构可以分为三个部分:链源、链宿和链的属性。
(1)链源。
一个链的起点称为链源。
(2)链宿。
链宿是链的目的所在。
(3)链的属性。
链的属性决定链的类型,这是链的主要特征。
★现代网络信息资源组织的方式最好是数据库方式和超媒体方式的结合,这也是网络信息资源组织的未来发展趋势。
◇第三节网络信息资源的检索本节内容一、网络信息检索过程二、网络信息检索工具三、搜索引擎四、网络信息检索技术网络信息资源是极其丰富的,网络信息源的浏览与检索必须遵循一定的方法,并借助一定的搜索工具,如搜索目录、搜索引擎等。
一、网络信息检索的过程★与传统的信息检索,如手工检索、联机检索等相比,网络信息检索有其自身的特点,主要表现在:第一,必须借助网络检索工具。
第二,基于超文本结构。
第三,检索方法的多样性。
第四,多媒体检索。
★网络信息检索的过程第一,搜索引擎通过巡视软件自动搜集各种网络信息或者由人工搜集信息;然后由专门的标引软件或专业人员对所搜集到的信息进行分类标引等处理,并把结果存入索引数据库。
这是网络信息检索的前提条件。
第二,搜索引擎通过WWW服务器软件为用户提供浏览器界面下的信息查询。
用户根据需要,按照搜索引擎的检索规则,构造合适的检索表达式,并把检索要求输入检索界面中的检索输入框(通常是Form的形式)。
检索界面为用户与搜索引擎的交互提供了条件。
第三,搜索引擎对用户的检索提问进行适当的处理,如发现语法错误就返回用户进行更改,有的搜索引擎还能对检索提问进行智能化处理,如加入一些同义词等。
然后搜索引擎将提问式与索引数据库进行匹配,并进行必要的逻辑运算。
第四,搜索引擎将符合用户需要的信息以超文本链接的方式返回,并以Web页的形式显示给用户。
用户浏览该Web页,查找感兴趣的相关信息,然后通过搜索引擎提供的链接直接访问相关信息。