当前位置:文档之家› 第2章 网络学术资源检索的基本原理

第2章 网络学术资源检索的基本原理


18
2.2 信息检索的途径与方法
• 信息检索途径定义:检索途径由提取信息 源的外部与内部特征形成的,又称为检索 点或检索入口。
– 根据文献信息源所具有的物质属性与价值内涵 ,可将信息源特征分为外表特征和内容特征。 – 信息源的外表特征是从文献信息源的载体、符 号系统和记录方式三要素中提取出的特征构成 的,如出版时间、出版地、责任者、文献题名 及声像与电子类型等,它们分别构成相应的检 索途径。
6
• 机械信息检索主要包括两种基本类型:
– 机电信息检索系统这是用诸如打孔机、验孔机 、分类机等机电设备记录二次文献,用电刷作 为检索元件的信息检索系统。 – 光电信息检索系统这是用缩微照相记录二次文 献,以胶卷或胶片边缘部分若干黑白小方块的 不同组合做检索标志,利用光电检索元件查找 文献的系统。
34
– 综合法的好处是能够综合常规法和引文法的优 点。其依据主要有两点:其一,任何检索工具书 ,都有文献收录的范围、主题报道的重点和倾 向等,以引文法作为补充,可以扩大文献线索 ,发现更多有价值的文献信息;其二,文献引用 现象有这样的规律,凡是重要的文献,一般在 五年之内都会被其他文献所引用。 – 循环法是对常规法和引文法的综合利用,检索 效率较高,并可克服检索工具的不齐全的限制 ,进行连续的检索,获得更多、更切题的文献 信息,是实际中使用较多的方法。
35
2.3 检索语言
• 检索语言是根据文献信息检索需要而创造 的一种人工语言,是信息检索系统存贮与 检索所使用的共同语言。它是专门用来描 述文献的内容特征、外表特征和表达信息 提问的一种人工语言。
36
• 1、检索语言的基本要求
– 具有必要的语义和语法规则 – 具有表达概念的单一性 – 具有文献检索标识和提问特征进行比较和识别 的方ห้องสมุดไป่ตู้性 – 另外,检索语言体系应科学合理
16
• 4、网络信息检索阶段
– 以网络为平台的计算机检索被称为网络信息检 索,这种检索方式下,用户可同时使用网上多 个主机,甚至所有主机的某种资源而并不需要 预先知道他们的具体地址。这就极大地拓宽了 检索的空间和信息量。通过网络检索所需信息 ,已成为信息检索的主导力量和发展方向。
17
– 与其他检索方式相比,网络信息检索的特点是 :信息检索范围广,信息量大,信息检索的时 效性强,但是其处理的信息类型复杂,信息载 体形式多样,尤其是通过搜索引擎进行网络信 息检索的结果的检准率较低,信息冗余大。
32
– 引文索引法即利用引文索引,从被引论文开始 查找引用它的全部论文,通过此方法可得到与 来源文献同一主题的一批相关文献。
33
• 3、综合法:又称为循环法,它是把上述两 种方法加以综合运用的方法。综合法既要 利用检索工具进行常规检索,又要利用文 献后所附的参考文献进行追溯引文检索, 分期分段地交替使用这两种方法。
37
• 2、检索语言的类型
– 根据是否规范化,检索语言可以分为规范化语 言和非规范化语言。 – 根据所包括的专业范围,可以分为综合性检索 语言和专业性检索语言。 – 根据描述文献的特征,可以分为描述文献外部 特征的检索语言和描述文献内容特征的检索语 言。 – 按标识组配方式,可分为先组式检索语言和后 组式检索语言。
– (1)脱机批处理检索是指用户与机器脱钩,不直 接参与检索,不介人与机器的对话,由专职人 员把许多用户的检索课题汇总,批处理检索提 问要求,然后将检索结果提供给用户。
10
– (2)优点: 可同时进行多项检索 可处理检索关系相当复杂的检索词汇 适用于长期跟踪某专题的信息检索服务
11
– (3)缺点:
29
• 1、常规法:是指直接利用检索工具检索文 献信息的方法,是文献检索中最常用的一 种方法,又分为以下几种:
– 顺查法:按照时间的顺序、由远及近地利用检 索系统进行文献信息检索的方法。这种方法能 收集到某一课题的系统的文献,适用于较大课 题的文献检索。
30
– 倒查法:由近及远、从新到旧、逆着时间的顺 序利用检索工具进行文献检索的方法。此法的 重点是放在近期文献上。使用这种方法可以最 快地获得最新资料。
22
• 3、号码途径:指通过各种专用符号代码与 专用号码直接或间接(利用代码索引实现)查 找文献的方法。专用号码包括报告号、专 利号、标准号,专用符号代码如元素符号 、分子式、结构式等。
23
• 4、优点:它的排列与检索方法以字顺或数 字为准,比较机械、单纯,不易错检或漏 检。因而适用于查找已知篇名(书名、刊名) 、作者姓名或序号代码的文献,可直接判 断该文献的有或无。
– 抽查法:是指针对项目的特点,选择有关该项 目的文献信息最可能出现或最多出现的时间段 ,利用检索工具进行重点检索的方法。
31
• 2、引文法:利用文献后所附的参考文献、 相关书目查找相关文献的方法就叫引文法 。引文法的使用有两种方式:
– 追溯检索法即从文献信息密度较大的几种期刊 的最近两三年论文中查出一批与检索课题有关 的文献,再以这批文献所附的参考文献作为线 索,找到第二批相关文献,以此类推获得一批 与主题相关的文献,这种方法的出发点是从引 用论文开始查找。
– 根据已知文献源著者直接或间接(利用著者索引 实现)查找文献源的途径。著者索引包括个人著 者索引和机关团体索引两种。
21
– 特点:专业研究人员一般各有所长,尤其是某 些领域的知名学者、专家,他们发表的作品具 有相当的水平或代表该领域发展的方向,通过 作者线索,可以系统地发现和掌握他们研究的 进展,可以查找某一作者的最新论著。
• 从检索原理看,手工检索与自动化检索是基本一致 的,而且自动化检索就是在手工检索的基础上发展 起来的。所以,目前世界上许多著名的检索工具在 出版发行时,印刷型、磁带型和缩微型同时发行, 有些还发行光盘型。前者用于手工检索,后者用于 自动化检索。
5
机械信息检索阶段
• 机械检索最初是从简单的穿孔卡片逐步发 展起来的,穿孔卡片又分手检穿孔卡片与 机检穿孔卡片两种。手检穿孔卡计约出现 于1904年,原意图是用来避免卡片在卡片 盒中误放。机械信息检索系统是手工检索 向现代信息检索的过渡阶段。
26
• 2、主题途径
– 定义:以规范化的词汇来表达文献内容的主题 ,这种词汇叫主题词,主题途径是指用户根据 所确定的主题词或关键词,利用主题词表和主 题索引实施检索的途径。 – 特点:通过主题途径获得的信息专指性强,但 查全率较低,对用户的检索知识要求高。
27
多媒体信息源的检索途径
• 多媒体信息源既包括数字化的文本信息、图 形与图像信息,又包括数字化的视频与音频 信息,这些信息具有与文本信息不同的内容 特征,从而形成的检索途径也不同。
15
– 优点:光盘存储信息容量大、耐用、复制费用低 ;光盘检索系统比联机检索系统在设备支持上和 通信使用费用方面要求低,尤其适于那些信息服 务预算少而且比较偏远地区的单位使用;光盘检 索可以提供文本、图形图像、声音及动画等相结 合的检索界面,它使用菜单检索方式,比传统的 联机检索界面友好。 – 缺点:信息更新只能定期进行,检索时效性差; 检索步骤多,需反复操作,检索费时且开销大。
8
计算机检索阶段
• 计算机信息检索是在计算机技术和通信技 术发展的基础上建立起来的。它产生于20 世纪50年代,整个发展历程大体上经历了 脱机信息检索、联机信息检索、光盘信息 检索、网络信息检索4个阶段。
9
• 1、脱机信息检索阶段:在这一时期使用的 计算机检索系统属于脱机检索系统,其主 要工作方式是脱机批处理。
第2章 网络学术资源检索的基本原理
• • • • • 2.1 信息检索的基本历程 2.2 信息检索的途径与方法 2.3 检索语言 2.4 信息检索技术 2.5 信息检索的一般程序
1
• 信息检索包括信息存储和信息检索两个相 互依存的过程。
• 信息存储过程就是按照检索语言(主题词 或分类表)及其使用原则对原始信息进行 处理,形成信息特征标识,为检索提供经 过整序(形成检索图形)的信息集合的过 程。具体来说,信息的存储包括对信息的 著录、标引以及编排正文和所附索引等。
19
– 信息源的内容特征是由分析构成文献信息源的 信息内容要素的特征与学科属性形成的,主要 形成分类、主题两种途径,主题途径中运用较 广的有主题词途径和关键词途径两种。
– 文献信息源的外部特征与文献是一一对应的关 系,而文献的内容特征与文献源却是多对多的 关系。
20
外部特征的检索途径
• 1、提名途径:用书刊名称或论文篇名编成 的索引进行信息检索的一种途径。一般较 多用于查找图书、期刊、单篇文献。 • 2、责任者途径
24
内容特征的检索途径
• 1、分类途径
– 分类法:按照信息内容的学科属性,运用概念 划分与归纳的方法形成各级类,从而组织信息 形成一种有序化的知识体系,以这种方式组织 信息的方法叫分类法。 – 分类途径:用分类法组织的信息为用户提供从 学科属性查找的途径就是分类途径。
25
– 特点:科学、系统,满足“族性检索”,查全 率高。但查找信息的其他属性和查找知识的横 向联系时,此途径非常不便,分类途径对用户 的要求较高,这些限制了此途径的广泛应用。 – 利用此途径来实现信息的查询有三种情况:一是 用户首先通过查找各种分类法的分类详表或类 目索引获得相关线索(类目或类号)再进一步检 索;二是通过选择数据库提供的输人框的下拉 菜单分类限制;三是通过浏览门户网站和搜索 引擎的分类类目来选择。
13
– 优点:检索速度快、检索范围广、检索途径多、 检索精度高、检索内容新、检索辅助功能完善。
– 缺点:检索费用高;系统检索指令复杂,多由掌 握检索技能、熟悉命令的有经验的人员来操作。
14
• 3、光盘信息检索阶段
– 光盘是一种用激光记录和读取信息的盘片,具 有信息存取密度高、容量大、读取速度快、信 息类型多、保存时间长、成本低等优点,倍受 人们的青睐。 – 光盘信息检索系统的结构比较简单,任何一台 安装了光驱的计算机,只要放上光盘数据库即 可进行光盘检索。
相关主题