第三章 计算机检索基础知识
1. 2. 3. 4.
5.
在实践中,需要根据课题的具体要求,合理 调节查全率和查准率,保证检索效果相对较优。 通常采用以下方法进行调节: 若要提高查全率,进行扩检,可按如下方法 调整检索: 选全同义词并以“OR”方式与原词连接后加入到 检索式中; 降低检索词的专指度,找出一些检索词的上位词 或相关词; 采用分类号进行检索; 删除某个不甚重要的概念组面,减少“AND”运 算; 取消某些过严的限制符,如字段限制符等。
(4)同一事物名词的单复数、不同词性、英美语的不 同形式 单数 复数 名词 动词 computer computers composition composite 英拼 colour fibre 美拼 color fiber (5)隐含概念扩展 隐含概念是显见主题的更确切的表达。 “一个取代高残杀菌剂的理想品种” 隐含了“高效低毒杀菌剂”或“高效低毒农药”
下位词: 下位概念扩展法:概念分析的树形展开法 如:汽车 卡车 轿车 货车等
所有图书馆用户能够在校外使用天津高校文献信息 中心的电子资源,比如超星电子图书、维普期刊全文数据 库、EBSCO电子期刊等。 IP通远程访问系统已开通 IP通用户登录方法: 首先要确保您使用的网络是非教育网。 WEB方式用户请登录 / 客户端软件用户请登录
1. 2. 3. 4. 5.
提高检索词的专指度,找出一些检索词的下位词或 专指性较强的相关词; 增加概念组面,用“AND”连接一些进一步限定主 题概念的相关检索项; 限制检索词出现的可检字段; 利用文献外表特征限制,如:文献类型、出版年代、 语种、作者等; 用逻辑非“NOT”来排除一些无关的检索项。
截词检索
邻近检索 限制检索 加权检索 检索词的确定
检索式的制定
(Boolean searching)
AND:A Aபைடு நூலகம்D B 检出记录中同时含有检索词A和检索词B
OR:A OR B 检出记录中含有检索词A或检索词B的文献
NOT:A NOT B 在含检索词A的记录中, 去掉含检索词B的记录
优先级运算 ()>NOT>AND>OR
第三章 计算机检索基础知识
中国民航大学图书馆
狭义
以计算机为检索手段,从计算机信 息系统中查检所需信息的过程。 广义 计算机检索应该包括信息的存储和 检索两个方面 。
(1)构成 从整体上将,计算机检索系统由硬件、 软件和数据库三部分构成。 硬件设备 :服务器、检索终端、网络通信 设备、辅助设备等 软件设备 :系统软件、应用软件 数据库 :由一系列信息记录组成
上位词: 白炽灯 谷氨酸
上位概念:电灯 上位概念:氨基酸
相关词: (1)同一事物的学名、俗名、商品名 学名 俗名 商品名 NaCl 盐 计算机 电脑 聚二甲基硅氧烷 硅油 乙醇 酒精
(2)同一事物的简称、全称、音译和意译 简称 全称 音译 意译 www world wide web CAD computer aided design internet 因特网 互联网 motor 马达 电动机 laser 镭射 激光器 (3)同一事物名称的反义词 污水处理与水净化 光洁度与粗糙度
(Child or children) and lung cancer
(2)截词检索
用给定的词干做检索词,查找含有该词干的全部 检索词的记录,也称词干检索或字符屏蔽检索。 在不同的检索系统中,对截词符号有不同的表示, 有的使用“?”,有的使用“*”,还有使用“$”、 “!”、“#”等。
从本质上说,截词算符是一种逻辑“或”的关系。
(nW)算符: “n words”的缩写,表示在此运算符两侧的检索词 之间允许插入不多于n个的单词(或汉字),两个 检索词的次序不允许改变。 例:anticorrosion (1W) paint 可检出
anticorrosion paint 和 anticorrosion of paint
例:communication (2W) satellite 可检出
(Polycarbafil OR fiberglass OR glass(W)fib*) AND (oulopholite OR maria(W)glass OR gyp*) AND mechani*
S1 Polycarbafil OR fiberglass OR glass(W)fib* S2 oulopholite OR maria(W)glass OR gyp* S3 mechani* S4 S1 AND S2 S5 S4 AND S3 当检索结果为0时,可发现每步检索策略所得 记录数,以便进一步调整检索策略。
检索式的制定
数据库由大量的纪录组成。每一条纪录 由若干个字段组成。字段有篇名(ti)、作 者(au)、文献来源(so)、文摘(ab)、主题 词(su)、文种(la)、专利号(pn)、分类号 (cl)等。
在用数据库检索时,检索式的制定是一个 关键。应考虑检索词在哪个字段中出现。比如, 查找D. Dutta关于膜技术发表的论文时,则 “D.Dutta ”应在“作者”字段中出现,“膜 (membrane)”应在“主题词”或“文摘”或 “篇名”中出现。然后再确定各个检索词之间 的逻辑关系。如本例中, D. Dutta与膜的关 系为逻辑与。则该例的检索策略为: Membrane/ab,ti,su and Dutta,D/au
②(N)算符:是near 的缩写,表示在此运算符(N)两 侧的检索词彼此相邻,两个检索词之间允许有一 个空格、一个标点符号或一个连接号,两检索词 次序可以颠倒。
例: cross (N) section 检出 cross section 和 section cross
(nN)算符:是从(N)算符引伸出来,表示在此运算 符两侧的检索词之间允许插n个单词(或汉字), 两个检索词的次序可以改变。 例:computer (2N) system 检出 computer system, computer code system, computer aided design system, system using modern computer
是运用位置运算符进行检索的一种方法。 位置运算符是用于指名检索词在记录中的位 置关系的符号,使用位置运算符可用于规定 检索词在检索结果中的相对位置,以提高查 全率和查准率。 不同的数据库使用的位置算符有所不同, 主要是(W)与(nW)、(N)与(nN)。
①(W)算符: “With”的缩写表示在此运算符两侧的检索词 按前后衔接的顺序排列,次序不许颠倒,而且 两词之间不许有其他的词或者字母出现,但允 许有一个空格、一个标点符号或一个连接号。 例: CD(W)ROM 检出 CD ROM 或 CD-ROM 例:solar ( ) energy 检出 solar energy 例:communication (W) satellite 检出 communication satellite
①后截词检索:也叫前方一致检索、后截断检索。 即把截词符号置于截词的右方,表示其右边截 去有限或无限个词,数据中只要有与截词符前 边部分一致的文献,即为命中文献。 例如:comput?
例如:comput???
例如:防火纤维 防火(fireproof或fireproofing) 纤维(fiber或fibers或fibre或fibres)
练习:玻璃纤维增强石膏制品的力学性能研究 主要概念: 概念组面1:玻璃纤维 polycarbafil, fiberglass, glass-fiber, glass-fibre 概念组面2:石膏 oulopholite, maria glass, gyp, gypsum 概念组面3:力学 mechanism, mechanical
举例:
课题名称一:集散控制在监控系统中的应用
检索式:集散控制*监控系统*应用/题目、关键词、文摘 或 集散控制*监控系统/题目,关键词,文摘
课题名称二:信息编码与压缩技术
检索式:信息编码 and 压缩技术/ 题目,关键词,文摘
课题名称三: 查找作者是蒋立辉关于激光的文献 检索式: 蒋立辉/作者 and 激光/ 题目
4.检索策略及构造 检索时所用到的词称为检索词。选择检 索词时应注意以下问题:
1、选择能代表本课题技术特征的、具有实 质意义的词。这些词应为专业通用词、惯用 词和术语。
2、注意同义词(包括缩写)、词的英美式 不同拼写及不同词性的词。这些词之间的关 系均为“或”。如上部分所举的例子。
3、限定检索条件,如年份、语种、文献类 型等。 4、限定检索字段,如著者 、文摘、篇名、 主题词、机构名称、分类号、刊名等。
②前截词检索:也叫后方一致检索,前截断检索。 前截词与后截词相反,即把借词符号置于需截词的 左方,表示其左边截去有限或无限个词,数据库中 只要有与截词符后面部分一致的文献,即为命中文 献。 例如:?physics ③中截词检索:又称“内嵌字符检索”、中截断。 即把截词符号置于检索词的中间,检索到的是词首 和词尾部分与检索词一致的文献。中截词检索一般 只允许有限截断。。 例如: analy?er
(2)类型 ①按系统存储的信息内容划分 1. 文献检索系统 2. 事实型检索系统 3. 数值型检索系统 4. 图像检索系统 5. 多媒体检索系统
(2)类型 ②按照检索系统的工作方式划分 1. 脱机检索系统 2. 联机检索系统 3. 光盘检索系统 4. 网络检索系统
布尔逻辑检索
communication satellite, communication though satellite, communication on the satellite
例:检索“材料磨损”(WEAR OF MATERIALS)方 面的文献 检索式表达为: WEAR (1W) MATERIALS
③希望查找两个或两个以上带有专业术语或者名词 性质、词序位置固定词组的场合可以使用(W)、双 引号“ ”、{ } 等。 例如:glass(W)fiber 表示glassfiber “William, B”(人名) “optical telecommunication”(术语) “Institute of Theoretical Physics”(机构名) {shanghai university}表示上海大学