信息检索复习
零次文献 是未出版或公开于社会的文 4、______ 献,如手稿、原始数据和等原始录像。一 最初发表 的原始文献,是检索的 次文献是______ 对象。 ______ 二次文献 是对一次文献的简化和整 理,是检索的工具,有书目(目录)/题录 三次文献 是对零次文献和 /索引/文摘。 ______ 一次文献的高度浓缩,如年鉴/手册/词典 /百科全书/教科书等。
7、布拉德福定律:核心文献相关文献和边缘 2 1:n:n 文献期刊数量成______的关系。
文献外表 特征:与文献信息主题内容 8、______ 没有关系或关系不大的信息。 文献内容 特征:与文献信息主题内容密切 ______ 相关的信息称为文献信息的内容特征。
9、检索语言及种类:检索语言主要有以代 分类语言 和以事物名称术 码语言为特征的______ 主题语言 两大类。 语为特征的______
28、国内主要检索刊物
全国新书目 》——中国新闻出版署主管 《________ (月刊) 《中文核心期刊要目总览 ______________》——北京大学图书 馆 08年出第五版。 全国报刊索引 》——国内报纸、期刊综合性 《________ 检索刊物。 CSCI 《中国科学引文数据库》 (_______ ) CSSCI ) 《中文社会科学引文索引》(______
() 19、优先算符:加____ W(n) 前后顺序不变、 20、位置算符:____ N(n) ____ 前后顺序可变。位置算符不可与 优先算符相邻使用。
(F) 算符:两侧的检索词必须在 21、____ (S) 同一字段中出现。 ____ 算符:检索 的两词必须在同一子字段中出现。
22、检索结果调整方法: 查全率 :1,减少AND,增加OR; 提高_____ 2,在词干相同的单词后使用截词符 (?);3,去除已有的字段限制、位置 算符限制。 查准率 :1,减少同义词或同族相 提高_____ 关词;2,增加限制概念,用AND将她们 连接起来;3,使用字段限制。
27、根据GB 3469—83规定,以英文大 写字母方式标识以下各种参考文献类型:
M 论文集[__], C N 期 专著[__], 报纸文章[__], J D 报告[__], 刊文章[__], 学位论文[__], R 标 准[__], 专利[__] S P
对于专著、论文集中的析出文献,其文献 类型标识建议采用单字母“A __”;对于其 Z 它未说明的文章类型,建议采用单字母 “__”。
年 作者 论文标题
Kavranoglu D.Characterization of the solution to the optimal Hmodel reduction problem[J].Syst Control Lett, 1993, 20(2): 99-107. 年
出版社 卷 期 期刊 页码范围
30、电工电子主要检索刊物 电子文摘报》四川成都 《_______ 电工文摘 》北京电工综合技术经济研究所期刊。 《_______ 英国《科学文摘》(Science Abstrɑcts)的《电 EEA ) 工与电子文摘》(_____ 电工与动力文摘 苏联的《_____________ 》 科学技术文献快报,电気工学编 》 日本的《___________________ 英国德温特出版公司《____________ 世界专利索引公报 》(WPI), 其中R 辑:电工。
主体 ,是将数 15、顺排文挡是数据库的____ 记录号的大小排列而 据库的全部记录按照____ 特征标识 作为排 成。倒排文档是以记录的______ 提高检索效率 。 列依据。倒排文档可__________
记录 是文档的基本单元。它是对某一实 16、____ 全部属性 的描述。在全文数据库中,一个 体的______ 一篇文献 ;在书目数据库中,一个 记录相当于______ 文摘或题录 。字段是___ 记录 的 记录相当于一条________ 某一属性 的描述。基 基本单元。它是对实体的______ 相关 ,辅助字段与与文献内 本字段与文献内容___ 无关或者关系不大 容____________ 。 布尔逻辑 算符:OR/AND/NOT,注 17、_______ 意不同的数据库,有不同的规定。
33、文献数据库有参考数据库、源数据库、 混合数据库等。书目数据库和指南数据库属 参考数据库 ;全文数据库和图像数据库等 于________ 源数据库 。 属于______
CNKI ,其 35、中国知识基础设施工程简称_____ 中国知网(), 网站名称为_____ 有许多数据库,一般每个数据库分十个专辑。 浏览全文要下载安装_____ CAJ 浏览器(知网首 页有)或Acrobat浏览器 。CNKI的全文文 CAJ或PDF 。 献格式是_________
23、中文段码名称 英文段码全称 英文段码简称 TI 题目 Title __ 记录号 Document No DN __ 文摘 Abstract AB __ 叙词 Descriptor DE ___ ID 期刊名称 Journal ___ 标识词 Identifier ___ JN AU 出版国 Country CO 作者 Author ___ ___ LA 文献性质 Treatmentcode ___ TR 语种 Language ___ 作者单位 Corporation Source ___ CS 出版年份 Publishing year PY ___
29、国外主要检索刊物 EI ) 美国《工程索引》(___ CA ) 《化学文摘》( ___ BA ) 《生物学文摘》( ___ MA ) 美英《金属文摘》( ___ 英国《科学文摘》( ___ SA )。 世界“三大索引” 是: EI )、 《工程索引》( ___ 《科学引文索引》( SCI ___ )、 《科技会议录索引》( ISTP ___ )。
手工 检索 ②计算机 5、文献检索方式:①____ 联机 检索、___ 光盘 检索、 检索.计算机检索又分___ 网络 ___检索。 目录 、 ____ 题录 、____ 文摘 检索系统类型: ____ 及索引 。 篇目(题目) 按照一定的 题录:将文献中的________ 排检方法编排。 文摘:以精练的语言把文献的 主要内容 ______按 一定的著录规则编排 。 书目(目录):图书各种著录信息。包含 作者、书名(篇名)、出处等 ____________________ 。
24、索书号的组成: 分类号加种次号 _________;索书 惟一标志 ,同 号的作用:到书架上取书的_______ 类书应放在相近处。例: TN710/J321 TN710 为中图法分类号, ______ J321 为 其中______ 种次号。 73.76032/1000 73.76032 为 1000 为种次号 , ________ 其中 ______ 科图法分类号。
13、文献检索步骤:
分析课题 1,_________ ; 选择检索方法 2,_________ ; 选择检索系统 3,_________ ; 确定检索路径 4,_________ ; 查找文献线索和获取原文 5,________________ 。
文档、记录和字段 。一 14、数据库组成:___________ 顺排文档 和一个 个数据库至少包括一个______ 倒排文档 。 ______
核心文献 通常是指与本学科发展水平、 6、_______ 发展动向密切相关的一些文献。相关文献 ______是 指内容与学科的关系相对疏远一些的文献。 边缘文献 ______是指内容与学科的关系更疏远的文 本学科和其它学科 献。相关文献和边缘文献是___________ 相互渗透、互相结合的结果。
18、当某些英语检索词词干相同、词义 相近,但词尾或词中间有变化时(多数英 语单词的单复数变化和英美不同拼写形 截词 符,或称___ 通配 符扩展 式),可以采用___ 检索词。截词检索可以扩大检索结果。截 “?”、“*”、“$”、“%” 词符常有_____________ 。截词方 法注意:一是截词符和词干之间不能有 空格 。二是避免将检索词的词干___ 过短 , ___ 一般应在三个字母以上。
说明 、 ____ 目次 、 31、检索工具的结构:____ 正文 、 ____ 索引 和____ 附录 。著录格式示例在 ____ 附录 中找。 说明 中找,主题词表在____ ____
查全率 、 32、描述检索效率的因素有: ____ 查准率 ____、漏检率、误检率、新颖率、覆盖率、 检索速度 等。 ________
《中国图书馆分类法》 10、国内通用两种分类法是 ______________即 《中图法》 ______ 和《中国科学院图书分类法》 ________________ 即《中科法》 ______ 。 它们的类号设置的区别是《中国图书馆分类法》混合使 字母和数字 ,而《中国科学院图书分类法》使用 用________ 纯数字 作为类号。《中图法》共有5大类: _____ ______________ 马、列、毛泽东思想 ;哲学 ____; 社会科学 ______; 22 个大类(一级类 自然科学 综合性图书 。下分___ ______;________ O 类是数理化,T类是______ 工业技术 。任何类似 目)。 ___ 上位类 。相对地说,区 的分类表中,被区分的类称为_____ 下位类 。分类语言的上下位之间的关 分出来的类就是_____ 从属 关系。国际通用两种分类 系反映了概念外延的_____ 法是《国际十进制分类法》( _____ UDC )《杜威十进 DDC ) 分类法》( _____
关键词 语言和 11、目前常用的主题语言是_____ 叙词 禁用 词指无检索意义的词。 ____语言两种。____ 介词、连词、冠词 等无实质意义的虚词不能作为 ___________ 检索词来检索。
12、关键词是一种自然语言性质的主题语言.是 使用频率比较高 一些词。叙词 指著者在文献中___________ 规范化 词作为概念组配 是表述文章主题内容的_____ 单元的标识。