当前位置:文档之家› 信息检索基本步骤

信息检索基本步骤

(1)准确、专业。 不要将一些意义广泛的词作为检索词, 如研究等。
(2)全面。考虑:a 基于概念的上下位词,如可再生能 源与太阳能。b 同一检索词的不同表达方式,如白血病与血 癌。 c 基于检索结果的同义词或近义词。
关键词或叙词、主题词选词特点(1)
是能是够能揭够示揭主示题主内题容内的容语的词语词 关键关词键应词该应是该表是示表最示小最概小念概的念语的词语词
2 检索效果的评价指标
检索效果(Retrieval Effectiveness)是指检索系 统检索的有效程度,它反映了检索系统的能力。包括 技术效果和经济效果。
克兰弗登(Cranfield)评价系统性能的指标:
♦ 收录范围 ♦ 查全率 ♦ 查准率 ♦ 响应时间 ♦ 用户负担 ♦ 输出形式
➢查全率 是指检出的相关文献量与检索系统中相关文献总量的
检索式是检索策略的逻辑表达式,是用来表达 用户检索提问的,由基于检索概念产生的检索词和 各种组配算符构成。
组配算符通常有布尔逻辑算符、截词符(通配符)、 位置算符、嵌套算符(优先算符)四种。
布尔逻辑算符组配检索
布尔逻辑组配运算是采用布尔代数中的逻 辑“与”逻辑“或”、逻辑“非”等算符,将 检索提问式转换成逻辑表达式,限定检索词在 记录中必须存在的条件或不能出现的条件。凡 符合布尔逻辑所规定的条件的文献,即为命中 文献。
§3-2 信息检索的基本步骤
1 信息检索的基本步骤:
(1)课题分析 (2)选择检索系统 (3)抽取检索词 (4)构造检索式 (5)文献检索及检索式的调整 (6)检索结果的处理
第一步 分析课题
明确文献检索的目的; 明确课题要解决的实质问题; 明确有哪些主题概念; 各主题概念之间的关系; 明确课题涉及的学科范围; 明确课题所需文献信息的语种、时间范围等 具体要求。
第五步 文献检索及检索式的调整
选择合适的检索途径:
题名途径(Title) 责任者途径(Author) 机构途径(Affiliation) 序号途径(Code) 分类途径(Classification) 主题途径 关键词途径 其它途径
根据课题的已知条件和课题范围和检索效率要求,选择合 适的检索途径。题名/关键词/摘要/主题/全文
湖泊富营养化的处理
检索词
三维打印、3D打印、应用、 富营养化、水华、处理、
运用
治理、净化、修复、防
治、湖泊、湖
检索式
(三维打印+3D打印)*(应 用+运用)
富营养化*(处理+治理+ 净化+修复+防治)*(湖 泊+湖)
水华*(处理+治理+净化 +修复+防治)
构造检索表达式注意事项:
1 同义词或近义词之间用“逻辑或” 组配 2 所有标点符号均在英文状态下输入。 3 注意优先算符()的使用。
或ห้องสมุดไป่ตู้
A and B
其意义为检索记录中必须同时含有检索词A和B的
文献,才算命中文献。
逻辑“非” ————————————————
AB
用符号“not”或“-”,其逻辑表达式为:
A not B

A-B
其意义为:检索记录中含有检索词A,但不能
含有检索词B的文献,才算命中文献。
案例分析:
课题名称
三维打印技术的应用
一般来说,当检索结果不理想时,可以从以下 几点考虑检索式的调整:
(1)检索词是否准确?是否有同义词、近义词或其它隐 含的词未被抽取。
(2)检索式是否准确?是否有全角字符?组配算符是否 正确合理?
(3)检索途径是否合理?可考虑从不同的检索途径进行 试检索,必要时用全文检索。
第六步 检索结果的处理
检索结果的处理包括文献信息的选择、下载、 存盘以及文献的阅读与引用。对于有参考价值、拟 在论文写作过程参考或引用的文献,要逐篇下载, 并将所有下载的文献信息按引文格式存盘,以便在 论文的参考文献列表中使用。
比率,是衡量信息检索系统检出相关文献能力的尺度。可 用下式表示:
➢查准率 它是指检出的相关文献量与检出文献总量的比率
,是衡量信息检索系统检出文献准确度的尺度。可用 下式表示:
查全率和查准率在一定程度上成反比关系。应根据具 体课题的要求,合理调节查全率和查准率,保证检索效果。
中文检索系统可考虑CNKI、万方、维普数据库,外文数据 库可考虑使用Science Direct、Springer、John Wiley、 WOS等。
案例分析:
课题名称 检索系统
三维打印技术的应用 CNKI、万方、维普
湖泊富营养化的处理 CNKI、万方、维普
第三步 提炼检索词
方法:切分、去除、替补 注意:
案例分析:
课题名称
三维打印技术的应用
主题概念 (检索点)
三维打印、应用
涉及学科
语种和时间 范围
涉及光学、机械学、电 学、计算机技术、数控 技术及材料技术等。
中文文献,不限时间
湖泊富营养化的处理
富营养化、处理、湖泊
涉及生物学、环境科 学等。
中文文献,近十年内 发表文献
第二步 选择检索系统
选择检索工具时要考虑: 专业性,即选择与学科专业相关的工具,特别注 意跨学科领域内容。 权威性,尽量选择该学科的权威性检索工具。 了解检索工具收录的范围,包括时间跨度、地理 范围、文献语种、类型、揭示深度等。 了解检索工具的检索方法和系统功能
逻辑“或” —————————————————
A
B
用符号“or”或“+”表示,其逻辑表达式为:
A or B
或 A+B
其意义为检索记录中凡含有检索词A或检索词B,
或同时含有检索词A和B的,均为命中文献。
逻辑“与” ————————————————
AB
用符号“and”或“*”表示,其逻辑表达式为:
A*B
虚词(不可用):连词、副词、介词、 助词、语气词
宽泛概念的词(不可用):研究、技术、 问题、方法 …
关键词或叙词、主题词选词特点(2)
案例分析:
课题名称
三维打印技术的应用
检索词
三维打印、3D打印、应 用、运用
湖泊富营养化的处理
富营养化、水华、处 理、治理、净化、修 复、防治、湖泊、湖
第四步 构造检索式
相关主题