当前位置:文档之家› 科技信息检索与利用_2

科技信息检索与利用_2

第2章 信息海洋冲浪的基本方法与 技巧——信息检索系统和检索语言陈芬 南京理工大学经济管理学院信息检索的含义 "是指用户根据特定的需求,借助某种检 索工具,采用一定的检索策略和方法,从 待检的信息源或信息集合中查找出所需信 息的过程。

"Retrieval=Searching + Browsing "广义的信息检索包括信息存储与检索2/40信息获取与利用信息检索的类型 "按照检索的信息类型划分 : 数据检索 文献检索 "按照信息检索方式划分: 手工信息检索 机械信息检索 计算机信息检索3/40信息获取与利用信息检索的原理信息汇集 信息存储 信息检索收 集 信 息主 题 分 析外 部 内 容 特 征排 序存 储提 问匹 配显 示 输 出4/402.1 工具箱——检索系统1. 问题给出 需要查找资料时,首先涉及检索系统的选 择– – – – 搜索引擎 or 专业数据库 or 图书馆检索系统 or ……信息获取与利用5/402. 相关知识 检索系统按功能划分为3类: ① 目录检索系统 ② 文摘检索系统 ③ 全文检索系统信息获取与利用6/40(1)目录检索系统 对出版物进行报道和对图书资料进行科学 管理的工具 电子版目录:– 机读目录:MARC – 联机公共检索目录: OPAC—— 查询单个图 书馆的馆藏目录及多个图书馆的联合馆藏目 录信息获取与利用7/40(2)文摘检索系统 检索结果是参考文献的线索,包括论文的 题目、作者、出处和摘要等 不提供文献本身,也称为二次文献检索 三大检索工具: ① SCI(科学引文索引) ② EI ③ ISTP (科学会议录索引数据库)8/40信息获取与利用(3)全文检索系统 集文摘检索与全文提供于一体 优点: ① 免去了费力获取原文的麻烦; ② 提供全文字段检索 例 子 : Wiki 百 科 、 CNKI 、 Elsevier Science9/40信息获取与利用3. 解决问题常用文摘检 索系统EI、 SCI等进行 初步检索信息获取与利用依据来源出 处,通过全 文检索系统 得到全文依据摘要对检 索出的文献进 行筛选,得到 相关的二次文 献通过搜索 引擎,对 最新科研 信息动态 拾遗补漏10/402.2 工具箱——检索语言1. 问题给出 通过检索语言与检索系统进行沟通信息获取与利用11/402. 相关知识 (1)检索语言的概念 "检索语言 又称为标引语言、索引语言、概念标 识系统等,是信息汇集、存储和检索时共 同使用的一种约定性语言,是一种人为创 造的人工语言,用来保证信息存储和检索 的一致性,提高检索效率。

信息获取与利用12/40通常检索语言用来描述信息资源的外部特 征和内部特征、表达信息内容主题及相互 的关系、对自然语言作规范化处理(指对 同义词、多义词、近义词、同形异义词进 行统一限制或合并,使之达到一词一义, 以表达概念的惟一性)、表达主题提问以 便于将检索标识和提问特征进行比较。

检索语言 存储 检索13/40信息获取与利用西红柿14/40番茄15/40(2)常用检索语言 分类能够将事物区分开来,揭示事物之间的本质的、内在的联系。

分类语言就 主题词是能够用于描述、存贮、检索 是按照知识门类的逻辑次序对概念进行 信息主题而作为建立检索工具或检索 归类。

体系分类语言 系统的一种规范化的词汇,它能够与 组配分类语言 所要表达的事物概念达到一一对应。

分类语言 主题语言是直接用代表信息主题概念 混合分类语言 的主题词作为信息的标识的一种检索 语言。

信息获取与利用主题语言标题词语言 单元词语言 叙词语言 关键词语言16/40检索途径以内容特 征为标识 的检索信息获取与利用分类途径——事物的属性和内容所属的范畴 主题途径——内容的主题概念(概括) 作者途径—— 个人、团体 名称(篇名)途径——文章的篇名、企业的名 称、产品的名称等 号码途径——标准号码、报告号、专利号 时间途径——事物发生的前后17/40以外表特 征为标识 的检索18/40① 分类语言 定义:以号码为基本字符,用分类号和类 目表达文献主题概念的检索语言 中国图书馆分类法– 22大类信息获取与利用19/40信息获取与利用TB一般工业技术 自 然 科 学 总 论 N. 自 然 科 学 总 论 …… …… TP 自动化技术、 计算机技术 T.工业技术 X. 环 境 科 学 、 … TV水利工程 安全科学 …TP3 计算技术、计算机技术 TP39 计算机的应用 TP393 计算机网络 TP393.09计算机网络应用程序20/40国外知名的图书分类法:– 杜威十进分类法 – 美国国会图书馆分类法( LC Classification )信息获取与利用21/40② 主题语言 一种描述语言,用自然语言中的名词、名 词性词组或句子描述文献所论述或研究的 事物概念,特点是用词语来表达各种概念 特点:– 专指度高 – 不必从知识体系的角度去判断所需文献属于 什么学科,只要根据课题研究对象、直接使 用表征文献内容的主题词查询 – 同一篇文献可用多个主题词标引,扩大了检 索途径 22/40信息获取与利用(3)常用检索运算符号 算符( operator ):将不同检索条件组合 在一起的符号信息获取与利用23/40① 逻辑算符(布尔算符) 用来表示两个检索单元之间的逻辑关系 • 逻辑“或” 也称逻辑加,用“OR”或“+”表示• 逻辑“与” 也称为逻辑乘,用“AND”或“*”表示 • 逻辑“非” 用“NOT”或“-”来表示24/40信息获取与利用信息获取与利用25/40② 通配符和截词符 把检索词加上某种符号截断,让计算机按 照检索词的部分片断同索引词进行对比, 以提供族性检索的功能 用于西文电子资源的检索 不同检索系统使用的种类和含义可能不同信息获取与利用26/40• 前方一致 即将检索词的词尾部分截断,要求比 较被检项的前面部分。

如comput* • 后方一致 即将检索词的词头部分截断,要求比 较被检项的后面部分。

如*ology • 中部截断 将 检 索 词 中 间 部 分 截 断 , 如 organi*ation27/40信息获取与利用③ 字段限制符 把检索词或检索式限定在指定的字段范围 内进行检索信息获取与利用28/40④ 邻近检索信息获取与利用• With 固定顺序的词组检索 (nW)南京 (3W) 景区 南京景区 南京中山陵景区 南京玄武湖景区• Near 可互换顺序的词组检索 (nN)29/403. 解决问题 问题:乙醇汽油作为车用替代燃料的优势 问题信息获取与利用30/40① 相 关 关 键 词 : 车 用 替 代 燃 料 ( vehicle alternative fuel/ substitutive fuel for automobiles )、乙醇( ethanol )、乙醇 汽油(gasanol) ② 中文数据库检索式:车用替代燃料 AND (乙醇 or 乙醇汽油) ③ 外 文 数 据 库 检 索 式 : ( vehicle alter* fuel OR substitutive fuel for automobiles ) AND( ethanol OR gasanol )31/40信息获取与利用2.3 信息检索五步走信息检索步骤信息获取与利用分析和利用信息 评价信息 制定并实施检索策略 选择信息源 界定问题32/401. 界定问题 需要解决什么问题? 需要什么类型的信息? 需要第一手消息还是经过加工的信息? 信息量多大才能满足需要? ……信息获取与利用33/402. 选择信息源 存在哪些信息源? 哪些是可获得的? 哪些是易得而比较有意义的?信息获取与利用34/403. 制定并实施检索策略 检索策略是为达到检索目标而制定的具体 检索方案,一般包括:检索系统的选择、 确定检索途径、拟定检索提问式信息获取与利用35/40手工检索策略信息获取与利用选择检索工具 选择的标准:确定检索途径 随时调整检索提问式 由于检索提问与检索工 具的存储标识之间的比 较是靠大脑随思维做判 断而完成的,可以边查 边思考边修改。

分类途径 •收录文献的覆盖面及 主题途径 文献类型; 著者途径 •文献的质量及检索的 号码途径 功能36/40计算机检索策略信息获取与利用选择适当的检索系 确定检索途径,优 统 化检索用词 内容特征——主题 选择的标准: 概念; •信息需求的结合 •学科专业是否对口 外部特征——分类 •覆盖信息量 号、代码、作者姓 •报导时间 名等。

•揭示信息内容准确系 统的检索功能选择检索技术, 构造检索式 布尔逻辑算符 位置逻辑算符 截词符 限制符37/40实施检索策略和索取原始信息 • 实施检索策略,获取信息线索 。

筛选出 的检索结果可以分为两类信息:其一,只提供了原文的线索信息的结果,需 要辨析信息来源的类型; 其二,提供了直接的原文信息。

信息获取与利用• 索取原始信息 文献线索 —— 图书馆、信息机构馆藏 目录——图书、期刊、会议、报告、专利、 学位论文、标准文献等。

38/404. 评价信息 对信息进行筛选 找到来源可靠、内容相关且详尽 剔除错误、过时、不相关的信息信息获取与利用39/405. 分析和利用信息 形成文字性的研究成果信息获取与利用40/40。

相关主题