《信息资源检索与利用》课程要点1.信息资源信息是普遍存在的,但并非所有的信息都是信息资源,信息只有经过人类加工后,可被利用的信息才能称为信息资源。
2.信息资源的分类按信息资源的存在状态可将其分为潜在的信息资源和现实的信息资源两大类。
其中现实的信息资源依据其载体可分为体载信息资源、文献信息资源、实物信息资源和网络信息资源。
(1)体载信息资源体载信息资源指以人体为载体并能为他人识别的信息资源,按其表达方式又可分为口语信息资源和体语信息资源。
口语信息资源是人类以口头语言表达出来但未被记录下来的信息资源,如谈话、授课、讲演、讨论等;体语信息资源是以人的体态表达出来的信息资源,如表情、手势、姿态、舞蹈等。
(2)文献信息资源:文献信息资源是以文献为载体的信息资源。
A.按信息资源出版类型划分(10大信息源)①科技图书;②科技期刊;③科技报告;④会议文献;⑤专利文献;⑥学位论文;⑦标准文献;⑧政府出版物;⑨产品样本;⑩技术档案B.按加工层次划分①一次信息资源。
一次信息的载体形式称为一次信息资源,也称原始文献。
它是以作者本人的科研工作成果为依据而创作的原始文献,如期刊论文、科技报告、会议论文、专利文献、学位论文等,它具有新颖性、创造性和系统性等特征,参考和使用的价值较高。
个人专著(某某著书,而某某编的书不是一次文献而是二次或三次文献)。
②二次信息资源。
浓缩二次信息的载体形式称为二次信息资源,是查找一次信息资源的工具。
它是将分散的、无序的一次信息资源进行加工整理,使之成为系统有序的信息资源。
二次信息资源具有浓缩性、汇集性、有序性等特点,它的作用不仅在于报道信息的内容,更重要的是可以提供原一次信息资源的线索。
例如:书目(mar c数据)、题录、文摘、索引等。
(图书馆检索室)③三次信息资源。
三次信息的载体形式称为三次信息资源,它是指对一次信息资源进行综合分析、研究和评述而编写出来的成果。
如手册、百科全书、年鉴以及其他综述和评论性文章等。
三次信息资源源于一次信息资源,又高于一次信息,是一种再创性文献。
它可分为两大类:一类是综述、述评等,如各种综述、动态、进展报告;另一类是参考性工具书,如百科全书、年鉴、手册、词典、文献指南等④零次信息资源。
零次信息的载体形式称为零次信息资源。
它是指未经正式出版发行的最原始的记录,如书信、手稿、笔记、实验记录等。
其主要特点是内容新颖,具有原始性,但不成熟,分散,难于检索。
如书信、手稿、笔记、记录等。
也有人认为是科技人员口头交谈及直接作用于人的感觉器官的非文献知识,如操作技能、诊疗经验等。
也可以说,零次文献是以文献所有者本身为载体的未公布于世的科技知识。
以上四级信息资源的关系是,零次信息资源是一次信息资源的素材;一次信息资源是二次、三次信息资源的来源和基础;二次、三次信息资源是对一次信息资源进行组织、加工、综合后形成的,它们编写的目的明确,专指性强。
(3)实物信息资源实物信息资源是指以实物为载体的信息资源。
(4)网络信息资源网络信息资源是指从计算机、通信技术、多媒体技术相互融合而形成的网络上可查找到的资源。
网上可利用的信息资源是多种多样的,从网络信息管理和利用的角度出发,人们对已存在于网络中的信息资源进行了类型化和系统化研究,不同的角度有不同的分类形式,一般有以下几种:① 按信息表现形式分有电子出版物和非电子出版物信息资源。
②按信息的媒体形式分本为文本信息资源、超文本信息资源、多媒体信息资源和超媒体信息资源。
③按网络信息资源加工层次,可以分为网络资源指南和搜索引擎联机馆藏目录、数据库信息资源、电子出版物、网上参考工具和其它动态信息。
④ 按照用户采用的不同的网络协议来划分,可以分为基于超文本传输协议(HT T P)的信息资源、基于文件传输协议(F TP)的信息资源、基于远程登录(T ELN E T)的信息资源、新闻组(Usene t/News g roups)资源和电子邮件(E-m ail)信息资源。
此外随着w e b2.0的发展信息资源也便及整个web2.0中,如博客,百科,维基,播客等等。
3.信息资源检索信息资源检索是从信息资源集合中找出所需信息内容的过程。
从广义上讲,信息资源检索包括两个过程,一是信息资源的存储(Information Storage),所谓存储是对有关信息进行选择,并对信息特征进行著录、标引和组织,建立信息数据库的过程;二是信息资源的检索(I n fo r m ati o n Retr iev a 1 ),所谓检索是根据检索提问制定检索策略,利用信息数据库查找信息资源的过程。
从狭义上讲,信息资源检索仅指后一部分。
4.信息资源检索的分类(1)按信息资源检索结果的内容划分①信息检索。
信息检索按照其信息系统、内容及结果可分为以下两种类型:信息线索检索。
利用书目、文摘和书目型数据库等检索系统,检索的结果只是提供了信息线索。
信息的全文检索。
这种检索以查找到信息全文为目的,检索的结果是找到全文信息。
②数据检索。
数据检索是指从检索系统存储的数据中查出用户所需数据的检索,如科技数据、金融数据、人口统计数据等。
③事实检索。
事实检索是指对特定的事件或事实的检索,包括事物的性质、定义、原理及发生的地点、时间、前因后果等。
(2)按信息资源检索技术划分①全文文本检索。
全文文本检索也称全文数据库检索,它通过计算机将文件的全貌,包括文字、图形和图像等信息转换成计算机可读形式,直接采用自然语言来设置检索入口,检索时以文中任意信息单元作为检索点,计算机自动进行高速比照,完成检索过程。
②多媒体检索。
多媒体检索是指能够支持两种以上媒体的数据库检索。
③超文本检索。
超文本检索是指超文本(h yper t ex t)的内容排列是非线性的,它按知识(信息)单元及其关系建立起知识结构网络,如具有图形的信息又称超媒体(hype rm e di a),超文本(媒体)的检索是通过超文本(媒体)链接(h y perlink)来实现的。
④网络信息资源检索。
网络信息资源检索是一种集合各种新型检索技术于一体,能够对各种类型、各种媒体的信息进行跨时间、跨地理检索的大系统。
5.信息资源检索系统检索系统是用于报道、存储与查找信息的工具。
检索系统的实质是将描述特定用户所需信息的提问特征与信息存储的检索标识进行异同比较,从中找出与提问特征一致或基本一致《信息资源检索与利用》课程重点的信息。
检索系统应包括以下两个主要的方面:(1)信息标引和存储过程。
对大量无序的信息资源进行标引处理,使之有序化,并按科学的方法存储,组成检索工具或检索文档,即组织检索系统的过程。
(2)信息的需求分析和检索过程。
分析用户的信息需求,利用已组织好的检索系统所提供的方法与途径检索有关信息,即检索系统的应用过程。
6.数据库及数据库类型(1)数据库的定义。
根据ISO/DI S 5127号标准,数据库①a t ab ase)的定义为:至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。
(2)数据库类型。
按照国际上通用的分类方法,数据库通常可划分为以下几个类型:①参考数据库(R ef e r e nc e D ata b ase)。
参考数据库是指用户在这些数据库中获取信息线索后,还需要进一步查找原文或其他资料的一类数据库。
它包括书目数据库和指南数据库。
书目数据库(Bibli og rap h i c D ata b ase):它是存储某个学科领域二次信息资源的数据库,其显著特征是向用户提供信息线索,只能检索出信息的标题、出处、著者、主题等。
例如,《E I V illage 2》、《美国化学文摘数据库》、《中文科技期刊篇名数据库》等。
指南数据库(D ir ectory D a t abase):它是存储能够提供用户参考、给予用户指南的各类信息,如商业、企业等机构的名称、地址、电话,人物出版物,项目,程序,活动等简要描述性信息的一类数据库,亦称指示性数据库。
例如,公司名录数据库、人物传记数据库、技术标准数据库等均属此类。
②源数据库(Source Database)。
此类数据库在欧洲也称数据银行(Da t a B a nk)。
它是能够直接为用户提供原始资料或具体数据的一类数据库。
7.信息资源的检索方法直接检索:指通过直接浏览或阅读原始文献获取所需信息的方法。
通过它可以直接查找一次信息资源和三次信息资源。
间接检索:指借助检索工具或检索系统查得文献线索再获取原始文献的方法称为间接检索。
它是文献检索常用的检索方法。
8.检索策略广义地说,检索策略(Retr i ev a l S trat eg y)是为实现检索目标而制定的全盘计划或方案,包括课题分析、检索系统选择、确定检索词及其相互间的逻辑关系、检索式的制定、调整检索方案等。
狭义地说,检索策略是指填写的“检索提问单。
在计算机检索中,策略问题是明确提出来的,必须慎重考虑的,因为它可能要完成的是一个比较复杂、精细的检索课题,又是在人与机器的交互、对话中实现的。
手检的策略考虑较少因为比较简单,方案研究的余地不多。
9.课题检索步骤分析研究课题(明确检索目的和要求)一选择检索工具和检索方法一选择检索途径和检索标志f查找文献线索f整理检索结果f索取原文。
(1)课题分析分析检索课题的目的是使用户搞清楚其课题要解决的实质问题,即它所包含的概念和具体要求以及它们之间的关系。
这是制定检索策略的根本出发点,也是检索效率高低或成败的关键。
课题分析需要明确以下具体问题:①研究课题的主题、课题所涉及的学科范围、课题所需信息内容及其内容特征。
②课题所需信息的类型,包括文献信息载体、出版类型、所需文献量、年代范围、涉及的《信息资源检索与利用》课程重点语种、有关著者、机构等。
③课题对查新、查准、查全的指标要求。
(2)检索系统或检索工具的选择一个计算机检索系统通常可以提供多个可检索数据库,一个手工检索系统就是一种检索工具。
选择检索工具和检索系统时,要考虑的主要问题是:①从内容上和时间上,考虑检索工具和数据库对课题的覆盖和一致性,比如应综合考虑选择专业性强、收录范围广、检索途径多、编制质量高、使用方便的检索工具或数据库。
②在手段和技术上,有机检条件的一般就不选择手检工具,机检无疑有较高的效率。
③考虑价格和可获得性,选择手头容易获得的检索系统,注意数据库的价格,权衡价格效益比。
(3)检索途径不同的检索入口,有相应的检索路径(appr o ach),称作检索途径。
手检工具只提供比较常用的检索途径,如分类途径、主题途径、著者途径、号码途径、引文途径第计算机检索系统中,检索点很多,几乎文献的每一个特征都可作为检索点,并且可以实现全文检索。
(4)检索式的制定依据检索词之间的逻辑关系,用检索系统识别的符号将检索词连接起来,反映研究内容、表达研究者意图的式子。