当前位置:文档之家› 医学信息检索

医学信息检索

1.信息的特性:普遍性、传递性、依存性、相对性、可加工性、时效性、可共享性。

2.信息源:个人为满足其信息需要而获得信息的来源。

3.产生次序和加工程度(重要):零次、一次、二次、三次信息①零次信息:指未经正式发表或不宜公开和大范围内交流的比较原始的素材、底稿、手稿、书信、工作文稿、工作图纸、考察记录、实验记录、调查稿、原始统计数字、以及各种口头交流的知识、经验或意见论点等。

其形式多是抄件,打字件,油印件,以及内部录音,录像等。

各种聊天工具。

②一次信息:又称原始文献,也称原始信息源。

它是作者依据本人的科研和工作成果而形成的文献,这类文献是脑力劳动的正式产品,是科研成果的一种主要表述方式,代表新知识,组成了可供交流的系统性信息。

包括:图书、期刊和报纸、科学考察报告、研究报告、会议论文、学位论文、专利说明书、技术标准、政府出版物、产品样本等。

③二次信息:指根据实际需要,按照一定的科学方法,将特定范围内的分散的一次信息进行加工整理使之简化和有序化而形成的文献信息。

它能较为全面、系统的反映某学科某专业文献的线索,是检索一次信息的工具。

这类文献有:书目、题录、索引、文摘等。

④三次信息:指通过二次信息提供的线索,选用一次信息的内容,进行分析、综合、研究后编成的信息。

一般包括专题述评、动态综述、系统评价、进展报告、学科年度总结、年鉴、指南和百科全书等。

4.信息需要:指人们在从事各项实践活动的过程中,为解决所遇到的问题而产生的对信息的需求。

是信息行为发生的基础。

5.信息需要的层次(重要):未知的信息需要、潜在的信息需要、现实的信息需要。

通过对信息需要层次的理解,能够判断自己或他人的信息需要的层次。

①未知的信息需要:有些现实问题过于复杂和隐蔽,或个人的认知能力有限甚至缺乏信息意识,因此没有意识到自己处于信息需要的状态,属客观信息需要。

②潜在信息需要:有些人可能认识到了自己的信息需要,但却没有表达出来,致使信息需要无法用信息符号表达出来而处于“意会”的状态。

人们认识而未表达出来的信息需要称为潜在信息需要。

③现实的信息需要:当人们意识到信息需要,并且明确的表达出来的,称之为现实的信息需要。

用户在表达出来以后,向信息服务机构提出具体的信息要求称之为信息提问,用户自己动手寻找信息的称为信息自问。

信息表达往往并不能充分或者完全的表达信息需要的全部内涵。

信息需要和信息需要表达常常是不能完全一致的。

糖尿病足的护理和糖尿病病人的足部护理。

6.篇名、著者和出处三个字段组成题录7. 布尔逻辑运算符:AND OR NOT(1)AND:逻辑“与”。

常用符号:*检索结果中每条记录必须同时含有A和B检索词,增强检索的专指性,缩小检索范围。

(2)OR:逻辑“或”。

常用符号“+” 。

表示包含检索词A的文献或包含检索词B的文献或同时包含检索词A和检索词B的文献均为命中文献,逻辑“或”扩大了检索范围,提高查全率。

3)NOT:逻辑“非”。

常用符号“-”表示检索结果中每条记录必须包含检索词A ,但不包含检索词B 。

排除了不希望出现的检索词,缩小了检索范围,提高查准率。

8.布尔运算符的优先级:①当一个检索表达式含有多个布尔算符时,执行的顺序:NOT AND OR②可用圆括号改变运算顺序,将需要优先运算者置于圆括号中。

另:在检索时,各数据库对布尔逻辑关系词的拼写要求不同,有的要求大写,有的不区分大小写;同时,不同数据库中布尔逻辑关系词的符号也会不同。

9.位置逻辑检索:又称邻近检索、相邻度检索。

它是基于文献中或文献记录中语词之间的相对次序或位置不同,它们所表达的意思可能不同;相应地,一个检索提问中语词之间的相对次序和位置不同,其表达的检索意图也不一样。

因此,可以使用一些特定位置逻辑算符来限定检索词之间的位置关系,使检索提问式尽可能表达检索者真正的检索意图,从而既提高检准率,又提高见检全率。

常用的位置算符有near 、with、nWords、nNear、Field①(W)--- with。

在(W)两侧的检索词的顺序不能改变,两个检索词之间不能有其他的词或字母,但是允许有空格或者标点符号。

②(nW)---nWord。

在(nW)两侧的检索词顺序不能改变,两个检索词之间最多允许插入n个词。

③(N)---near。

在(N)两侧的检索词顺序可以调换,而且两个检索词之间最多可以有10个词④(nN)---nNear。

在(nN)两侧的检索词顺序可以调换,而且两个检索词之间最多可以有n个词⑤(F)---Field。

在(F) 两侧的检索词顺序可以调换,而且两个检索词之间的词的个数不限,但是,他们必须同时出现在文献记录的同一个字段内。

A near(n) B,检索词位置相邻,但无顺序关系,可前可后。

A with(n) B,检索词位置相邻,但有顺序关系,A必须出现在B前面,不可颠倒。

10.截词检索:截词检索是指在检索词中保留相同的部分,用截词符号代替可变化的部分。

它是为了部分解决由于检索式中对同义词列举不全造成的漏检现象而提出的,相当于用逻辑“或”扩展检索范围。

截词符号一般用“?”或“*”等。

截词检索主要用于年代、作者、同根词和单复数词的检索,减少输入负担,节省检索时间和费用,提高检全率。

按截断的字符数量的不同分为:无限截词、有限截词。

有限截词?是用来对检索量进行限制的一种方法。

其原理是在词干前后加以字符限制,使得检索出的词除词干外,前后缀所含字符必须与限定字符个数一致,或者在限定数以内。

例如,银盘公司的MEDLINE光盘检索,computer?可以查到有关computer、computers、comptery 词,但不会检出computerized 、computerizing、computerlab、computerphobia等词。

无限截词* 按截断位置的不同分为:右截词、左截词、中间截词(前截词,后截词,中间截词)。

例:computer* 可以查到有关computer、computers、comptery、computerized 、computerizing、computerlab、computerphobia等词。

11.字段检索:是指将检索词的匹配限定在某个或某些特定的字段范围内进行。

不同检索系统的字段限定方法可能不同:“in” 对某一或某些指定字段进行检索,如:asthma in TI“=” 用于限定性字段的检索,如:LA=ENGLISH其他:“<”, “>”,py < 2000 表示检索2000年前发表的文献记录。

12.精确检索:精确检索又称短语检索,是将一个短语(词组)当做一个独立的运算单元,往往用双引号括起来,进行严格匹配,以提高查准率。

有的时候也用“=”到限定,不要与字段限定混淆。

13.加权检索:是为了弥补布尔逻辑检索不能揭示检索概念与检索课题相关程度的缺陷而提出来的。

其基本思路是,由检索者自行对各检索词设置一个权值,并提出一个阈值,当检索出的提问式的总权值大于或等于阈值时,该文献为命中,否则为不命中。

加权检索使量的概念进入了布尔检索,总权值的大小代表了文献与检索课题的相关程度。

最后输出检索结果时,可以根据权值的大小顺序排列,这对用户是非常有用的。

14.扩展检索是同时对多个相关检索词执行逻辑或检索的技术。

即当用户输入一个检索词后,系统不仅能检出该检索词的文献,还能检出与该检索词同属于一个概念的同义词或下位词的文献,如PubMed和CBM中主题词的扩展检索。

15. 比较完善、切题的检索式=布尔算符+括号+截词符+位置算符16.计算机信息检索的主要步骤(一)检索需求的分析计算机检索和手工检索相比,深刻理解题意更为重要。

计算机检索是一种机械的运算和匹配过程。

一旦输入检索词,计算机不会判断,不管对错它都要执行下去。

所以在计算机检索前,首先应分析检索需求,然后根据信息需求的特点确定检索的基本方法。

不同类型的信息需求对查全和查准要求的程度不尽相同,在以后数据库的选择和检索策略制定时,应区别对待。

信息需求特点基本上可分为三种类型:1)“新”即这类信息检索要求能及时获得并迅速传递,而对查全则没有过高的要求。

2)“准”即要求了解某一理论、方法、设备、工艺等片断性信息,以解决其研究中的具体问题,要求检出的文献有针对性。

这类需求对查准有较高的要求而不需要查全。

3)“全”即要求全面了解某一学科中一个特定领域的发生、发展和现状。

编写教材和综述、科技成果水平评价以及专利申请的查新等往往会需要这类信息检索。

这类需求对查全有较高的要求。

(二)检索需求的表达从总体上来讲,检索需求的表达要求能全面描述并正确揭示用户信息需求并且简单明了,既便于书写,又便于输人到计算机中进行检索处理。

(三)检索策略的制定:构造一个良好的检索式,往往涉及各方面的知识和技能。

一般情况下,编写检索式可按下列步骤进行:1)选择相关数据库,并确定待检数据库中的检索途径,以便编制适合所选数据库的检索式。

一般情况下,大型信息检索系统和大型信息中心都建有数据库导航系统,可通过数据库导航获得相关数据库的信息。

数据库导航一般有分类和主题两条途径,用户可以结合具体情况选择合适的数据库。

2)对信息提问进行概念分析选择能代表各概念组面的检索项,从而把提问的主题概念转换成适合系统的检索词,完成用户信息需求由概念表达到计算机系统所能接受的检索标志表达的转换。

3)拟定检索表达式,即检索式。

4)编排具体的检索程序。

(四)检索式的编制一个检索课题往往要拆分成一个到数个主题概念,而每个主题概念又可以用一个到数个主题词或文本词来表达,且这些词不是孤立地存在,互相之间有一定的逻辑关系。

把选择好的检索词用系统规定或允许使用的符号连接、组配起来,便成为一条检索式。

检索式的编制应符合下面三个基本条件:①应该完整而准确地反映出信息提问的主题内容;②要适合所查数据库的索引体系和检索用词规则;③要符合检索系统的功能及限制条件的规定。

17.检索流程图:分析课题,明确实质需要→选择合适的工具数据库→概念分析,并转化成系统检索用词→→yes→输出检索结果↑拟定检索提问式或检索途径→检索→检索结果是否满意→no→修正调整检索策略→↑(1)分析研究课题:这是指在着手查找信息的对课题进行分析,明确学科或专业的范围,弄情检索的真正意图及实质。

可从以下几方面确定检索范围:①专业范围:确定该课题涉及哪些专业及其相关的学科。

②时间范围:确定该课题需要检索信息的年代范围。

③地理范围:各国出版的检索系统以收藏本国的信息为主,因此要了解某课题在哪个国家处于领先地位、原则上就采用该国的检索系统。

④语种范围:视该课题在哪国占优势,据此选择该国母语的检索系统。

⑤信息类型:各种检索系统收录信息的着重点是不同的,即使是综合性检索系统也未必面面俱到,因此要选择与课题有关的、针对性强、适合课题需要的检索系统。

相关主题