中文医学文献检索的个人经验
1
的起源与发展
1994年Google 创始人、在读研究生Larry Page 和 Sergey Brin 在斯坦福大学的学生宿舍内共 同开发了全新的在线搜索引擎,然后迅速传 播给全球的信息搜索者
1998年Google公司宣告正式成立 2006年4月12日Google将原中文名“科高”改 为“谷歌”,意为“丰收之歌”
网络信息检索工具
网络信息检索的对象及其特点
网络信息资源(Network Information Resource)是以数字化形式记录,以文字、图 像、声音、动画等多媒体形式表达,存储在 网络计算机磁介质、光介质以及各类通讯介 质上,并通过计算机网络通讯方式进行传递 的信息内容的集合。
的检索结果格式
构建好检索提问式后回车,就进入
检索结果界面,检索结果按相关程度输
出,最相关的放在最前面。
网页标题:第一行是查询到的网页的标题,有时会显示为 网址
网址
文本大 小 单击“类似网页”时,Google 便开始寻 网页快照: “网页快照” 解决了无效链接问题, 找与这一网页相关的网选用原则
1、查找中文学术信息,应专业库少,检索功能 不尽完善。 2、网络检索工具更适用于生活、出行、娱乐、 新闻、自由交流等信息。 3、注意选用政府、教育机构、学术机构等权 威网站的信息。
查询过程简图
中文Google主页1
3
(1) 网页的基本检索
检索功能
进入Google主页后就自动进入基 本检索界面,只有一个简单的提问框, 比较直观、简单。在检索框内输入提 问词后就可以直接获取检索结果。
的基本检索规则(1)
逻辑与:无需用and,空格表示,不超过10个 检索词 白血病 骨髓移植; 肝肿瘤 护理; 逻辑或:OR必须大写 非小细胞肺癌 OR 肺结核 逻辑非:用-表示,但减号之前必须留一空格。 肝炎 –动物 对大小写不敏感
例1:查生物芯片在基因表达水平方面的应用
先输入“生物芯片”
基本检索结果
点击“在此搜索结果内再搜索”按钮
再输入“基因表达水平”
二次检索结果
(5)学术信息的检索
学术搜索—Google Scholar
通过互联网方便获取学术信息的渠道之一 信息来源:学术著作出版商、专业性社团、预 印本、各大学及其他学术组织的经同行评论的 文章、论文、图书、摘要等 按相关度排序,考虑全文、作者、出版物及被 引情况,采取自动分析与抽取引文的方法 外文学术资源:与PubMed等数据库合作 中文学术资源:我国万方和维普两家公司已与 Google合作,期刊全文数据库的信息资源可以 检索
例:通过“手气不错”按钮可以 直接定位到“中山大学”的主页
Google搜索: 显示所有相关网页 的网址
直接定位并显示专 指网站的主页
―Google搜索”的结果
Google搜索: 显示所有相关网 页的网址
―手气不错”:自动进入专指 网站的主页,将完全看其它 的搜索结果
(4)网页的二次检索
即在检出结果的范围内,再给予不 同的条件限定,进一步缩小检索范围, 使检出结果更加精确
高级检索结果
过去一年, 的简体中 文网页中,共有 4,880 项符合我 国 SARS疫苗 “临床研究”的 查询结果
来自政府网 站的报道
(3)网页的定位检索
按下“手气不错”按钮将自动进 入 Google 查询到的第一个网页,直接
将用户指引到可能最符合要求的网页,
用户将完全看不到其它的搜索结果。
中文搜索结果、显示格式以及搜 索使用时间的统计 标题下文本:该文本是网页摘要,搜索关键 词以粗体显示。
搜索结果中的不同文件类型
搜索结果1:word文档(doc格式) 搜索结果2:网页版式(html格式)
相似关键词的链接
当前页码
结果1:Word文档格式
结果2:html网页格式
(2)网页的高级检索
的基本检索规则(2)
词组/短语检索:几乎所有检索引擎都支持词 组/短语检索,而且其表达语法也都是用半角 的双引号(“ ”),即如果用半角的双引号 将一个词组或短语括起,系统将检索出与其 完全精确匹配的检索结果。这是提高检索结 果精确度的首选方法。
如“生物医学工程设备 ”
例:查找生物芯片的原理
自动出现的智能 匹配下拉菜单
搜索引擎的分类
收录信息范围不同 检索原理不同
按收录范围划分
综合型搜索引擎 又称通用搜索引擎,是综合性的信息检索系 统,它往往基于检索词去匹配相关的内容。时常 也会因检出内容太泛而无法一一过目。 如:Go根据专业需求,将Internet 上资源进行筛选整理、重新组织而形成专业信息 检索系统,专业针对性较强。 如:医学引擎:Medical Matrix、HealthWeb;地 图引擎;音乐引擎
网络信息资源的特点
数量巨大,增长迅速 内容丰富,形式多样 时效性强,变化迅速 共享性和交互性 结构复杂,分布广泛 动态性强,缺乏管理 良莠不齐
网络检索工具
网络检索工具泛指因特网上提供网页信 息资源检索和网站导航服务的站点,实质是 一种网页或网址检索系统。主要面向互联网 信息检索,并通过Internet来提供服务,通常 又称搜索引擎。当用户输入关键词查询时, 该搜索引擎会告诉用户包含该关键词信息的 所有网址,并提供通向该网址的链接。
中山图书馆联合参考咨询网(免费论文网)
• 国家资助项目 • 联合参考咨询网是我国公共图书馆合作 建立的公益性读者服务网络。可以得到 全国各地图书馆免费提供的电子图书、 期刊论文(中外文)、学位论文、会议论 文以及专利、标准等文献的检索与远程 文献传递服务。 • 有实时咨询和表单咨询等方式 (承诺2 日内给答复) • 需免费注册用户名
因此它的针对性较强,查准率较高,在提供 专业信息资源方面要远远优于综合型搜索引 擎,可以满足用户个性化需求的需要。 医药卫生学专业方面如: Medical Matrix、HealthWeb、BIOME等
内事不决我
一下
―整合天下信息,让人人能获取,使人人都受益” ——Google的使命
高级检索模式通常用填表的方式, 列出众多的可限制条件,供用户构建较
复杂的检索表达式,能更精确地表达用
户的情报需求,返回结果的相关程度更
高。
高级搜 索入口
高级检索页面
相当于AND检索 相当于短语检索 相当于OR检索 相当于NOT检索
将检索结果限定在某一 网站或某一域的范围, 如com,gov,edu等
限定搜索的文件类型
Office文档,如.Xls(Excel文档), ppt(power point文档),doc(word 文档),rtf, pdf文档等。
限定检索时间
时间的限定
限定检索词的搜索位置
结果显示格式
检索词出现在 文件中的位置
例:搜索近1年来我国政府机构在 SARS疫苗临床研究方面的进展情况
学术搜索界面的进入
点击“更 多”进入
点击进入 学术搜索
学术搜索的基本检索界面
学术搜索的基本检索界面 学术高级 检索入口
搜索肝炎的治疗
检索结果
网页或文章标题
仅显示近期 发表的文章 作者及文献出处 被引用次数 该文献多个原 文链接网址
相关网页检索
点击可浏览全文 或下载保存
学术搜索的高在《中华儿科 杂志》上有关小儿癫痫的学术论文
学术高级搜索结果
(6)图像检索
Google共收录互联网上的图像
超过几十亿张,据称是“互联网上
最好用的图片搜索工具”。
图片搜索界面
迪拜 七星级酒店
阿联酋迪拜 帆船酒店
(二)其他搜索引擎
中国人自己的搜索引擎,中文搜索之王
2
的特色
检索响应速度极快,0.5秒内应答 PageRank网页级别技术与超文本匹配分析,客观评价网 Google是目前全球最大 页的重要性,以提供相关性较高的搜索结果 的搜索引擎,因此有人 智能化的“手气不错”功能,直接连接到可能最符合要 说“Google是网络上寻 求的网页,节约时间 找答案的终极杀手” “网页快照”从服务器里直接取出缓存的网页。用不同 颜色标记检索词,很醒目。最好用的图像搜索工具 Google Print计划和Google Scholar计划使互联网用户方 便获取图书馆书目信息及学术机构的学术信息成为可能 提供中文繁简体转换、英文单词解释和网页翻译功能
Internet 上最早的,也是最成功的分类目录
最主要的大型中文分P3下载链接, 建立庞大的MP3下载链接库,可用于 下载英语听力资料及歌曲
综合型搜索引擎
收录的信息涉及多个主题及多种信息类型,
因此,利用它可以查找到几乎任何方面的信息。
它往往基于检索词去匹配相关的内容,所以信
息量大,时常也会因检出内容太泛而无法一一
过目,有时会影响查准率。
如:Go门收集某种类型或某一主题网络信息,