当前位置:文档之家› 第5章第1节-数字化报刊资源及其检索系统

第5章第1节-数字化报刊资源及其检索系统

第五章报刊资源与论文资料的查考第一节数字化报刊资源及其检索系统20世纪90年代中期以来,中国报刊资源及其检索工具数字化、网络化的进展迅速。

具体表现,一方面是一些传统的、影响大的印刷版报刊资源检索工具大都实现了数字化、网络化,形成了电子版与印刷版并存的局面;另一方面,出现了一批脱离印刷形态而基于计算机和网络环境的报刊资源检索系统。

到目前为止,查考20世纪80年代以后的中国报刊资源,完全或主要依靠电子版检索工具已经基本上可以满足需要。

一、中国期刊全文数据库(CJFD)清华大学开发研制的“中国期刊全文数据库”是目前国内有代表性的报刊资源检索系统之一。

该系统1996年开始投入使用,目前有光盘版(简称“CAJ—CD”)和网络版(简称“中国期刊网”)两种形式。

全文数据库收录国内6000多种核心与专业特色中英文期刊的全文。

到2004年初,已经积累了1994年至今的全文文献800多万篇,题录1500万余条,分9大专辑,126个专题文献数据库,被称为是“目前世界上最大的连续动态更新的中国期刊全文数据库”。

全文数据库的网络版通过CNKI知识网络服务平台系统建立了中国期刊网镜像站点,经过授权后,为通过互联网的使用者提供网上检索服务。

网络版数据每日更新。

全文数据库的光盘版每月每专辑出版一期(文史哲双月出版),与印刷版期刊基本同步发行,被称为是“当今世界上最大的集成化全文电子期刊”。

中国期刊全文数据库划分的9个专辑是:·理工A辑(数理科学)·理工B辑(化学化工能源与材料)·理工C辑(一般工业技术)·农业辑·医药卫生辑·文史哲辑·经济政治与法律辑·教育与社会科学辑·电子技术及信息科学辑中国期刊全文数据库网络版的基本使用方法是:论文资料检索→论文资料下载→使用专用阅读器阅览。

数据库的主要功能包括:(1)基本检索以字段词作为检索词进行检索。

该数据库系统目前为文献确立的字段包括:·篇名·作者·关键词·机构·中文摘要·引文·基金·全文·中文刊名·ISSN ·年·期·主题词在进行基本检索时,可以作两方面的限定:一是检索时限限定(1994年~目前),二是检索结果的排序方式限定。

排序方式有3种:一是不限定排序方式,二是限定按相关度排序,三是限定按文献的发表时间排序。

三是每页记录条数的限定,即对显示界面容纳内容的限定。

检索结果可以直接显示的,首先是命中文献的题名列表;点击题名,可以直接显示文献的内容提要。

若要阅读全文,需要点击文献提要栏内的“下载”标记,将文献下载保存到计算机磁盘,在计算机已安装专用阅读器阅读“Cajviewer”的情况下(专用阅读器可以随时下载安装),便可即时阅读。

例如,查考张岱年先生发表的有关“国学研究方法”的论文,基本过程如图5.1.1。

(2)类聚检索数据库中与命中文献有相关关系论文的链接检索。

包括:·同类文献。

数据库中与命中文献性质相同的论文。

·引用文献。

命中文献引用过的数据库中的文献。

·被引用文献。

命中文献被数据库中的文献引用的情况。

图5.1.2是《经济全球化与中国文化发展的道路》一文的同类文献检索结果。

类聚检索功能的设立,为相关文献源的拓展和文献的定量分析提供了方便。

(3)二次检索以字段词在检索结果中进行再次检索。

在上面的图 5.1.1中,以作者“张岱年”、时间“1994~2004”为检索条件,命中结果有91篇文献。

在这一结果中,以“国学”为篇名字段词进行二次检索,命中的结果缩小为3篇。

查准率大为提高。

(4)高级检索该系统的“高级检索”即布尔逻辑检索,可以进行不同字段检索词的逻辑“与”、逻辑“或“、逻辑“非”的组配检索。

图5.1.3以相同的字段检索词进行了不同的逻辑组配,检索结果不一样。

(5)全文检索以任意词为检索词对数据库中所有文献全文的检索。

全文检索可以在基本检索界面内进行,也可以将检索条件组配起来在“高级检索”界面内进行。

图5.1.4是将全文任意词“天人合一”、“机构”字段词“北京大学”和“中文刊名”字段词“北京大学学报”以逻辑“与”组配以后进行检索。

图5.1.3(6)检索词字典在高级检索界面提供作者、关键词、机构、基金、中文刊名、主题词6个检索词字典。

检索词字典是具有检索功能的检索词列表。

它将数据库收录的文献的相关字段按一定顺序加以排列,并具有快速检索和自动添加到检索界面的功能。

使用检索词字典,便于浏览数据库包含的相关检索词,也便于准确选择、快速添加需要的检索词。

如图5.1.5 是在“关键词”检索词字典中检索与“信息检索”相关的关键词。

如果确定用于检索的关键词是“社科信息检索”,只要点击该词,则自动切换到高级检索界面,并且检索词被自动添加到相应的文本框内。

图5.1.4图5.1.5二、中文科技期刊全文数据库这是国内另一个有代表性的大规模数字化期刊全文检索系统。

由重庆维普资讯公司开发,习惯上简称为“重庆维普”。

重庆维普资讯有限公司是科技部西南信息中心下属的一家大型的专业化数据公司,是我国较早开展中文资源数据库研制开发的单位之一。

早在1989年,重庆维普就开发出了软盘版的“中文科技期刊数据库”,90年代初,实现了产品的光盘化,90年代末又推出了网络版产品。

目前,数据库产品有有全文版、文摘版和引文版3种。

中文科技期刊全文数据库入库期刊达8000多种,涉及的时限从1989年开始至今,积累的数字化期刊文献近800万篇。

数据库覆盖的学科范围,分为自然科学、工程技术、农业科学、医药卫生、经济管理、教育科学和图书情报7个专辑,27个专题。

专题细目如下:该数据库的主要特点是,入库期刊数量多,时间跨度长;覆盖的学科范围以自然科学、工程技术、管理学科为主;不能提供全文数据的资源较同类数据库相对较少。

数据库的使用方法和“中国期刊网”基本相同,也是需要安装专用阅读器才能进行全文阅读。

数据库的主要功能和使用方法如下:(1)分类检索该数据库有比较强大的分类检索功能。

分类表镶嵌于数据库首页。

点击类目名称,分类体系逐层展开,直至相应的篇目列表。

(2)高级检索即不同检索字段的逻辑组配检索。

可选字段共有9个,分别是:关键词、刊名、作者、第一作者、机构、题名、文摘、分类号和任意字段。

同时可以进行检索限定,包括学科范围限定、期刊范围限定(“全部期刊”、“重要期刊”或“核心期刊”)、查找时限限定。

高级检索是该数据库的主要检索途径。

(3)传统检索在中文科技期刊全文数据库中,所谓“传统检索”实际上是一个具有综合检索功能的界面,如图5.1.6。

在这个界面中,单个检索词的简单检索、多个检索词的逻辑组配检索、二次检索等都可以进行,也可以进行期刊范围、检索时限的限定。

值得注意的是以下3种检索方法。

·整刊检索即以刊物为单位,查考该刊物每一期所发表的文章。

通过点击“中刊库分类导航”和“中刊库刊名导航”列表,都可以实现这一功能。

这一功能,为了解某一刊物的整体面貌提供了方便。

·关键词字段的同义词扩展。

在“检索入口”选择“关键词”字段的前提下,选中“同义词”选项,如果数据库的同义词表中有该检索词的同义词,就会自动显示,供选择添加。

如图5.1.7,输入的关键词是“电脑”,显示的同义词是“计算机”、“微电脑”,选择添加“计算机”,查考结果就是数据库中所有关键词包含了“电脑”和“计算机”的文献。

关键词的同义词扩展,是实现智能化检索的重要手段,对确保查全率有重要意义。

图5.1.6·作者字段的同姓名区分。

这一功能的原理与同义词扩展类似,是用来对数据库中涉及的同姓名作者加以区分的。

在“检索入口”选择“作者”或“第一作者”的前提下,选中“同名作者”选项,如果输入的作者有同名,系统自动显示同名作者列表,以供选择。

如图5.1.8,是名为“张红”的同姓名作者列表。

通过列表提供的作者单位信息,就可以准确地选择目标作者。

这一功能对缩小检索范围、提高查准率有重要意义。

图5.1.8三、CGRS全文检索系统天宇资讯开发的“CGRS全文检索系统”是以中国人民大学书报资料中心编辑的《复印报刊资料》和《报刊资料索引》为主要内容的网络版报刊资源检索系统,习惯上简称为“人大报刊检索系统”。

复印报刊资料是一种在国内人文社科领域影响较大的报刊资源检索工具。

目前选收范围为全国3000多种公开出版发行的报刊,划分为100多个专题。

印刷版按专题主要以月刊和双月刊的周期出版。

《复印报刊资料》的内容是分专题选录报刊论文的原文和篇目出处。

“原文”部分,全文影印各专题范围内的重要论文和重要动态,提供经过选择的原始文献。

选择的基本标准是:含有新观点、新材料、新方法,或具有一定的代表性;反映学术研究或实际工作部门的现状、成就及其发展。

“篇目”部分,全面汇集专题范围内报刊资料的篇目出处,提供的是经过编辑的二次文献。

与同类印刷版检索工具相比,《复印报刊资料》具有鲜明的特点。

在内容上,偏重选收学术性、理论性的资料信息;在编辑形式上,一次文献和二次文献相结合,对研究需求的满足程度较高;专题划分精细,具有较强的针对性。

目前,被《复印报刊资料》全文选收,已经成了国内学术界评价论文质量的基本指标之一。

报刊资料索引是一种以年度为单位分类揭示报刊论文资料出处的线索型检索工具。

它和《复印报刊资料》关系密切——包括了《复印报刊资料》全年各期全文复印及仅列论文篇目出处的全部篇目;但又不完全相同——《报刊资料索引》还收录了《复印报刊资料》限于篇幅而未能反映的篇目。

所以,《报刊资料索引》所揭示的篇目总数大于《复印报刊资料》年度各期篇目之和。

印刷版的《报刊资料索引》按学科、专题分7册编辑出版,另有著者索引1册。

网络版“CGRS全文检索系统”中的“人大全文数据库”是《复印报刊资料》的数字化形式,截至2004年初,收录1995年~2003年间的全文文献近20多万篇;“人大索引类”数据库是《报刊资料索引》的数字化形式,截至2004年初,收录1978年~2002年间的论文题录280多万条。

除上述两部分主体内容外,该系统平台还包括了如下几种数据库:·中国法律法规数据库,收录法律、法规、规范性文件5万多件;·诉讼法索引及全文数据库,收录文献2万多篇;·民事诉讼法学数据库,收录文献600多篇;·中国法律年鉴1987—2002年卷全文数据库;·《文史哲》杂志1951—2002年全文数据库。

CGRS全文检索系统的基本查询是以任意词作检索词进行全文检索,检索的对象数据库可以根据需要选定。

图5.1.9是基本查询的一个过程。

相关主题