当前位置:文档之家› 文献检索三大数据库比较

文献检索三大数据库比较

CABI、 AGRICOLA和 AGRIS数据库比较研究王国龙李佩朱海燕( 上海交通大学农学院图书馆201101)文AGRICOLA 和摘本文对美国银盘公司检索系统 webspirs 下的 CABI、AGRIS三个数据库从文献收录数量、质量、语种和重复情况等方面进行比较研究,对选择订购和文献检索有一定的参考价值。

关键词农业数据库农业文献文献检索CABI AGRICOLA AGRIS国际农业生物学文摘 CABI、粮农组织农业索引 AGRIS和美国农业联机检索数据库 AGRICOLA是世界著名的三大农业数据库,其收录的文献涵盖农业所有学科及其相关学科,是农业科学研究和教学重要的文献源。

本文对美国银盘公司检索系统 webspirs 下的三个数据库从文献收录数量、质量、语种和重复情况等方面进行比较研究。

1三大数据库收录的文献量比较采用植物、动物、饲料、肥料和灌溉五个主题词对五类有代表性农业文献进行检索,其结果见表 1。

表 1三大数据库收录的五类农业文献总量(1990-2000)类型 CABI%AGRICOLA %AGRIS%合计%植物 59088654.7011909111.0337018334.271080160100动物 45984756.8837855 4.6831080538.44808507100饲料 7098552.381399310.335054537.30135523100肥料 7091957.92111199.084039733.00122435100灌溉 3104651.55769112.772148535.6860222100总计 1223673 55.451897498.6079341535.952206837100由上表数据可见 CABI所收录的各类文献数量最多,达到,AGRIS其次,为, AGRICOLA最少,仅。

以上是三大数据库 1990-2000年数据,检索自中国农业大学图书馆银盘数据库系统。

如果对该数据库系统三大数据库所收录的上述五类文献总数进行统计,则得到如下结果:CABI(1999-,AGRICOLA(1984-,AGRIS(1975-。

由于在调查的数据中AGRIS收录文献的年限远远大于 CABI 和 AGRICOLA,因此,其文献总量超过了 CABI而位居首位。

由此可见,AGRIS在文献收录的系统性方面较强,而CABI 在最新文献的收录方面拔得头筹。

从定量的角度来看两者各有千秋, AGRICOLA则略输一筹。

2三大数据库收录文献的语种比较对三大数据库所收录的动物与植物文献的语种情况调查表明,其收录的文献主要为英语、法语、德语、汉语、日语、俄语、西班牙语和意大利语,这 8 种文献占总数的 95%以上,其中英语文献数量最多,所占比例为 69%到 88%,其中 AGRICOLA 9 ,,。

中文文献在 CABA中的占有量仅次于英语占第二位,在AGRIS和 AGRICOLA中分别占第六位和第七位 ( 见表2 和表 3)。

由表 2 可见:在三大数据库中各主要语种文献前五名分别为, CABI:英语、汉语、德语、俄语和法语, AGRICOL:英语、法语、俄语、日语和德语,AGRIS:英语、法语、德语、西班牙语和汉语。

总排名顺序为:英语、德语、法语、西班牙语和汉语。

3三大数据库文献类型比较对三个数据库的文献类型的调查发现,三个数据库在文献类型的收录上有共性,但各具特点。

如对三数据库1992-1997 年所收录的有关植物与植物科学的文献调查发现, AGRIS、CABI和 AGRICOLA所收录的文献中,期刊文献均占首位,其比率分别为、和见表3)。

但其他文献的收录无论从种类还是比率上均有显著的差异。

如从文献收录的种类来看, AGRICOLA 最多达 32 种,其次是 AGRIS的 24 种,CABI最少为 12 种。

从收录文献的主要类型来看,除期刊外, AGRICOLA主要收录单行本、书目,此外也收录一定量的会议文献,AGRIS主要收录单行本、会议文献和书目文献,也收录一定量的学位论文、地图、技术报告等,CABI收录的会议论文和图书较多,此外也收录一定量的技术报告和专利文献 ( 见表 3) 。

由表 3 可见,各数据库所收录的文献具有一定的特色,如 AGRIS的地图,CABI的图书等,从而为数据库的选择与使用提供一定的依据。

表 2三大数据库收录主要语种文献情况数据库CABI AGRICOLA AGRIS学植动植动植动科物物物物物物英48476038143419471668817419479383164语法1332614569841418943587348708语西班牙语148251064027529822572445377德1578023534388916133571143177语意大利语900776433177394058544汉31905116507531962661015064语日12905668917055622345110318语俄1917910599556212661031811553语合60168746675821657380403586571565905计表 3三大数据库主要文献类型排序数据库AGRIS CABI AGRICOLA类型文献数比率排文献数比率排文献比率排量序量序数量序期刊论文16500670.43121288486.9917680490.331会议论文211489.0332467410.0826510.774单行本3459814.762———4261 5.012书目文献8278 3.534———3196 3.763图书———5528 2.263———技术报告4140.18610580.43450.017学位论文3870106571780.076———专利文献800.0393110.135———标准文献1040.048780.037———地图 7600.325———90.016辞典手册320.0110———960.115合计 234290100244711100850221004三大数据库文献重复情况调查在实际使用中我们发现,三大数据库所收录的文献都存在一定程度的重复。

为此,我们对该数据库文献的重复情况进行了抽样调查。

调查对象为植物科学、动物科学和环境科学三个主要农业学科,每个学科选择五组词汇用布尔逻辑符 and 组配,对三个数据库分别进行检索,检索词限定范围为标题title,检索年限为 1995-1999 ,然后对检索结果进行比较,其结果如下。

由表 4 可见,各不同学科之间的文献的重复量和重复率具有显著差别。

,在三个学科中动物科学重复率最高,达,其次是植物科学,环境科学最低,仅,还不到动物科学的一半。

虽然,此差异可能与所抽取的样本量较小有关,但在不同学科文献之间的重复量和重复率上存在较显著差异是显而易见的。

不同数据库中和数据库之间的文献重复量和重复率也均存在显著差异。

由表 4 和表 6 可见,重复率最低的是CABI,为 36%,其中与 AGRICOLA重复 25.48% ,与AGRIS重复 22.58%;其次是 AGRIS为 40.70%,其中与 CABA重复 35.18%,与AGRICOLA重复 24.62%;最高的是 AGRICOLA,达 63.27%,其中与 CABA重复 53.74%,与AGRIS重复33.33%。

此外三个数据库之间完全重复率也因学科与数据库有一定差异。

由于三大数据库覆盖了几乎全部世界农业文献,我们可以得出结论,CABI 的文献覆盖率达 64%,AGRIS为 59.3%,而 AGRICOLA仅 36.7%左右。

表 4三大数据库中不同学科文献重复情况学科CABI AGRICOLA AGRIS文献重复比率文献量重复比率文献重复比率量量量量量植物科学1173630.77322371.88512549.01动物科学1025856.86665278.79593661.02环境科学912021.98491836.73892022.47合计31011436.771479363.271998140.70表 5三大数据库之间的文献重复情况数据库CABI AGRICOLA AGRIS重复量重复 %重复量重复 %重复量重复 % CABI——7925.487022.58 AGRICOLA 7953.74——4933.33 AGRIS7035.184924.62——表 6三大数据库中各学科文献完全重复情况学科CABI AGRICOLA AGRIS文献重复比率文献量重复比率文献重复比率量量量量量植物科学1176 5.1332618.7551611.76动物科学1022221.57662233.33592237.29环境科学916 6.5949612.24896 6.74合计 3103410.971473423.131993417.095结果与讨论5.1 从三大数据库收录的文献数量来看, CABI和 AGRIS较多,AGRICOLA较少;从质量来看, CABI以收录报道性文摘为主,报道 - 指示性文摘为辅,文献质量较高;AGRIS文摘与题录并重,辅以英、法、西班牙三种文字主题词,与前者相比也各有千秋; AGRICOLA则以题录为主,并附主题标识词,因此略逊一筹。

5.2 三大数据库收录的文献语种情况英语占大多数,其中以 AGRICOLA收录的英语文献最多, CABI和 AGRIS所收录的其他语种文献相对较多,体现出一定程度的国际性,其中 CABI 收录的汉语文献较多, AGRIS收录的法语文献较多。

5.3 三个数据库所收录的文献类型以期刊为主,但比率不同,其中以 AGRIS 收录的期刊文献比率最低,其收录的文献呈多样性,除期刊论文外,还包括会议论文、单行本、书目、学位论文、技术报告和地图等; CABI收录的文献种类较少,除期刊论文外,主要有会议论文、图书、技术报告和专利文献等; AGRICOLA 虽然收录文献种类最多,其中 90%以上是期刊论文,此外是单行本、书目文献和会议文献,其它文献如手册、词典、百科全书等参考工具书,虽然是其特色,但数量较少。

5.4三大数据库所收录的文献都存在一定程度的重复,重复率随数据库和学科类型而异,通常在 20-60%。

根据抽样调查,其总体重复率约为 40-50 ,其重复的主要部分是期刊文献,导致其重复的原因是三个数据库重复收录核心期刊的文章。

从文献保障率角度出发,CAB最佳,可达65%左右,AGRIS其次,为60%,AGRICOLA最次,约 40%左右。

5.5 根据以上调查,我们可以得出如下结论:虽然三大数据库各有特色,但从所收录文献的数量、质量、类型和文献满足率、保障率等方面综合评判,其排序为 (1) CABI ; (2) AGRIS ; (3) AGRICOLA。

相关主题