网络环境下分类法主题法一体化的发展[摘要]:文章讨论了分类法和主题法和其在网络上的应用,以及展示了在网络环境下分类法和主题法一体化发展的必然趋势。
1.分类法主题法一体化检索的发展
1.1分类、主题检索语言的特点
将表示各种知识领域(学科及其研究问题)的类目按知识分类原理进行系统排列并以代表类目的数字、字母符号(分类号)作为文献主题标识的一类情报检索语言,亦称分类法。
使用分类检索语言建立的文献情报检索系统能够使检索者鸟瞰全貌、触类旁通,对系统地掌握和利用一个学科或专业范围的知识和情报十分方便、有效。
分类检索语言可分为等级体系分类语言(等级列举式分类法)和分析—综合分类语言(组配式分类法),它们可统称为分类系统1。
体系分类法是一种直接体现知识分类的等级制概念标识系统。
它是对概括文献信息内容及某些外表特征的概念进行逻辑分类和系统排列而构成的2。
组配分类法的构成是基于概念的可分析性和可综合性的。
即一个复杂概念可以分析为若干简单概念(或概念因素),若干简单概念可以综合为一个复杂概念。
等级体系分类语言属于先组式语言,分类体系明显,容易理解,但因其采用列举式列类方法和类目的单线排列方式,所以存在着不能无限容纳概念的局限性和集中与分散的矛盾。
分析综合分类语言就本质而言属于后组式语言,不过通常采取先组散组式的使用方式,它基本克服了等级体系分类语言的缺点,但分类体系不够明显,较不易理解。
1周宁.信息组织(第二版).武汉:武汉大学出版社,2009,35.
2张琪玉. 情报语言学基础(增订第二版).武汉:武汉大学出版社,1997.
使用语词标识的一类情报检索语言,亦称主题法3。
其基本的、共同的特点是:①用自然语言中的名词术语经过规范化后直接作为文献主题标识,直观性好;②按字顺序列排列标识,检索者较易使用;③具有按文献主题(文献所论述的事物)集中文献情报的功能,对有关某一事物的检索效率较高;④用参照系统及其他方法间接显示文献主题概念之间的关系,其系统性不及分类检索语言,对一学科或专业文献作全面、系统的检索比较困难;⑤较接近自然语言,所以较易与自然语言结合使用。
2.网络环境下分类法主题法一体化是必然发展趋势
传统情报检索语言在情报检索中起到语言保证作用,因为它是标引人员与检索人员的共同语言,起到沟通情报的存贮和检索两个过程及标引人员和检索人员双方思想的桥梁作用。
情报检索语言4是根据情报检索的需要而创制的人工语言,专门用于各种手工的和计算机化的文献情报存储检索系统,表达文献主题概念和检索课题概念,亦称文献工作语言。
按其结构原理,可分为分类检索语言(分类法)、主题检索语言(主题法)和代码检索语言;按其标识的组合使用方法,可分为先组式(列举式)语言和后组式(组配式)语言。
目前,网络信息检索工具主要是基于范畴层次的搜索引擎和基于语词层次的搜索引擎。
传统检索语言经过网络适应性改造后,能够成为目前及将来相当时期内最主要、最重要、最有效的网络信息资源组织的方法,依然能为网络信息检索提供语言保证。
2.1 网络环境下的分类法检索语言
网络上现在主要有两类分类体系:一类以传统分类法的简本为结构,类目级别一般为二、
3周宁.信息组织(第二版).武汉:武汉大学出版社,2009,83.
4Daichuan情报检索语言. 2011-06-20 22:31:27
/wiki/%E6%83%85%E6%8A%A5%E6%A3%80%E7%B4%A2%E8%AF%AD%E8%A8%80
三级,基本保留原有体系,主要用于学术性信息资源的组织与查询;另一类是指南型分类体系,其设计主要用于从普通用户出发,用于通用性网络信息资源的组织与查询。
它根据需要,构建新的多维分类体系,揭示多维信息空间联系,适合网络环境,并且积极探索新的改进技术和方法。
尽管类目的划分和设置存在许多不合理的地方,但它多是“应需而生”,具有很强的适应性和实用性。
在相当长的时间内会逐步发展成为通用性网络信息资源组织的主流。
现在网上信息资源中非文献型的信息占的比重越来越大,比如:图形、图像、声音、动画等,分类法独有的聚类功能和代码标识,这在组织和揭示多媒体信息中占有极大的优势;按事物与学科范畴分类组织网上信息资源5,具有层次清晰、逻辑严密、体系稳定等优点,而且符合人们的一般查询习惯,同时不受语种限制,因此分类组织法可能成为新世纪网络信息资源组织、揭示的工具,成为国际通用信息检索语言。
2.2 网络环境下的主题法检索语言
主题法是网络信息组织的另一种主要模式。
在网络信息资源组织中,主题法的使用一般分为两种形式:一种是采用现有的词表包括叙词表和标题表;另一种就是广泛采用关键词法6。
关键词法将信息原来所用的,能描述其主题概念的关键词抽出,不加规范或只作极少量的规范化处理,按字顺排列,以提供检索途径的方法,它是直接使用自然语言的一种方法。
关键词法选词灵活、广泛,适应性强,组织揭示网络信息速度快、专指度高、查准率高,适宜于不同用户层次检索网络信息。
关键词检索已经成为网上绝大多数搜索引擎最重要的检索方式。
5周宁.信息组织(第二版).武汉:武汉大学出版社,2009,62.
6周宁.信息组织(第二版).武汉:武汉大学出版社,2009,117.
2.3 互联网上需要分类查询与主题查询的一体化
网络信息的分类、主题一体化整序,就是既对信息进行分类整词、信息形式特征、信息编码特征等关联起来,从而向用户提供分类主题一体化的检索功能。
所谓分类主题一体化的检索功能,就是用户除了可以独立进行分类检索和字顺检索并随意转换检索方式外,还能通过分类与主题的相互限定改变检索范围,达到最佳的搜索效果。
单一的检索方式即使功能再强,也无法完全满足不同知识背景的网络用户多种多样的查询需要。
在网络信息查询中,分类与主题的一体化结合主要表现在两个方面:
(1)在特定的知识范畴内进行字顺检索
用户为缩小字顺的搜索范围,一般先选择一定的类目,在该类控制下进行主题检索;或者在浏览过程中发现类目关系比较复杂、不易把握时,在该类中转向字顺检索。
这两种不同的思路都是把检索范围控制在一定的知识领域内,达到较精确的检索。
目前少数搜索引擎具备这种由分类对主题检索的控制。
(2)用特定的类限定字顺检索
在进行主题检索时,常使用一定的条件进行限制,以便把检索结果控制在某种范围内。
一是使用信息的形式属性加以限定,例如信息的编码属性(如中文/英文,简体/繁体);信息来源或分布属性(如网站、网址、网页、全文、新闻、中国/台港澳/世界);信息的载体、用途、使用对象等属性(如MP3、图片、软件、硬件、游戏)。
经过这样的限定,就可以过滤掉很多无关的信息,多数搜索引擎都具有这种限定功能。
分类主题自然语言一体化是检索语言发展的重要趋势之一。
分类主题一体化能很好地适应网络环境,可以满足网络用户的多种检索需求,为用户提供经济有效的多种检索途径。
自然语言依然是最优选的检索接口,是用户检索用语言。
三者一体化才能发挥最佳整体效益,满足网络信息检索多方面需求。