当前位置:文档之家› 分类目录用户研究综述

分类目录用户研究综述

分类目录用户研究综述1.分类目录研究现状1.1分类目录的功能和优势网络分类目录是应用分类的方法对巨大的网络资源进行组织和揭示的有效手段。

它可以提供浏览方式的信息查询途径,具有直观、易检的优点。

分类目录的使用,可以使得用户更易查找到所需信息。

分类检索是以分类目录浏览方式提供信息查询途径, 一般称为网络分类目录。

由专家选取一些网页, 以某种分类方法进行组织, 建立主题树分层目录, 并将采集、筛选后的信息分门别类地放人各大类或子类下面, 用户通过层层点击, 随着范围的缩小与查询专指度的提高, 最终满足用户的查询需求。

网络分类目录在检索方面有以下优势:1.分类浏览方式直观。

在检索目的不明确、检索词不确定时, 分类浏览方式更有效率, 适合网络新手。

2.检准率高。

网络分类目录由人工抓取、标引, 网页学术性强, 检索效果好。

另一方面用户参与程度高, 在分类目录的指导下, 逐步明确用户的检索需求, 检索目的性更强更明确, 检索效率提高。

尽管网络分类目录较检索法具有一定的优势, 但是, 要提高检全率、检准率, 采用科学的分类方法是至关重要的。

分类标准是提供优质检索服务的重要保障。

1.2 中文搜索引擎分类目录状况目前中文搜索引擎有70多种。

其中, 只有“网络指南针”是采用《中图法》建立网络目录的。

目前也只有两级类目的框架、内容不够丰富, 其他的中文搜索引擎都是自编的网络分类目录。

由于缺乏统一的网络信息分类标准, 各搜索引擎的分类体系无法兼容, 用户检索需要适应各个搜索引擎不同的网络分类方法。

例如, 搜狐的分类目录包括18个大类.从这些搜索引擎网站分类目录状况可以得出以下结论:1.网上搜索引擎应用的分类方法较文献分类法检索有其优越性。

2.在分类体系上, 采用以主题、事物为主的聚类方法, 替代了以学科为中心的聚类方法。

即围绕某一主题、某一事物集中关于这一主题、这一事物的相关信息。

例如, 在“雅虎”分类目录中查找“因特网”方面的信息,进人“电脑与因特网”下的“因特网”二级目录即可获得有关该方面的所有网站信息。

显然, 这种按主题、事物聚类的方法, 对于用户按类检索特定主题特定事物的信息更方便直接。

直接用自然语言中的语词作为信息查询和检索的标识。

由于搜索引擎分类目录没有严密的体系结构和人为标记符号,而采用的是超文本链接技术,使得类目设置较为灵活,一方面同一事物可以在多个类目下重复列出,另一方面可以根据需要随时添加新的类目, 例如较“雅虎”在“政府与政治”类目下设“十六大”二级类。

3.类目设置体现了以用户为中心,以人为本的理念。

网络搜索引擎不刻意追求理论上的严谨性,体系上的科学性以及结构上的严谨性类目设置以尽量适合用户需求为目的,大多根据信息量与特定信息的被访问率来确定类目的序列顺序及类目级别。

类目名称多是学科名词与主题词相结合的产物。

这种列类顺应了网络信息的特征。

自然语言作为类目名称迎合了绝大多数网络信息用户的需要,直观易懂。

如与经济学有关的内容在中文雅虎、搜狐等搜索引擎中都采用“商业与经济”、“金融与投资”等老百姓常用的语言,日常热点的“娱乐”、“健康”、“旅游”等占明确的一级类目,充分体现了网络分类目录自由灵活的特点。

1.3 搜索引擎分类目录不足之处1.不同的搜索引擎分类方法不同,缺乏统一的分类标准,分类体系无法兼容, 令用户无所适从。

例姐“图书馆”在雅虎中被列在“参考资料”类下,而在搜狐中“参考资料”则列在“教育与培训”类下,“图书馆”属于三级类目。

这种分类标准不统一的情况,造成用户使用不同的搜索引擎感到无所适从,影响检索效率。

2.分类体系缺乏科学性。

网络信息分类体系与学科及知识之间缺乏必要的内在联系。

往往为了迎合大众口味生造类目, 破坏了知识体系的完整性。

3.类目划分标准模糊,类名表述不统一。

如雅虎中的“人文与艺术”与“社会文化”、“社会科学”概念兼容,且为并列关系,不遵循学科之间关系,类目划分随意性大, 用户很难区别它们之间的划分标准,检索极为不便。

4.类目设置方面。

类目的设置忽视知识体系的完整性关联性、逻辑性,导致类目之间逻辑关系混乱。

首先, 大类设置不科学。

由于搜索引擎分类人员缺乏必要的学科分类知识,只是为一般用户的使用而设计,例如网易共设18个大类,将“情感绿洲”“少儿乐园”等列为基本大类,而“哲学”、“社会科学”却在大类中没有位置。

这种大类设置方法, 对于科学研究人员从学科角度检索非常不便。

其次, 类目设置不够全面, 涵盖面窄。

目前, 搜索引擎类目最多也只有几百个, 难以反映学科发展全貌。

、系统性。

体现在网络信息的分类体系对知识以及学科覆盖不到位, 用户使用网络分类门录进行检索时常感到部分信息难于归类。

2.用户研究现状2.1网络目录的分类通常采用2种方法,一是套用成熟的、权威的图书资料分类法,一是自行设计分类法。

图书分类法:1.杜威十进制分类法DDCDDC首创于1876年,1996年发行第21版。

DDC是世界上使用最广泛的图书分类法,现有一百多个国家的图书馆使用DDC,被翻译成30多种语言。

网络上的分类目录利用DDC作为分类体系始于1995年。

现已有多个网站的目录以DDC 为分类体系,这些网站以图书馆和大学为主。

利用DDC比较成功的综合性网络目录有加拿大图书馆的“Canadian Information by Subject”。

较好的专题性网络目录有英国Wales Aberystwyth大学Thomas Parry图书馆的“PLCK”,是针对图书情报学资源。

另有一些特色站点是,“GNOSIS”、“CyberDewey”、“WWLib”、“Sized”等。

2.国际十进分类法UDCUDC由6万多个类目构成,并提供多种复分表,在满足文献资料细分方面有独到优势,它具有分面组配分类法的一些特点,通过符号组配可以获得概念的组合,因此,这种分类法较适合机检。

一些网站目录利用了UDC的这些优点,建立起了自己的分类系统。

例如,“BUBL Subject Tree”,覆盖了英国国内综合性网上资源;“GERHARD”,这个项目于1996年在德国Olden Burg大学图书馆开始研究,目标是建立全德国网上资源的检索和浏览工具,它利用了自动分类技术,网页由机器人程序自动采集,凡匹配UDC类目的网页,由计算机建立索引,并自动生成目录树;NISS,综合性网络目录,类目前标有UDC分类号;SOSIG,一个有关社会科学的网络目录,它只选用了UDC的社会科学部分的分类号,共有26个类号。

3.国会图书馆分类法LCCLCC创建于1899年,是世界上容量最大的图书分类法,也是使用最广的分类法之一。

使用LCC的网络目录有“CYBERSTACKS”,主要提供6大部类的资源,用LCC分类号表示就是Q(科学)、R(医学)、S(农业)、T(工业技术)、U(军事科学)、V(海洋科学);“The WWW Virtual Library”,采用了LCC体系组织信息,但信息量少,只有一层类目。

自行设计的分类目录:1.网络目录使用的分类法尽管有如上所说的机构在其网站设计上会使用图书馆的分类法,但是目前的大多数网站都是自行设计网站的分类目录。

强自力在其《网络分类目录及其分类法》中对网站中自行设计的分类法做了总结,认为网络目录使用的分类法可以总结为:(1)主题法,主题分类法的特征是一个主题充当一个类目,类目像主题词表一样按字顺排列,而不是以逻辑顺序排列。

一个类目又可以分为若干细目,同位类的细目也是按字顺排列,这种分类法实质上是分类法和主题法互相融合的产物。

主题分类法的优点是以事物分类,和此事物相关的内容全部集中在一起。

但主题分类法容量太少,对网络资源的覆盖率极为有限。

(2)学科分类法,学科分类法比主题分类法有更大的容量,但要选择内容好的网页来充实这个框架,仅仅靠几个编辑人员是不行的。

所以,这种分类法以用户提交的或推荐的方式建立分类系统。

(3)分面组配法,分面组配的原理是,首先确定几个分类标准,即分面,再确定每个分类标准中的若干特征值,即类目,每一分面的类目与其它分面的类目分别组配,形成许多组配类目,达到细分的目的。

不难看出,目前各大网站自行设计的网络分类目录还是存在着很多问题的,谢茹凡在《中文网路分类目录分析与研究》中,罗雪英、陈代春在《网络信息分类的现状与展望》中都对这些问题做了总结,大致有以下几方面:分类体系结构不科学,不严谨,大类的设置随心所欲,导致许多遗漏,许多内容无类可归。

例如中文雅虎有14个主题大类,搜狐有16个,新浪有18个,分类类目的层次越低,类目差异越大。

分类体系的不统一、不兼容,既不利于网路信息资源的共享,更不便于用户对信息的多站查询和利用。

类目之间逻辑关系混乱,同位类之间界限不明。

如把“人文科学”与“社会科学”作为同位类。

上下位类目之间更无规律,如网易在文学类下列出了历史和宗教等等。

类名不规范,如“电脑”与“计算机”是同等概念,应该统一命名。

还有些类名意思含糊不明确。

2.2提高网络分类目录质量的一些建议针对网站分类目录存在的这些问题,一些学者提出了一些建议:如,谢茹凡在其《中文网路分类目录分析与研究》中指出应该提高目录编制人员的素质。

现有的网络分类体系多是由计算机技术人员编制的,他们的优势是计算机技术,对网络信息和用户需求都比较了解,因而设计出的分类体系具有较好的实用性,但他们缺少分类学、情报检索语言等相关知识,使得所编制的分类体系有一些不足。

因此科学实用的网站分类体系的建立应该由图情专业人员、信息管理专业人员与计算机、网络技术人员共同参与完成,优势互补。

而更多的学者则认为应该建立一套相对规范的可操作的分类目录体系。

如张琪玉教授提议:“可以定一个统一的分类框架,类目在1000个以内……允许使用者做局部增删和修改”。

而也有学者对此持保留意见。

如张马华教授认为:“目前,网络信息资源正在发展变化中,网络分类体系和技术方法还处在逐步探索和改进之中,各种实际的分类搜索引擎仍在不断调整变化……试图在现在建立标准化的网络分类体系,规范网络资源的使用,显然是不现实的”。

而有些学者则建议可以将网络信息分类法的标准确定在基本编制原则及方法的层次,达到分类方法和基本规范上的统一。

2.3网络分类目录的发展趋势目前计算机网络技术正在迅猛发展,网络分类目录的发展也呈现出一定的趋势,具体表现在:编制机构协作化,各网络公司与图书馆合作编制分类目录,以提高网络分类目录的规范;类名语言自然化,用户是通过类名来识别和选择检索路径的,因此,类名应该正确反映类目的内涵和外延。

在传统分类法的设计中,一些转接盒学者十分强调类名的科学性和专业性,却忽略了用户的利益。

而在当今的环境下,用户的利益越来越受到重视,这就使得在编制类名时,可以在保证类名基本规范的前提下尽量使类名语言自然化;类目排列标准化,如上文所提到的,目前大多数网站类目的设计都很混乱,各个网站的分类目录差异很大,这给用户带来了极大的不便。

相关主题