第二章 检索基础知识
著录:对具体文献 著录: 的各种形式特征、 的各种形式特征、 内容特征及物质形 态等分行分析、 态等分行分析、选 择和记录的过程. 择和记录的过程
完成著录的过程 叫作”标引” 叫作”标引”。 通过标引, 通过标引,各种目 录、索引等检索 工具才能编成; 工具才能编成; 各种标引词存储 于计算机中, 于计算机中,才 能实现文献的检 索
中国古代图书六分法
西汉末年刘向、刘歆父子校书秘阁, 西汉末年刘向、刘歆父子校书秘阁,编撰了我国第一部综合 性目录—— 七略》 ——《 七略》实际上是把当时的图书分为6 性目录——《七略》。《七略》实际上是把当时的图书分为6类, 这就是所谓的“六分法” 类之下再分种,一共38 38种 这就是所谓的“六分法”。类之下再分种,一共38种: 六艺略”分易、 春秋、论语、孝经、 (1)“六艺略”分易、书、诗、礼、乐、春秋、论语、孝经、 小学9 小学9种。 (2)“诸子略”分儒、道、阴阳、法、名、墨、纵横、杂、农、 诸子略”分儒、 阴阳、 纵横、 小说10 10种 小说10种。 诗赋略”分屈原赋之属、陆贾赋之属、孙卿赋之属、 (3)“诗赋略”分屈原赋之属、陆贾赋之属、孙卿赋之属、杂 歌诗5 赋、歌诗5种。 兵书略”分兵权谋、兵形势、( 、(兵 阴阳、兵技巧4 (4)“兵书略”分兵权谋、兵形势、(兵)阴阳、兵技巧4种。 术数略”分天文、历谱、五行、蓍龟、杂占、形法6 (5)“术数略”分天文、历谱、五行、蓍龟、杂占、形法6种。 (6)“方技略”分医经、经方、房中、神仙4种。 方技略”分医经、经方、房中、神仙4
标引方式:分类、主题(受控词、自由词)、自动、 标引方式 分类、主题(受控词、自由词)、自动、名称标引等 分类 )、自动
2.2.1 分类语言
分类法是按信息资料内容的学科知识属性 分门别类来系统标示和组织信息资料, 分门别类来系统标示和组织信息资料,并 用分类号表达文献主题概念的方法。 用分类号表达文献主题概念的方法。
分类标识系统的特点
(1)分类法具有较强的系统性。 (1)分类法具有较强的系统性 分类法具有较强的系统性。 (2)分类法便于浏览检索。 (2)分类法便于浏览检索 分类法便于浏览检索。 (3)分类法提供对非文本信息的组织。 (3)分类法提供对非文本信息的组织 分类法提供对非文本信息的组织。 (4)检索语言的通用性。 (4)检索语言的通用性 检索语言的通用性。
1.目录 )——它主要用于反映文献的出版情况或收藏情况。 它主要用于反映文献的出版情况或收藏情况。 1.目录 ( catalog ) 它主要用于反映文献的出版情况或收藏情况
目录是对一批相关文献外部特征的揭示和报道。 目录是对一批相关文献外部特征的揭示和报道。通常以一个完整的出版或收藏单位为 一批相关文献外部特征的揭示和报道 著录的基本单位来报道和记录文献。只记录文献外部特征(如名称,著者, 著录的基本单位来报道和记录文献。只记录文献外部特征(如名称,著者,出版事项 )。目录一般按分类或字顺编排 目录一般按分类或字顺编排, 等)。目录一般按分类或字顺编排,主要供人们了解出版或收藏机构是否拥有所需图 期刊等出版物。 书、期刊等出版物。
Y
如:论资产者在市场经济初期的作用 论资产者在市场经济初期的作用
受控标引:资产阶级 市场经济 受控标引 资产阶级-市场经济 资产阶级 自由词标引:资产者 资产者-市场经济 自由词标引 资产者 市场经济
问题: 问题:两种不同的标引方式会 检索语言
中国图书馆图书分类法 中国科学院图书馆图书分类法 中国人民大学图书馆图书分类法 美国国会图书馆分类法 杜威十进位分类法
《中国图书馆分类法》 中国图书馆分类法》
K
历史、 历史、地理
K81 传记 K811 K82 K825 K825.1 K826.1 K833∕ K833∕837 世界人物传记 中国人物传记 人物传记: 人物传记:按学科分 哲学、 哲学、社会科学 自然科学、工程技术 自然科学、 各国人物传记
《杜威十进分类法》 ( DDC ) 杜威十进分类法》
1873年美国图书馆学家杜威所创, 1873年美国图书馆学家杜威所创,目 年美国图书馆学家杜威所创 前该分类法已经被翻译成30多种语言, 30多种语言 前该分类法已经被翻译成30多种语言, 在全球超过135 135个国家的 20多万个图 在全球超过135个国家的 20多万个图 书馆使用,在美国,95%的公共图书馆 的公共图书馆, 书馆使用,在美国,95%的公共图书馆, 25%的学院图书馆大学图书馆以及 的学院图书馆大学图书馆以及20% 25%的学院图书馆大学图书馆以及20% 的专门图书馆使用该分类法。 的专门图书馆使用该分类法。
2.2.2 主题语言
主题是一组具有共性事物的总称,用以表达文 主题是一组具有共性事物的总称, 献所论述和研究的具体对象和问题, 献所论述和研究的具体对象和问题,即文献的 内容” “内容” 主题词就是指以规定概念为基准,经过规范化 主题词就是指以规定概念为基准, 和优先处理后,具有组配功能、 和优先处理后,具有组配功能、能够显示词间 语义关系动态性的词或词组。 语义关系动态性的词或词组。 主题检索适合特性检索,系统性不强。 主题检索适合特性检索,系统性不强。
四部分类法
(1)“经部”——“易、书、诗、礼、春秋、孝 经部”——“ 春秋、 五经总义、四书、 小学” 10类 经、五经总义、四书、乐、小学”等10类; (2)“史部”——“正史、编年、纪事本末、 史部”——“正史、编年、纪事本末、 别史、杂史、诏令奏议、传记、史钞、载记、 别史、杂史、诏令奏议、传记、史钞、载记、时 地理、职官、政书、目录、史评” 15类 令、地理、职官、政书、目录、史评”等 15类; (3)“子部” 分为“儒家、兵家、法家、农家、 子部” 分为“儒家、兵家、法家、农家、 医家、天文算法、术数、艺术、谱录、杂家、 医家、天文算法、术数、艺术、谱录、杂家、类 小说家、释家、道家” 14类 书、小说家、释家、道家”等14类; (4)“集部”分为“楚辞、别集、总集、诗文 集部”分为“楚辞、别集、总集、 词曲” 评、词曲”等5类。
按出版类型划分:图书目录、期刊目录、会议论文目录。 按出版类型划分:图书目录、期刊目录、会议论文目录。 按物质形式划分:卡片目录、书本目录、机读目录(MARC) (MARC)、 按物质形式划分:卡片目录、书本目录、机读目录(MARC)、联机公共检索目录 )等 (OPAC ,Online Public Access Catalog )等。
2.2 检索语言
检索语言是根据人们检索工作的需要而创造的一种人 工语言,它是存储、查找文献的共同依据, 工语言,它是存储、查找文献的共同依据,也叫标引 语言。 语言。 题名语言:一般按题名字顺逐字排列 题名语言: 语言 描述文献外部 描述文献外部 特征的语言 特征的语言 著者语言: 著者语言:按姓前名后的字顺 语言 号码语言:如专利号、标准号、 号码语言:如专利号、标准号、ISBN 语言 分类语言:根据学科内容对文献进行分类 分类语言: 语言 图书分类号、专利分类号、 如:图书分类号、专利分类号、标准分类 号 描述文献内容 描述文献内容 特征的语言 特征的语言 主题语言:自然语言、 主题语言:自然语言、人工语言 语言
目录类型: 目录类型:
馆藏目录:反映一个图书馆文献收藏情况的目录。 馆藏目录:反映一个图书馆文献收藏情况的目录。 联合目录:反映一个地区或一个系统甚至全国或世界范围的图书馆、 联合目录:反映一个地区或一个系统甚至全国或世界范围的图书馆、信息服务
机构文献收藏情况的一种统一目录。 机构文献收藏情况的一种统一目录。
检索原理图
文献存储过程 检索过程
文献 主题分析 主题概念
用检索语言对 文献进行描述 情报工 作人员
检索需求 主题分析 主题概念
检索者
用检索语言对 文献进行描述
文献标识
检索工具(系统) 检索工具(系统)
检索表达式 (提问标识) 提问标识) 否
是否匹配 是
输出结果为零
得到检索结果 得到检索结果
2.1.3 检索的类型
按检索对象划分3 1、按检索对象划分3类
文献检索(Document Retrieval) 文献检索(Document 数据检索(Data Retrieval) 数据检索(Data 事实检索(Fact Retrieval) 事实检索(Fact
按信息检索手段划分2 2、按信息检索手段划分2类
手工信息检索 计算机信息检索
第二章 检索基础知识
2.1 2.2 2.3 2.4 2.5 2.6 2.7
基本原理 检索语言 检索工具 检索方法 检索步骤 机检技术 检索评价
2.1 文献检索的基本原理
2.1.1 文献检索的定义 广义文献检索(Document Information 广义文献检索( Retrieval) Retrieval)——将文献按照一定的方式组 将文献按照一定的方式组 织和存储起来,并根据用户的需求找出 存储起来 找出有 织和存储起来,并根据用户的需求找出有 关文献的过程。 关文献的过程。 狭义文献检索 狭义文献检索——指用户找出有关文献的 指用户找出有关文献的 过程。 过程。
存储 文献检索 检索
存储:是对文献进行著录、 存储:是对文献进行著录、 标引、整序, 标引、整序,编制检索工 具和建立检索系统的过程。 具和建立检索系统的过程。 检索: 检索:是指面向文献需求 而进行高度选择性的查找 过程。 过程。
2.1.2 检索原理
文献检索的过程就是检索提问标识与 文献检索的过程就是检索提问标识与 检索提问标识 著录标引标识相 存储在检索工具中的著录标引标识 存储在检索工具中的著录标引标识相 匹配的过程 的过程. 匹配的过程.
《杜威十进分类法》 ( DDC ) 杜威十进分类法》
000 100 200 300 400 500 600 700 800 900 总类 哲学类 宗教类 社会科学类 语言类 纯科学类 应用科学类 艺术类 文学类 地理历史类 310 320 330 340 350 360 370 380 390 普通统计学 政治学 经济学 法律 公共行政管理 社会机构社会团体 教育 商务、通讯、 商务、通讯、运输 习俗、礼仪、 习俗、礼仪、民俗 学校管理、 371 学校管理、 特殊教育 372 初等教育 373 中等教育 374 成人教育 375 课程 376 妇女教育 377 学校与宗教 378 高等教育 379 政府法规 管理与资助