网络信息采集与利用
例:tax W8 reform ADJ——Elsevier两词按指定顺序排列, 相
当于短语 例:remote ADJ education PRE/n ——PQDD
例:military PRE/1 weapons
23
(N),(1N),(nN) skim(n)sea —— sea skim ( Dialog 为例)
TB 一般工业技术
TQ
TD 矿业工程
TS
TE 石油、天然气工业 TU
TF 冶金工业
TV
TG 金属学与金属工艺
TH 机械、仪表工业
TJ 武器工业
TK 能源与动力工程
TL 原子能技术
TM 电工技术
TN 无线电电子学、电信技术
化学工业 轻工业、手工业 建筑科学 水利工业
11
信息检索语言学基础
例:规范化语言(artificial language):采用规范词 (controlled term), 是人工控制语言。
18
逻辑“非”
逻辑“非”算符,是具有概念包含关系的 一种组配,可以从原检索范围中排除某一 内容。具有缩小命中范围,提高查准率, 增强检索的专指性,减少输出量的作用。
A NOT B A – B Energy not nuclear
19
布尔逻辑检索表达式的特点
➢ 布尔检索表达式式目前信息检索系统中 使用最多的一种方法。
7
信息检索语言学基础
例:分类语言将表示各种知识领域的类 目按知识分类原理进行系统排列,以代 表类目的数字、字母符号作为文献内容 的标引符
中国图书馆分类法
8
《中国图书资料分类法》
基本部类:1、马克思主义、列宁主义、毛 泽东思想、邓小平理论
2、哲学 3、社会科学 4、自然科学 5、综合性图书
9
基本大类: (22种)
➢ 优点:表现直观清晰,方便扩检和缩检。 易于计算机实现。
➢ 缺点:没有反映文献内容(或信息需求) 所涉及的多个概念的相对重要性。没有 反应概念之间的内在语义关系。
20
位置算符
利用位置算符来表示检索词之间的位置 关系,以实现位置逻辑检索功能。
引入位置算符的目的是增加检索式的灵 活性,表达复杂专深的概念,从而提高 检索的专指度,弥补布尔逻辑算符难以 表达某些复杂提问的不足
computer*control (Dialog) computer control (Google)
17
逻辑“或”
逻辑“或”算符,表示主题概念之间的同义、 近义、相关或多个并列的检索概念。具有 扩大检索范围,减少漏检的功能。
A OR B 或 A + B 例:AIRPLANE OR AIRCRAFT (Google) 或 AIRPLANE+AIRCRAFT
21
(W),(1W),(nW) Computer(w)aided(w)design ( Dialog ) Electric(1w)vehicle ——electric rail vehicle ( Dialog 为例)
22
(W),(1W),(nW)
常见的另外的表达形式: Wn 如:W8——EBSCO
A 马列主义毛泽东思想邓小平理论 N 自然科学总论
B 哲学
O 数理化科学
C 社会科学总论
P 天文学、地理
D 政治、法律
Q 生物科学
EHale Waihona Puke 军事R 医学、卫生F 经济
S 农业科学
G 文化、科学、教育、体育
T 工业技术
H 语言、文字
U 交通运输
I 文学
V 航空、航天
J 艺术
X 环境科学
K 历史、地理
Z 综合性图书 10
用“与”(AND)、“或”(OR)、“非” (NOT)来表达。
16
逻辑“与”
在计算机信息检索时,“与”(and或*或空 格)是表达概念交叉和限定关系的一种组配, 具有缩小检索范围和提高专指性的功能。
实际操作中,表达式为: A AND B 、 A * B 或 A B 例: computer and control (SCI)
5
信息检索语言学基础
按表示文献 分类语言
主题概念的
标题词
词语形式 主题语言 单元词
叙词
检索语言
关键词
按规范化程度 自然语言
人工语言-规范化语言
6
信息检索语言学基础
✓ 基本功能: ❖ 对文献信息内容进行标引; ❖ 对内容相同或相关的信息加以集中或揭示其相
关性; ❖ 对信息进行系统化、有序化; ❖ 便于将标引和检索的标识进行匹配运算。
12
二、信息检索原理、技术
13
信息检索原理
信息检索 :Information Retrieval 将信息按一定的方式组织和存贮起来,
并根据用户的需要找出有关信息的过程。 是对信息条目(Information Items)进行
表示、存贮、组织和存取(Access)的过 程。 信息存取: Information Access 检索原理:字面匹配
24
(N),(1N),(nN)
常见的另外的表达形式:
Nn 如:N5——EBSCO
例:tax N5 reform
NEAR[N] ——Elsevier
网络信息采集与利用
网络信息检索技术基础
1
主要内容
信息检索语言学基础 信息检索原理、检索技术 信息检索步骤 主题词的确定 具体课题的检索方法 科技查新
2
一、信息检索语言学基础
3
4
信息检索语言学基础
检索语言:在信息的存储和检索过程中, 为使信息在用户和系统间有效传递,各 种检索工具使用专门的语言体系来描述 信息的内部特征和外部特征,同时要求 用户依此构造检索提问式来进行信息检 索,这种专门的语言体系成为检索语言
规范词采用特定的词汇来专指或网络相应概念, 这些词称为规范词。它能较好地对同义词、近义 词、相关词、多义词及缩略词进行规范。
例如:飞机:plane、airplane、aeroplane aircraft
用aircraft来表示所有“飞机”概念,以此作为规 范词.使用aircraft一词的检索结果将包括全部有 飞机概念的文献.
14
信息检索技术
信息检索技术是指应用于信息检索过程的 原理、方法、策略、设备条件和检索手段 等因素的总称
检索技术包括基本布尔逻辑组配、截词、 位置逻辑、检域限制(字段限制)等。
15
布尔逻辑检索
在进行信息检索时,检索项之间概念有 相交关系、同义关系或相关关系,这时 采用布尔逻辑进行检索项之间的逻辑组 配。