当前位置:文档之家› 信息存储与检索复习资料

信息存储与检索复习资料


文献类 型
dt=
பைடு நூலகம்
dt=review
查找文献类型为review的所有记 录
语种
la=
la=Chinese
查找登记语种为Chinese的所有 记录
出版年 py= py=2000
查找出版年是2000年的所有记 录
更新日 期
ud=
ud=990123
查找更新日期是1999年1月23日 的所有记录
15. (简答题)网络信息检索的一般方法(P191) (1) 浏览检索。偶然发现信息,这是Internet中检索信息的原始方法。 (2) 通过资源指南(Resource Guide)来查找相应的信息。是专业人员 利用自身对网络信息资源的产生、传递与利用机制的广泛了解,和对网 络信息资源分布状况的熟悉,以及对各种网络信息资源的采集、组织、 评价、过滤、控制、检索等手段的全面把握而开发出的可供浏览和检索 的“书目之书目”。 (3) 利用网络信息检索工具。利用WWW、FTP等性能优越的信息查 询工具。 (4) RSS订阅。是站定用来和其他站点之间共享信息的一种简易方 式,通常被用于新闻和其他按顺序排列的网站。 (5) 使用搜索软件。 (6) 充分利用E-mail获取信息资源。通过网络传递到用户的E-mail信箱 中。 16. (简答题)搜索引擎的构成(P194)
FirstSearch
国内联机存取系统:(1)万方数据资源统一服务系统 (2)CNKI数
据资源系统 (3)维普数据资讯系统
14. (简答题)DIALOG系统基本索引字段的后缀和检索示例(P148)
字段 后缀代


示例
功能说明
题名
/ti
Computer/ti
查找题名字段中含有检索词 Computer的记录
索引标题词:亦称款目、索引键、索引标题等,一般处于索引款目中 最醒目的位置,是索引款目的核心,也是信息资源外部特征与内容的标 志
说明语:亦称上下文或修饰语,用来说明、解释、限定索引标题词含 义的辅助项目,说明语可用来区别同一索引标题词的不同含义
地址参照项:位于索引标题词和说明语之后,索引地址所指明的是索 引标题词的出处
15. (简答题)DIALOG系统常见辅助索引字段的前缀和检索示例
(P148)
字段名
前缀代 码
示例
功能说明
作者
au=
au=johnson
查找作者字段为johnson的所有 记录
公司名 称
co=
co=ford motor
查找公司名称字段为ford motor 的所有记录
团体作 者
cs=
Cs=Harvard 查找团体作者为=Harvard and and medicine medicine的所有记录
字、词、句、段落等为存取点查询的全文信息的活动 (5) 图像存取:在基于文本式的检索基础上增加了基于内容的图像存 取 (6) 多媒体信息存取:分为基于文本方式的多媒体信息存取和基于内 容特征的多媒体信息存取
7. 索引款目一般由索引标题词、说明语和地址参照项组成,而简单的 索引款目只有索引标题词和地址参照项组成(P50)
(5) 增值性:对信息资源的投入和使用,不但可以使自然资源、人力
资源、资本资源增值,同时信息资源可以一次投入、多次开发利用,并
不断产生新的信息使其自身增值
2. 信息资源划分为纸质文献型信息资源和电子型信息资源两大类
(P6) 3. 按照网络信息资源的表现形式将网络信息资源分为:电子图书、电
子期刊、电子报纸(P10) 4. 根据存储介质及存储技术,现代信息存储可以划分为以下类型:
用户检索策 略
搜索引擎用户接口
搜索引擎本地的摘要信息数据库
各万维网站点资源
访问
各记录链接
摘要信息反馈
详细信息反馈 18.多元型存取系统是为弥补独立存取系统费时费力之不足而出现的网 上辅助检索工具,可分为3类:并行处理引擎、串行处理引擎和ALL-INONE方式。(P214) 19.多元搜索引擎由3部分组成:检索请求提交机制、检索接口代理机 制、检索结果显示机制。(P217) 20.《全国新书目》、《全国总书目》、《中国国家书目》等是查询中 文图书的重要工具(P232) 21.中国专利局发型的专利文献包括专利说明书、专利公报和专利年度 索引等(P256) 22.《中华人民共和国标准法》规定,我国标准分为四级,即国家标 准、行业标准、地方标准和企业标准(P285) 23.影响数字声音波形质量的主要因素有3个:(P307)
位置逻辑算符:为了弥补逻辑算符的不足,规定了一些位置算符,主 要用于全文数据库查询
截词算符:只在检索词的某个局部截断,利用检索词的词干或不完整 的词形加上截词符号所进行的检索 11. (简答题)信息检索步骤:(P90) (1) 分析检索课题,明确检索需求。任何检索活动开始之前,都必须 认真分析检索课题的学科专业属性、主题概念和用户检索的具体目标、 文献资源的语种类型与时间界限等 (2) 制定检索策略。科学正确的主题分析是正确选用数据库、检索词 和各类算符的先决条件,它决定着检索策略的质量与检索效果 (3) 选择检索系统与数据库。选择检索系统与数据库必须综合考虑检 索系统的特点、学科范围、文献类型、数据库特点、时间限定词以及所 提供的检索路径、功能与服务形式等
并列 链表 模型
层次 邻接 模型
型型型
6.信息存储与检索类型按查询信息的特征划分:(P44) (1) 书目存取:利用文献存取系统,从一个特定的书目集合中查找热 定用户所需的特定主题、特定区域、特定时间文献的程序与方法 (2) 数据存取:以查询各类物质与材料的特性、参数、常数、价格、 统计数据等数值信息为主要对象的信息存取 (3) 事实存取:以客观事实为对象的信息存取活动 (4) 全文存取:利用计算机化的全文数据库,以机器可读的字符代码 形式或文献页面扫描图像形式存储文献正文内容,以便于用户从任意
(4) 确定检索词和检索途径,编制逻辑检索式。 (5) 检索策略的调整。检索策略初步拟定以后,还需要根据预检情况 进行调整 12.(简答题)计算机存取系统结构 信息源 输入子系统 处理子系统 传输子系统 存储子系统 控制子系统 输出子系统 控制子系统 输出子系统
信息源 用户
13. (简答题)列出国内外存取系统(P140) 国外联机存取系统:(1)DIALOG系统 (2)STN系统 (3)OCLC
(1)信息印刷存储 (2)信息微缩存储 (3)信息磁存储 (4)半
导体存储 (5)光盘存储(P34) 5. 信息检索模型和信息浏览模型:(P41)
信息检索模型
信息浏览模型
基于文档内容的 基于文档结构 平面浏 目录导 网状结
检索模型
的检索模型 览模型 航模型 构模型
布概向
尔 逻 辑 模
率 统 计 模
量 空 间 模
(1)采样频率。采样频率等于波形被等分的份数。 (2)采样精度。采样精度即每次采样信息量。
(3)通道数。声音通道的个数表明声音产生的波形数。 24.图像处理一般要考虑三个方面的因素:(1)分辨率 (2)图像灰度 (3)图像文件大小(P308) 25.在多媒体信息标引问题上,基于已有的研究成果,经过分析与归 纳,可按标引入口点的不同将这些标引方式分为3大类:依外在特征的 标引方法、以内容分析为主的标引方法和全方位语义分析法。(P312) 26.连续音频信号经过采样变成离散信号,按照对采样点提取特征不 同,可将音频划分为4类基本特征:时域特征、频域特征、时频特征和 音频片段特征。(P326) 27.基于内容的图像检索技术的关键在于特征提取,以及在图像特征基 础上进行的相似性匹配算法,这些方法与技术融合了计算机图像处理、 模式识别、数据库等多门学科关键技术。(P329) 28.(简答题)视频结构化处理过程(P337) 视频流 镜头 关键帧 运动特征 静态特征 视频特征数据库
特征提取
29. (简答题)中文工具书排检法(P351)
字顺法
分类法 主题法
音序法
形序法
学 科 体 系
事 物 性 质
关 键 词 法
叙 词 法
时序 法
地序 法
地区
法法

语注

拼音韵 部 画 号
音字部 首 笔 码
字母法 法 顺 法
母法


顺逆名域 时时字排 法法顺检
法法
与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相
关性反馈机制。
用户接口:用户接口的作用是用于输入用户查询、显示查询结果、提
供用户相关性反馈机制,主要目的是方便用户使用搜索引擎,高效率、
多方式地从搜索引擎中得到有效、及时的信息。
17. (简答题)搜索引擎的工作原理(P196)
信息资源搜集
8. 全文检索系统的开发包括选择数据、建立全文数据库和实现文本检 索等功能(P70)
9. 全面智能信息检索系统包括知识库、数据库、文本处理部分和检索 推理机及人机接口(P75)
10. 构造提问检索式的基本要素是检索词、布尔逻辑算符、位置逻辑算 符和截词算符(P78)
布尔逻辑算符:现代计算机信息检索系统多采用这种方式,用户利用 逻辑算法构造检索式可以将一些具有简单概念的检索词组配成为一个具 有复杂概念的检索式,用以表达用户的检索需求
搜索引擎有搜索器、索引器、检索器和用户接口4部分组成
搜索器:又称为Robot、Spider、Webcrawler或Worm。搜索器的功能
是在互联网上漫游、发现和搜集信息。
索引器:又称为索引库或数据库。它的功能是认识理解搜索器所搜索
的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表。
检索器:功能是根据用户的查询在索引库中快速检出文档,进行文档
叙词
/de
Economics/de
查找叙词字段中含有检索词 Economics的所有记录
相关主题