当前位置:文档之家› 信息存储与检索

信息存储与检索

第一章1.信息的涵义:申农(信息论创始人):用于消除随机不确定性的东西(信源、信宿)广义信息是物质、能量存在和运动状态的表征.狭义信息是人类社会共享的一切知识、学问以及从客观现象中提炼出来的各种消息的总和,即现代信息2.资源的涵义资源是一切被人类开发和利用的客观存在。

3.信息资源的涵义狭义指文献资源或数据资源,抑或各种媒介和形式的信息的集合,包括文字、声像、印刷品、电子信息、数据库等。

这都是限于信息的本身。

广义信息资源是信息活动中各种要素的总称。

这既包含了信息本身,也包括了与信息相关的人员、设备、技术和资金等各种资源(1)原始数据与信息的区别原始数据经过加工处理变为信息(2)信息与信息资源的区别经过加工、可被利用的信息称为信息资源。

information resource为复数时,常指信息及与信息有关的设备、人员等集合,是经过人类选取、组织、序化的有用信息的集合。

(1)信息资源是信息的集体;(2)信息资源是经过人类选择、获取的有用信息的集合;(3)信息资源是经过人类组织序化的信息的集合。

4.信息的基本性质(1)信息是内容是客观的(2)信息的形式是主观的(3)信息是一切物质的基本属性5.与信息有关的概念(1)知识。

是对客观事物规律性认识,是系统化和精炼化的信息知识的三种存在方式:大脑、实物、文献知识的七个特征:①不可替代性②不可相加性③不可逆性④不可磨损性⑤不可分性⑥可共享性⑦无限增值性知识分类:①事实知识(Know What)②原理知识( Know why)③技能知识( Know how)④人力知识( Know who)⑤时间知识( Know When)⑥空间知识( Know Where)⑦数量知识( Know Quantity )(2)文献。

是记录知识的一切载体,即用文字、图形、符号、或声视频等记录方式在一定介质上所生成的物质成果文献的三要素:记录、知识、载体文献的功能:①存储功能②传递功能③认识功能(3)情报。

指为一定目的而搜集和传递的有特定效用的知识情报的基本属性:传递性、效用性6.信息资源的基本特征(1)普遍性(2)传递性(3)时效性(4)价值性(5)可转换性(6)可利用性(7)可共享性7.按性质划分(1)自然信息资源(2)社会信息资源按信息包含范围划分(1)广义信息资源(2)狭义信息资源按信息资源的载体(1)印刷型信息资源(2)微缩型信息资源(3)声像性信息资源(4)电子型信息资源按内容(1)文献型信息资源(2)数据型信息资源(3)多媒体信息资源按保密程度(1)公开性信息资源(2)半公开性信息资源(3)非公开性信息资源按表现形式(1)文字性信息(2)图像性信息(3)数值数据性信息(4)语音性信息按信息资源的加工程度(1)一次信息(2)二次信息(3)三次信息按传输方式(1)网络信息资源(2)非网络信息资源按数据资源信息的生产途径和发布范围分(1)商用电子资源(2)网络公开学术资源(3)特色信息资源8.信息素质教育信息素质教育:是从各种信息资源中检索、评价使用信息的能力。

是培养信息意识的一条重要的途径。

9.电子信息资源含义与特点(1)、存储形式多样化,文本、超文本、多媒体、超媒体(2)、资源数字化(3)、交流程度高(4)、提高利用率(5)、内容丰富(6)、载体容量大10.网络信息资源的类型按照网络传输协议不同分(1)Web信息资源:通过HTTP在网上传输(2)Telnet信息资源:基于网络通讯协议(3)FTP信息资源:通过FTP协议可完成完整的文件拷贝(4)用户服务组信息资源:由一组对某一特定主题有共同兴趣的网络用户组成的电子论坛。

(5)Gopher信息资源:Gopher是一种基于菜单的网络服务,允许用户以一种简单的、一致的方式快速找到并访问所需的网络资源。

按信息传播交流过程分(1)稳定的电子信息资源(2)不稳定的电子信息资源按网络信息资源的表现形式分(1)电子图书型(2)电子期刊型(3)电子报纸型(4)联机系统与联机数据库(5)数字图书馆按照存取方式分(1)邮件型(2)电话型(3)揭示板型(4)广播型(5)图书馆型(6)书目型(7)交互型按电子数据库内容分(1)参考数据库(2)源数据库(3)混合型数据库(1)参考数据库指导用户到另一个信息源中获取原文或其他细节的数据库。

分为:书目数据库和指南数据库指南数据库(REERRENCE DATABASES)也称指示性数据库,是指存储关于某些机构、人物、出版物、项目、程序、活动等对象的简要描述,指引用户从其他有关信息获取更详细的信息的一类数据库。

如产品目录、机构名录、研发项目、基金项目等数据库均属于此类型。

(2)源数据库(source databases):直接提供原始资料和具体数据的数据库全文数据库数值数据库科学技术数据统计数据库文本-数值数据库公司信息库产品市场数据库术语数据库汉语主题词数据库图象数据库建筑图纸数据库(3)混合型数据库磁媒体数据库光盘数据库多媒体数据库11.网络信息资源的特征(1)、信息内容丰富(2)、信息变化频繁(3)、信息结构复杂(4)、格式多样化(5)、信息价值不一网络信息资源的发展变化(1)、网络信息资源数量规模的急剧增大(2)、信息资源内容趋于规范网络信息资源的评价(1)资源内容评价指标①数据库的规模②数据库的范围③数据库的质量控制④数据库的实效性(2)信息组织管理的评价指标①信息收集方法②信息更新周期③信息管理方式(3)信息检索功能的评价指标①布尔逻辑检索②精确检索③截词检索(4)检索结果评价指标①结果满意度②相关性排序③显示内容形式印刷型信息资源的特点(1)实用性:携带、书写、保存方便(2)直观性:阅读不需借助计算机等工具。

(3)不可替代性:以纸质为载体的艺术作品的不可替代性(4)增值性:质文献作为收藏品的不可替代性按文献的加工深度划分零次文献:指未经公开交流的最原始的文献。

如论文手稿、新闻稿、未审核的工程图纸、实验记录、会议记录。

特点:内容庞杂,来源真实,成熟度差一次文献:以著者本人的研究成果为依据而形成,并在社会上公开交流或发表的文献。

如期刊论文、研究报告、预印本、会议论文、专利说明书、学位论文、技术标准等。

特点:零散、无序、难获取第一,创造性;第二,原始性;第三,多样性;二次文献:是把分散、无组织一次文献进行收集、加工、整理压缩而形成的并能按期外部特征提供查找线索的文献形式。

如目录、题录、文摘、索引等特点:第一,集中性;第二,工具性;第三,系统性;三次文献:利用二次文献对一次文献进行综合、归纳和分析的基础上而形成的述评性、综述性文献形式。

特点:第一,综合性;第二,针对性;第三,科学性;12.其他载体文献信息资源印刷型文献信息资源特点:存储密度小、占据空间大、阅读携带方便微缩型文献信息资源特点:存储密度小、占据空间大、阅读携带方便声像型文献信息资源特点:直观、形象电子型文献信息资源特点:存储密度高、存取快、数据可修改、删除、更新第二章1.信息存储与检索概念(1).广义信息检索:指将信息按有序的方式组织和贮存,并根据用户的需求查找出有关信息的过程。

包括存入和输出两个方面。

(2).狭义的信息检索:单指查寻信息的过程,即从信息集合之中查寻出所需要的符合要求的信息的过程。

(3).信息存储:是按主题词表或分类表及使用原则对原始信息资源进行处理,形成信息特征标识,为检索提供整序(即提供检索途径的)的信息集合的过程。

(4).信息存储与检索的基本原理:查询语言(检索提问)和系统标识语言所进行的“相符性比较”与“匹配运算”。

(5).直接检索:直接从信息源或信息文献载体中获取信息(6).间接检索:通过检索工具指引来获取所需信息。

(7)、信息检索通常包括4种类型:一是关于文献的检索;二是关于某事实或事项的知识检索;三是关于数值或数据的情报检索;四是关于图象信息的信息检索。

2.信息存储(1).信息的印刷存储特点:直观易读、携带方便。

缺点:存储信息密度低、存储传输慢,难以长期保存(2).信息的微缩存储特点:容量大、密度高,忠实于信息原件、不出差错;成本低、保存时间长(3).信息的磁存储(1)磁存储的特点能存储一切可转换成电信号信息。

文字、声、像;可长久保存、重复使用、可擦写;可同时进行多路信息存储,并保证信息之间的时间和位相关系;存储频带宽广;可高速存储高频信息慢速播放或慢速存入低频信息快速播放(2)磁存储类型计算机磁带硬盘软盘光盘温盘(4),半导体存储是采用集成化的技术将存储单元电路及其外围电路直接置放在半导体芯片上支撑的。

(5),光盘存储特点:信息存储密度高价格低方便存取、方便与计算机连接显示信息种类多坚固耐用,存储寿命长计算机的存取技术与设备网络存储3.按检索活动的执行主体手工检索利用人工信息存取系统检索信息的活动,如各类纸质书目、索引、文摘、卡片检索过程:人工的手翻、眼看、大脑分析和判断优点:①不需要辅助设备,适应性好②成本低,检索工具可长期无限制使用③检索前随时获得反馈信息,及时修改检索策略④可以把几种检索工具进行对比参照。

缺点:①费时费力②检索工具提供检索点有限,主题专深文献按检索工具类型(1)目录与题录检索(2)文摘检索(3)字典型检索(4)交互式检索(5)索引检索按照检索方式划分有先组式索引和后组式索引。

按照索引所包括的对象划分有综合索引和专门索引依据索引标题词的性质划分有揭示信息资源内容特征的主题索引、分类索引、关键词索引、分子式索引、结构式索引;有揭示信息资源形式特征的题名索引、人名索引、物名索引、代码索引、引文索引。

依据索引标题词的排序方式划分有按照标题词字顺组织的主题索引、题名索引、人名索引、关键词索引、语词索引等;有按照文献代码组织的报告号索引、合同号索引、标准号索引等;有按其它排序方式组织的网络信息自动索引、重量索引、速度索引、专用索引等4.主题索引优缺点(1)能把属于不同学科、不同知识体系中论述的同一主题的资源集中标引出来,届时资料比较深入、广泛。

(2)查考文献资料时,需要正确选取主题词,否则难以准确查到5.关键词索引自然语言检索标识;自然语言多指关键词,直接从文献篇名、正文或文摘中抽取,未经优选和规范化自然语言检索优点(1)不受词表控制,能及时检索到最新概念的各类文献(2)可任意选取专指性强的语言,提高查准率(3)非受控词具有数量大的特点,比叙词表大2~3个数量级。

(4)避免在标引人员和用户之间造成不必要的交流障碍自然语言检索缺点(1)不规范,存在大量同义词、多义词和含义模糊现象。

(2)没有显示词语之间的关系规范语言检索标识。

6.组配索引1 按组配方式(1)先组式检索语言指检索前,检索词已被预先组配好的一种检索语言分为定组型和散组型编制检索语言词表的时已经预先固定组配(2)后组式检索语言指表达文献信息主题的标识,在编制检索语言词表和标引文献的时候,都不预先固定组配,而是在检索进行时根据检索的实际需要,按照组配规则临时进行组配的检索语言先后组式检索语言评价(1)先组式有利于提高检索词的专指度,减少标引到每个词的文献数量,减少和避免假组配,从而有利于查准率(2)先组式的词在数量上是有限的,不能适应各种角度和深度的符合概念检索(3)后组式便于各种角度和深度的检索,有利于查准率的提高,但有可能出现假组配,致使误检的增多。

相关主题