当前位置:文档之家› 档案文献检索系统

档案文献检索系统

第一章档案文献检索系统概述1.广义的档案文献检索包括存储和查找两个具体过程。

前者是指将档案中具有检索意义的特征标识出来,通过编制检索工具、建立数据库等方法使之成为有序的档案信息集合的过程;后者则是指在档案信息集合中选择、获取特定档案信息的过程。

2.简答档案文献检索的基本原理:是实现档案需求与相关档案信息的匹配,即将特定的档案需求与存储在检索系统中的档案信息进行相符性比较,根据一定标准从中选择出符合需求的档案信息。

匹配的实现是存储和查找互相作用的结果。

3.存储阶段的目的是:使档案信息达到高度的组织化。

主要采取对档案文献进行标识化压缩处理的方法,即把档案文献中具有检索意义的特征用语词、代码等符号表示出来,通过编目、编写提要等方式将档案原件转换成一种篇幅较短的特殊文献形式,一般成为简短记录档案文献特征的一个条目,并按照一定的规则把这些条目组织起来,形成有序的档案信息集合,供查找之用。

4.查找阶段的目的:是获取所需档案信息,主要方法是对档案需求课题进行标识化处理,形成检索提问,再将提问标识与档案信息集合中的标识进行相符性比较,选择出所需要的档案信息,也就是说,在存储的逆过程中把所需档案查找出来。

(3、4题可合并一题)5.档案文献检索同其他文献检索一样,可以采取三种形式:(1)数据检索。

这种检索是直接回答利用者所需要的有关特定主题的查询,检索出的结果是数据、公式、图表等。

(2)事实检索。

这种检索也是直接回答利用者所需特定主题的确定性检索,检索出的结果是某种事实。

(3)文献检索。

这种检索是要查出记载所需信息的档案文献,但检索结果所提供的并不是文献本身,而是文献线索,检索人员借助文献线索中提供的存址提取档案文献,再从文献中获得所需信息。

6.试述档案文献检索系统的构成与功能?从检索系统的整体功能出发,去设计规划各个因素或环节的构成方式及其相互关系,可以使整个检索系统的功能得到改善,从而获得较好的检索效果。

档案文献检索系统包括两大部分:存储部分和检索部分。

存储部分的主要功能是通过著录标引、编制检索工具、建立数据库等手段使档案信息有序化;档案部分的主要功能是通过编制检索策略实现利用者提问与档案信息的有效匹配。

在存储档案时,档案标引人员首先要对档案文献的内容进行主题分析,形成若干能反映其主题的概念,并借助于检索语言把这些概念转换成规范化的检索标识,这一段工作就是档案的著录标引。

在检索(查找)档案文献时,档案检索人员首先要根据利用者的提问确定其所需档案的实质内容,形成概念,然后同样借助于检索语言,把表示检索课题的概念转换成规范化的检索标识,并按实际需求把这些标识之间的逻辑关系表达出来,形成检索表达式。

7.档案文献单元方式按照目录构成或计算机文档中数据排列方式的不同,可区分为文献单元方式和标识单元方式。

8.文献单元方式:在计算机检索中又称为顺检方式、顺序文档。

它以一份文献为一个条目,指明该文献的各种特征,即以文献为单元进行检索。

9.标识单元方式:在计算机检索中又称为逆检方式、倒排文档。

它以文献的一个属性标识为单元,指明含有该属性的全部文献,一般只有标识和文献号(档号)两个项目。

10.检索效率是指在检索过程中满足利用者的全面性和准确性程度,它是衡量检索系统性能的一个最基本的指标。

检索效率通常采用查全率和查准率两个指标来衡量和表示。

11.查全率是衡量某一检索系统从文献集合中检出相关文献成功度的一项指标,即检出的相关文献与全部相关文献的百分比。

12.查准率是衡量某一检索系统的信号噪声比的一种指标,即检出的相关文献与检出的全部文献的百分比。

13.简答查全率和查准率的关系查全率和查准率之间存在着互逆关系的结论。

也就是说,如果放宽检索以达到较好的查全率,那么查准率就会下降;反之,若是限制检索范围以改善查准率,则查全率就会变坏。

当进行范围宽泛的检索时,查全率很高,可以达到90%左右,而这时查准率则很低;相反,当检索范围小,很专指时,则查准率较高,查全率较低。

14.论述影响检索效率的因素:(1)检索语言的性能。

检索语言是沟通档案文献存储和查找两个过程的桥梁,对于特定需求信息与纳入检索系统的信息集合的准确匹配具有直接的影响。

(2)检索途径的数量。

从理论上说,档案在存入检索系统之后,该系统向利用者提供的检索途径愈多,它被查到的概率也就愈高。

(3)著录标引的质量。

检索标识是组织检索工具、进行检索的依据,因此,检索标识的准确性也是影响查全率、查准率的一个重要因素。

(4)检索策略的优劣。

档案著录标引的结果对于文献存储的质量至关重要,那么,检索策略在查找过程中则具有决定性的作用。

(5)检索人员的素质。

不论是手工检索系统还是机械检索系统,都要由检索人员来参与和控制检索过程,上述因素中除检索语言之外,均与检索人员的素质有关,因此检索人员的素质对于检索效率有直接的影响。

15.简档案文献检索系统评价的目的和作用系统评价就是对系统的效率和价值进行测定,它是对系统进行科学管理的重要依据。

主要目的是对系统整体及其组成要素的功能、特性和运营情况进行评测。

作用主要有三个方面:(1)明确系统当前的性能特征,从而科学地、最大限度地发挥系统的功能。

(2)发现系统现存的缺陷及其原因,提出改进意见或其他对策。

(3)为设计和建立新的档案文献检索系统提供参考。

16.试述系统评价的指标体系:档案文献检索系统评价的指标主要包括数据覆盖率、检索效率、响应时间、可存取性、费用等。

(1)数据覆盖率又称为收录范围,指一个检索系统已收录数据量与应收录数据量的百分比,它反映该检索系统的资源拥有状况。

(2)查全率和查准率。

二者实质上反映了系统运行结果与利用者检索要求的吻合程度,是衡量检索系统性能的最重要的指标。

需要说明的是,在实际测评时根据公式计算出来的查全率和查准率常常不能完全准确地反映系统的实际检索效率,其主要原因是:①对文献相关性的判断不可避免地带有主观性和模糊性。

②查全率是以检索系统中与某一检索要求相关的文献总数作为分母,计算检出的相关文献在全部相关文献中的比例,而检索人员和评价人员都难以确定这个总数是多少。

③在计算查全率、查准率时,“相关文献”被同等看待,不作任何区分,而实际上,在一组相关文献中,每一份文献的相关程度是有差异的。

(3)响应时间。

它是指一次检索过程中从利用者向检索系统提出问题到检索系统完成匹配过程,形成检索结果,交付利用者所需的全部时间。

(4)可存取性。

是指一个档案文献检索系统的易用程度。

(5)费用。

构造和维持一个档案文献检索系统需要投入一定的费用,利用者检索档案文献也要有一定的支出,这些投入包括货币和活劳动两种形式。

17.简系统评价步骤(1)制订评价方案。

包括确定对该系统进行评价时采用哪些评价指标。

(2)评价对象调查。

可根据评价对象以及评价指标的特点采用问卷调查、抽样调查等不同的方法。

(3)测试。

根据样本进行检索测试,然后对检索结果的相关性、响应时间、系统易用程度等进行判断。

(4)数据处理与分析。

对调查测试的各种原始数据进行整理、计算,得出有关评价对象的各种性能指标。

(5)对评价结果进行分析,提出改进意见。

第二章检索语言1.检索语言:是根据检索的需要而创制的人工语言,专门用于各种手工的和计算机化的文献信息检索系统,表达文献主题概念和检索课题概念。

2.简答检索语言的基本功能主要有以下四个方面:①对文献的主题加以标引的功能;②对内容相同及相关的文献主题加以集中或揭示其相关性的功能;③对大量文献信息加以系统化或组织化;④便于将标引用语和检索用语进行相符性比较。

3.产生检索语言第一项基本功能的结构:(1)编码型标识结构。

(2)组配型标识结构。

(3)层次型结构标识。

4.产生检索语言第二项基本功能的结构:(1)等级结构(2)参照系统结构(3)轮排聚类结构。

5.按构成原理,可分为分类检索语言、主题检索语言和代码检索语言三大类型。

6.简答构成原理(1)分类检索语言。

其特点是用分类号来表达各种概念,把各种概念按知识分类进行系统组织和排列,有很好的系统性。

(2)主题检索语言。

其特点是用取自自然语言的语词来表达各种概念,把各种概念完全按字顺排列而不管其相互关系如何,其标识有很好的直接性。

(3)代码检索语言。

它一般只就事物的某一方面特征,用某种代码系统来加以标引和排列。

(4)引证关系追溯法。

即引文索引法,是显示科学论文之间互相引证而形成的论文网的一种方法。

7.主题检索语言包括标题词语言(标题法)、单元词语言(单元词法)、叙词语言(叙词法)和关键词语言(关键词法),它们可统称为主题法系统。

8.简答先组式语言与后组式语言有何区别先组式语言就是文献标识在编表时就已固定组配好,或绝大部分已固定组配好,如体系分类法和标题词法。

后组式语言就是文献标识到标引和检索时才组配起来,如单元词法和叙词法。

第三章、分类检索语言及<<中国档案分类法>>单选:1、一个类在分类表中被称为(类目)。

2、表示类目概念的名称称为(类名)。

3、(分类标准)的选择决定着提供什么检索途径。

4、分类标准使用次序的选择,决定着形成什么样的(分类体系结构)。

5、类目的排列包括纵向排列和横向排列,纵向排列决定着类目之间与(隶属关系)。

横向排烈决定的(同位类目)的排列次序。

6、(归附列类法)即将按学科、专业、职能分类不能集中在一起事物按某种联系归附于有关类目。

7、(合并列类法)即将若干相近的并列概念合并设立一个类目,或构成一个类目。

8、(交替烈类目)即对可以隶属于两个的学科、专业\职能的事物在各有关类下都设立子目,并视需要选择其中一个作正式类目,在另一处引见正式类目。

9、类目名称限定着类目所表达的事物概念的(内涵)和(外延)。

10、体系分类法是直接体现(知识分类)的概念标识系统。

11、使用数字或使用字母的分类号称为(单纯标记),同时使用字母和数字的分类号称为(混合标记)。

12、(顺序制)即用若干个数字或字母编成(固定长度)的连贯的号码。

13、(八分法)这是解决同位类超过十个阿拉伯数字限度进的一种标记方法。

14、双位法即在展开时一下就用两位数字。

这是解决同位类个数很多的一种标记方法,双位法也称(百分法),便不用00_09以及10\20\90等号码,所以实际上只能标识(81个)子目。

15、(中国档案法)于(1987年)12月由档案出版社正式出版。

16、1989年<<中国档案法>>又开始了第二版的编制工作,并于1995年通过专家鉴定,中国档案出版式(1997)年出彼。

17、<<中国档案法>>主要适用于档案文献(检索系统)的建立,但某些专业部门也可用以组织档案实体的分类排架。

18、<<中国档案分类法>>是以不同历史时期的国家机构,社会组织,从事社会实践活动的(职能分工)为基础,并紧密结合档案记述和反映的事物属性关系,来建立从总到分,从一般到具体的逻辑体系。

相关主题