第一章网络信息概述一. 基本概念1信息狭义:信号和消息广义:是物质的存在方式和运动方式的体现,是物质的一种客观存在,它反映了物质客体及其相互作用、相互联系过程中表现出来的种种状态与特征。
2 知识按照表述方法可以分为两类:显性知识和隐性知识显性知识,又称可编码的知识,是记录于一定物质载体上的知识,可以看得见,摸得着的,可以通过正常的语言方式传播的知识。
以文字、语言、图像的形式保存下来,如专利、商标、计划、软件设计报告等等。
显性知识是可以编码和表述的,有载体的。
隐性知识又可称为不可编码的知识,是存储在人们大脑里的经历、经验、技巧、体会、感悟、智能等尚未公开的秘密知识,就是你看不见、摸不着,只可意会不可言传,难以直接交流和表达出来的知识。
隐性知识的特点是不易被认识到、不易衡量其价值、不易被其他人所理解和掌握3文献是记录有知识的一切载体。
精确描述:凡是用文字、图形、代码、符号、音频、视频等方式记载在一定载体上的每一件记录,均称为“文献”。
构成文献要素有三,知识、记录与载体方式。
4情报是人们在一定时间内为一定目的而传递的有使用价值的知识或信息。
钱学森:“情报是激活了的知识”情报是对特定的人而言的,对需要它的人而言是情报,对不需要的人而言它只是信息与知识。
知识与信息转化为情报必须经过传递、只有将特定的知识与信息传递到特定需要的人那里,它们才能成为情报。
传递是情报的一个基本特征。
二. 网络信息的特性1 性质客观性寄附性传递性共享性衍生性时效性2 特点数量大来源广语种多多媒体传播快跨国界内容杂更新快三. 网络信息的资源1 知识信息网站教育和科技部门网站,如:学校、科研单位、学术团体、政府部门等。
2 文献信息网站出版和收藏文献网站。
有数字图书馆,如:超星、书生之家等;数字平台,如:中国知网、万方、维普等。
四. 网络信息的检索主要信息网站种类:政府网站(.gov)免费教育机构(.edu)科研部门(.ac)商业网站(.com)收费社会组织(.org)互联网络(.net)五.图书馆印刷型文献:图书、期刊、工具书、报纸电子型文献:随书光盘、电子期刊数据库、电子图书及其他数据库1. 按文献内容性质划分(不同加工深度)零次文献(Zeroth Litterature) 是指非正式出版或非正式渠道交流的文献,未公开于社会,只为个人或某一团体所用。
如文章草稿、私人笔记、会议记录、未经发表的名人手迹等。
一次文献(Primary Document):通常是指原创制作,即作者以本人的研究成果为基本素材而创作(或撰写)的文献。
如期刊论文、科技报告、会议论文、专利说明书二次文献(Secondary Document):是指文献情报工作者对将分散、无序的一次文献,按照一定的原则进行加工、整理、提炼、组织,使之成为便于存贮、检索的系统。
如目录、题录、文摘、索引等文献检索工具。
三次文献(Tertiary Document):是指利用二次文献,选用一次文献内容, 经综合,分析和评述后形成的文献。
它又可分为综述研究类如综述、述评、回顾、展望、概况等和参考工具类如词典、百科全书、年鉴、手册、名录等两种类型。
2. 文献按载体性质划分1 ) 印刷型2 ) 缩微型3 ) 声像型4 ) 机读型3. 文献按出版形式划分可以分为以下十种类型:①图书(Book)图书的主要特点是单独成册、作者单一、内容系统成熟、有正规的出版部门且出版周期较长。
(凡篇幅达49页以上并构一个书目单元的文献称为图书。
未达到49页的,可称为小册子。
)ISBN号:ISBN它的作用犹如图书的身份证,每一组ISBN由13个数字组成,前12个分为4组,分别用来显示ISBN系统的前缀码978以及该书本的区域语言、出版社代码和图书的种类,而最后的一个数字则用来检验前面数字是否准确,这也是辨别盗版书籍,保护知识产权的一种检验方法。
例如:ISBN 978-7-5617-3058-4中检验数字为4❖第一组:978是图书产品代码;第二组:7代表中文;❖第三组:5617是出版社代码:第四组:3058是图书种类号❖第五组:4是检验数字②期刊(Serial)连续出版物,也称杂志。
特点:出版周期短、报道速度快、内容新颖、数量大、品种多期刊的标识是国际连续出版物编号(International Standard Serial Number,简称ISSN ),ISSN由8位数字组成,分为两组,中间用“-”隔开;前7位是顺序号,后一位为效验位;如果是国内期刊,还要加上国内刊号(CN)和分类号,CN由6位数字组成,前两位代表地区,后边4位是期刊代码;分类号是《中国图书资料分类法》的大类(字母),位于国内刊号的后边,用“/”隔开。
如:中国科学院院刊刊号:ISSN 1000-3045,CN 11-1806/N。
核心期刊——某学科(或某领域)的核心期刊,是指那些发表该学科(或该领域)论文较多、使用率(含被引率、摘转率和流通率)较高、学术影响较大的期刊。
通常所说的中文核心期刊,是指被北大图书馆每四年出版一次的《全国中文核心期刊要目总览》中列出的期刊。
对许多学科而言,20%的期刊占据了80%以上的有关信息,这也就是核心期刊(Core journals)群,掌握和利用核心期刊就可以较少的代价获取较多的信息。
从统计学的角度来看,只需浏览3-5本专业核心期刊,就能够获取50%的专业信息。
③会议文献(Conference Literature)在国内外各种会议上宣读和交流的学术论文、报告与其他有关资料。
特征:专业集中、针对性强、内容专深④学位论文(Dissertation)高等学校和科研机构的毕业生为取得学位提交的学术论文,分为学士论文、硕士论文和博士论文。
特点:见解独特、论证全面、参文齐全学位论文属非卖品,不公开出版。
⑤科技报告(Science and Technical Reports)是关于某项科研成果的正式报告,或者是科研单位或个人向上级部门提交的课题进展报告。
特点:统一编号、内容新颖、前瞻性强、如实报导、资料保密⑥专利文献(Patent Literature)专利局和有关机构出版的各种文件。
如:专利政策、专利公报、专利索引、专利说明书等。
专利文献的核心是专利说明书。
特点:集技术、法律和经济情报于一体。
数量多、内容广,各国95%以上的新技术可以从专利文献中查到。
⑦标准文献(Sdandard Literature)权威机构批准的、在特定范围内必须执行的规格、规则、技术要求等规范性文献。
特点:结构严谨、实用性强、有约束力、更新频繁功能:反映某国家、某单位的工业发展水平⑧产品资料(Product Literature)制造厂商为推销产品出版的各种宣传材料,如产品目录、样本、说明书、产品总览、产品样本集、产品数据手册等。
核心是说明书。
功能:反映厂商的产品信息,对开发新产品、开展市场竞争具有重要参考价值。
⑨技术档案(Technical Archives)《档案工作基本术语》给档案下的定义: 国家机构、社会组织或个人在社会活动中直接形成的有价值的各种形式的历史记录。
”档案分为文书档案、专业档案和科技档案科技档案:生产单位和科技部门保存的技术文件。
特点:内容全面、真实可靠、详尽完整、保密性强。
不公开出版,难以获得。
⑩政府出版物(Government Publication)是各国政府部门及其设立的专门机构发表、出版的文件资料特点:内容可靠、权威度高、富含政策、指导性强4. 图书馆文献的组织《中国图书馆分类法》根据学科分类、图书资料的特点,按照从总到分,从一般到具体的编制原则,确定分类体系,在五个基本部类的基础上,组成二十二个大类。
《中图法》的标记符号采用汉语拼音字母与阿拉伯数字相结合的混合号码。
即用一个字母表示一个大类,以字母的顺序反映大类的序列。
字母后用数字表示大类以下类目的划分。
数字的编号使用小数制。
⑴基本大类共22个,类号分别用字母A-Z (去掉M、L、W、Y)表示。
A 马克思主义、列宁主义、毛泽东思想、邓小平理论B 哲学、宗教C 社会科学总论D 政治、法律E 军事F 经济G 文化、科学、教育、体育H 语言、文字I 文学J 艺术K 历史、地理N 自然科学总论O 数理科学和化学P 天文学、地球科学Q 生物科学R 医学、卫生S 农业科学T 工业科学U 交通运输V 航空、航天X 环境科学、安全科学Z 综合性图书第二章信息检索的基本方法一. 信息检索基本知识1. 信息检索:信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。
全称又叫信息存储与检索(information storage and retrieval)。
1) 按检索工具划分手工检索(Manual Retrieval)、计算机检索(Computer-based Retrieval)2) 根据检索对象形式不同文献信息检索(Document Retrieval)、数据信息检索(Data Retrieval)事实信息检索(Fact Retrieval)2. 检索语言①按照标识的性质与原理划分:分类语言、主题语言和代码语言②按照表达文献的特征划分a. 表达文献外部特征的检索语言、b. 表达文献内容特征的检索语言3.检索方法直接法(顺查法、倒查法、抽查法)追溯法(参考文献类型、标识、编排格式)综合法(上述两种综合利用)参考文献类型及标识:专著为M;论文集为C;报纸文章为N;期刊文章为J;学位论文为D;专利为P;其他为Z;数据库为DB;计算机程序为CP;电子公告为EB。
4.信息检索途径分类途径、主题途径、著者途径其他途径包括利用检索工具的各种专用索引来检索的途径。
专用索引的种类很多,常见的有各种号码索引(如CN号、专利号、入藏号、报告号等)、专用符号代码索引(如结构式、元素符号、分子式等)、专用名词术语索引(如商品名、地名、机构名、生物属名等)。
5.检索词、检索式、检索策略检索词:是用户或检索人员给出的字、词、字符或短语,用于查找含有它(它们)的记录。
检索式:也称检索提问表达式, 是要求系统执行的检索语句.检索策略: 就一个问题检索一个(或多个)数据库所输入的全部检索式的集合, 是为满足信息需求所制定的一系列检索式。
6.检中结果、查全率、查准率检中结果:又称检索结果集,是数据库中满足检索式(既符合检索条件)的那些记录的集合。
查全率:是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例。
查准率: 是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。
二. 网络信息检索基本方法1.浏览2. 通过网络资源指南来查找信息3. 利用搜索引擎三、计算机检索技术1.常用的算符有布尔逻辑算符、位置算符、截词符、限制符等。