人文社科文献检索课 第五章
3. 网址
定义:又称统一资源定位器(Uniform Resource Locator,简称URL),代表了网上一切资源,包括 上网计算机及其各种文件的地址。网址是由域名加 文件地址构成的。 作用:指明信息资源所在的目录和文件名,还指明 信息文件存在于网络的那个计算机上,以及可以访 问的方式等。 4. 网上常见文件格式和后缀名 bmp. Windows位图 jpg. Jpg静态图形 swf. 动画 asf. 流媒体 rm. Real Video
二、搜索引擎的基本概念
1. 搜索引擎的定义:Search Engines是网上信息搜 索工具的通称。可以是一个独立的每户网站,也 可以是附在其他类型网站或主页上的一个搜索工 具。 2. 搜索引擎的类型 3. (1)按工作方式区分,分为主题引擎、目录 引擎和多元引擎。可分为主题引擎、目录引擎和 多元引擎。 a. 主题引擎一般由搜索软件(spider、robot、 crawler),索引软件(它的任务是建立索引)和 检索软件三部分组成。它的优点是信息量大、更 新及时、无需人工干预
学术网站的分类:
1. 按内容特征 综合性社会科学学术网站 专科性社会科学学术网站 2. 按主办机构 个人网站 杂志社网站 科研机构网站 3.按网站功能 学科门户网站 学科资源网站 学科性论坛博客网站
4.学术网站的判断方法 a. 网站和网页的区别,主要依据显示网页 的结构和内容。 b. 学术和非学术网站的区别主要依据网站 本身的主旨介绍。
二、网络信息资源的特点
1. 2. 3. 4. 5. 数量庞大,增长迅速(网页增长) 整体无序,局部有序(无序性特征) 更新频繁,变化无常(网页寿命) 多维显示,交互方便(载体类型/通讯方式) 良莠混杂,参差不一
三、网络学术信息资源类型
定义:与学术研究有关的网络资源。 A. 按内容区分:1. 网上传播的学术机构信息 2. 学术任务信息 3. 科研信息 4. 科研成果信息 B. 按出版类型区分:网上学术信息资源有着和纸 质型出版物类似的对应信息,但这种对应关系 并非一一对应的。
缺点是返回信息中常有很多无关信息,身子有一定比例的死链 接,用户必须从结果中进行筛选。
b.目录引擎又称目录指南性搜索引擎。这种引擎的信 息收集和处理有人工干预过程,信息处理的层席位网 站,检索所得结果的网页中不一定含有检索词。 目录引擎的用户界面基本上都为分级结构。 ► 它与主题引擎的主要区别是由于目录引擎旨在数据库 保存的编辑人员对站点的描述中进行搜索,因此站点 本身的动态变化不会反映到搜索结果中来。 c.多元引擎又称圆搜索引擎。它本身没有存放网页信 息的数据库,当用户查询一个关键词是,它把请求转 换成其他数个搜索引擎能够接受的命令格式,并行地 活着有选择性的访问这些搜索引擎并查询这个关键词, 处理这些搜索引擎返回的结果,然后再返回给用户。 多元引擎的服务方式为面向网页的检索。但是严格来 说,它只算是一个用户代理。
网上商用数据库
网上公开资源
一次资源
二次资源
一次资源
二次资源
全 文 期 刊 数 据 库
全 文 图 书 数 据 库
其 他 全 文 数 据 库
期 刊 文 摘 数 据 库
会 议 文 摘 数 据 库
其 他 文 摘 数 据 库
学 术 机 构 网 站
个 人 学 术 网 站
其 他 学 术 网 站
i P A C 数 据 库
2. IP地址和域名的关系及常见域名
关系:域名只有作为服务器的计算机必须,域名和IP地 址间有对应互换的关系,域名更方便记忆。 常见域名及其含义: .ac — academic .co — commercial .com — commercial .edu — educational .gov — governmental .net — Internet service provide 国家、地区域名: .ca — Canada .cn — China .de — Germany .int — International .gb — Great Britain .uk — United Kingdom
5.2 网络信息检索工具和检索方法
一、相关概念 1. IP地址和域名 2. IP地址:因特网协议(Internet Protocol)地址, 类似于计算机在信息高速公路上的门牌号码。由四段数 字组成,中间用圆点隔开,例如202.201.160.175 3. 域名:Domain Name,简称DN。一般由代表通讯协 议、主机名、机构性质域名四段字母组成,类似于服务 器在信息告诉公路上的门牌号码,例如。 4. 主机(host):又名服务器名称,通常是使用机 构的简称。
搜 索 引 擎 数 据 库
虚 拟 图 书 馆 网 络 导 航
其 他 网 络 二 次 资 源
四. 人文社会科学学术网站
1. 网页、网站和主页的概念 2. 网页:学名HTML文件,是一种可以在互联网上 传输,并被浏览器认识、翻译成页面显示出来的文 件。 网站:有独立域名,由若干相关网页组成的一个站 点。(一般每个网站都有一个主页Homepage) 主页:用户通过超链接访问其他网页或服务器的起 始点,用于引导访问者浏览网站。 2. 人文社会科学学术网站的类型 3. 网络学术信息资源的主要来源:学术网站 4.
C. 按照是否具有原创性区分: 1. 一次资源(原创性) 2. 二次资源(转载或提取) D. 按照是否经过审核: 1. 正式出版物(ISBN/ISSN,学术价值相 对较高) 2. 非正式出版物(学术价值变化较大) E. 按照是否属于搜索引擎范围:(400:1) 1. 不可见资源 2.可见资源
网络学术信息资源
第五章 网络信息利用原理
5.1 5.2 5.3
网络信息资源 网络信息检索工具 学术网站的评价方法Leabharlann 5.1网络信息资源
一、什么是网络信息资源? 广义:网络信息资源是在网上以各种方式存 在并传播的信息集合。
具体表现:网上计算机中的无数信息、网上的各种 信息工具以及网络通信渠道。 网上信息:计算机中的数据库、电子出版物、网页、 软件以及各种文件所包含的信息。 信息工具:FTP,Telnet,e-mail,WWW浏览器, 搜索引擎等。 网络通讯渠道:网络提供的信息交流渠道。
狭义概念:网络信息资源通常只指公网上 的信息资源,即访问不受任何限制的信息 资源,它不包含使用权受IP、用户名及其密 码限制的资源。商业性数据库因可以通过 网络加以使用,将它们归入网络信息资源 是可以的,但由于这些数据库的使用或者 受IP限制,或者要求用户名和密码,是不能 归入公网信息资源范畴的。 (本章将要介绍的内容仅限于狭义的网络信 息资源,不包括使用权有限制的网上信息 资源。)