当前位置:文档之家› 管理信息学

管理信息学


•人工收集:跟踪和选择一定范围或领域的 WWW 站点或页面,
按规范方式进行分类标引并组建索引数据库; •自动收集:通过自动采集器软件搜寻页面并自动维护数据库。
第16页
管理信息学 杨善林 胡笑旋编著
第3章 信息采集与存储
常用网络搜索
• 通用搜索引擎: • 常用科学文献搜索引擎: 万方数据库 中国期刊网 ProQuest ABI/Inform ISI Web of Science Sciencedirect IEEE Springer …
铁锹实验(科学管理之父---泰勒)
早先工厂里工人干活是自己带铲子。铲子的大小也就 各不相同,而且铲不同的原料时用的都是相同的工具,那么在铲 煤沙时重量如果合适的话,在铲铁砂时就过重了。
泰勒通过实验发现,每个工人的平均负荷是 21磅,后来他就
不让工人自己带工具了,而是准备了一些不同的铲子,每种铲子 只适合铲特定的物料,这不仅使工人的每铲负荷都达到了 21磅, 也是为了让不同的铲子适合不同的情况。
c i 1
i
为x的总概率,是与x相关的常量。则二元识别公式为:
如果P(x|ω1)P(ω1)>P(x|ω2)P(ω2) ,那么x∈Ω1,否则x∈ Ω2 如果P(x|ω1)/P(x|ω2)>P(ω2)/P(ω1) ,那么x∈Ω1,否则x∈ Ω2 似然函数比
先验概率阈值
第26页
管理信息学 杨善林 胡笑旋编著
第3页
管理信息学 杨善林 胡笑旋编著
第3章 信息采集与存储
信息的收集——实验方法
•实验方法可以在一定程度上直接观察研究到某些参量之间的 相互关系,甚至是因果关系。这有利于对事物本质的研究。 •实验方法有物理实验、对比实验等形式。物理实验是研究具 体的物理系统或物理对象的内在规律;对比实验一般是从较 高级别研究同类个体在不同的环境和条件下的差异及其内在
获取正常手段难以获得的信息或结论。
•特定信息是指在被考察对象的自然状态下,用普通的观察 (调查)方法难以获得的准确、真实的信息。
第2页
管理信息学 杨善林 胡笑旋编著
第3章 信息采集与存储
信息的收集——实验方法
•限定信息产生条件是获得信息的实验方法的本质特征,也是
一个方法能够称之为实验方法的必要条件 •实验参与者对实验结果将会产生重要影响,所以对参与者有 恰当的限制 •信息或数据的产生过程是每一个实验设计都必须完成的工作, 但其方法和手段,在不同的实验中,差异很大
如果P(ω1 |x)>P(ω2 |x),那么x∈Ω1,否则x∈ Ω2
第25页
管理信息学 杨善林 胡笑旋编著
第3章 信息采集与存储
统计分类识别:二元识别
•实际上,根据贝叶斯公式有:
P i x p x i P i p x
其中 p x p x P i
•事实检索是以事实为检索内容的信息检索,事实是从原始文献 中抽取的,并有简单的逻辑判断能力,是有关某一事物的具体 答案。
第13页
管理信息学 杨善林 胡笑旋编著
第3章 信息采集与存储
文献检索方法
•文献检索方法有直检法、引文法、工具法和循环法等。
–直检法是从浏览查阅原始文献中直接获取所需文献的方法; 为线索,进行逐一追踪的查找方法; –工具法就是通过检索工具和检索系统查找文献的方法,是
第3章 信息采集与存储
3.3 信息组织 3.3.1 信息组织的概念 3.3.2 信息组织的原理 3.3.3 信息组织的层次
第27页
管理信息学 杨善林 胡笑旋编著
第3章 信息采集与存储
3.3.1 信息组织概念
信息组织环节位于信息采集环节之后 ,它是对所采集的信息资源
进行序化处理的过程。:
索。
•计算机检索是文献检索的主流和趋势。 •计算机检索组成:文献数据库和信息检索系统。
•文献数据库是将原始文献按照主题词表或分类表及使用
原则进行处理,形成特征标识后,按一定规则存放的数据 库; •信息检索系统是一种信息检索工具,它将提问标识与文 献数据库中的标引标识进行比较,两者一致或标引标识包 含提问标识,则输出该信息。
Ω=Ω1∪Ω2 Ω1∩Ω2= Ωi ={ωi} i=1,2
第24页
管理信息学 杨善林 胡笑旋编著
第3章 信息采集与存储
统计分类识别:二元识别策略
在自然状态下,先验概率P(ω1) 和P(ω2)通过统计是可以知道
的,先假定收到一个未知模式 x ,问题是识别这个模式究竟是
属于Ω1还是属于Ω2?
若能计算出条件概率 P(ω1 |x)和P(ω2 |x),那么合理的决策 (二元识别公式)是:
管理信息学 杨善林 胡笑旋编著
第3章 信息采集与存储
模式匹配法:余弦测度
•余弦测度:设输入模式 x 与标准模式 rk 均为 p 维空间
向量,则x与rk的类似度被定义为: 其中:
s k x x, r k / x r k

k

( x, r ) x r
k
p
1
第23页
•文献有零次文献、一次文献、二次文献和三次文献 四个级别
•一次文献以作者本人取得的成果为依据而创作的论文、报告等 经公开发表或出版的各种文献。如:期刊论文、学位论文、科 技报告、专利说明书、技术标准等。 •一次文献在整个文献中数量最大、种类最多、使用最广、影响 最大,是文献检索和利用的主要对象。 •一次文献内容新颖丰富,叙述具体详尽,参考价值大,但数量 庞大、分布分散。
包括专题评述、年鉴、百科全书、词典、索引与文献服务目
录、工具书目录等。
第12页
管理信息学 杨善林 胡笑旋编著
第3章 信息采集与存储
文献检索对象
•文献检索分为原文检索、数据检索、事实检索和全文检索
•原文检索以文献原文为检索对象;
•数据检索是以数据为检索内容的信息检索,这些存储在系统的
大量数据是经过测评、评价、筛选过的、可直接用于定量分析;
用户在特定的时间和条件下所需文献的过程。
•文献资源是指传统的介质(纸张)和现代介质(如微缩胶片、 磁盘、光盘、优盘、硬盘等)记录和存储的知识信息。 •文献通常包括图书、期刊、会议文献、科技报告、专利文 献、标准文献、学位论文、产品资料、技术档案和政府出版 物等。
第8页
管理信息学 杨善林 胡笑旋编著
第10页
管理信息学 杨善林 胡笑旋编著
第3章 信息采集与存储
文献检索资源分类
•文献有零次文献、一次文献、二次文献和三次文献 四个级别
二次文献是按照特定目的对一定范围和学科领域内的一次文献进行
鉴别、筛选、分析、归纳和加工整理等,使之有序化后出版的工具
书和书刊; •二次文献主要功能是检索、通报、控制一次文献,帮助人们在较
第15页
管理信息学 杨善林 胡笑旋编著
第3章 信息采集与存储
信息的收集——网络收集方法
•网络方法是通过网络特别是Internet收集有关网络信息资源 •网络信息资源可理解为“通过计算机网络可以利用的各种信息资源 的总和” •网络收集方法是通过网络搜索引擎实现对有关信息的收集 •网络搜索引擎:按照一定的规律和方式对网络上 WWW、FTP等站 点进行搜索,并将搜索到的页面信息存入临时数据库。
•语言学。 我们一般将事物的属性抽象为字、词或概念 ,然后再通
过字、词或概念的序化来表征信息的组织。 •逻辑学。 信息组织本身是思维的一种表现形式 , 概念是思维的元 素,逻辑则是思维的规则。 •系统论。 信息组织也是一个系统化的过程 , 其最终目的是将无序
第6页
管理信息学 杨善林 胡笑旋编著
第3章 信息采集与存储
信息的收集——实验方法
霍桑实验(梅奥)
• • • • 照明实验 福利实验 访谈实验 群体实验
第7页
管理信息学 杨善林 胡笑旋编著
第3章 信息采集与存储
信息的收集——文献检索 •文献检索是以文献为检索对象的信息检索,即利用相应的 方式与手段,在存储文献的检索工具或文献数据库中,查询
的原因,或研究不同条件对个体的影响。
第4页
管理信息学 杨善林 胡笑旋编著
第3章 信息采集与存储
信息的收集——实验方法

从实现实验的手段看,可分为: • 仿真实验:创设与真实环境几乎完全相同的情境(实 验室仿真和计算机仿真) • 现场实验
第5页
管理信息学 杨善林 胡笑旋编著
第3章 信息采集与存储
信息的收集——实验方法
“信息组织是将处于无序状态的特定信息 ,根据一定的原则和方 法,使其成为有序状态的过程,其目的是将无序信息变为有序信息,方 便人们利用信息和有效地传递信息。”
第28页
管理信息学 杨善林 胡笑旋编著
第3章 信息采集与存储
3.3.2 信息组织原理
信息组织是是基于事物属性的一种序化方法 ,事物具有多少种 属性,就可能形成多少种序化方法。
管理信息学 杨善林 胡笑旋编著
第3章 信息采集与存储
统计分类识别:工作原理 统计分类是基于概率统计模型得到各类别的特征向量分布,
以取得分类的功能。
统计识别法的基本工作原理(贝叶斯分类方法的二元识别 ): 设任一模式只有两种可能的类属 ω1和ω2,用符号Ω表示模式 空间,Ω1表示第一类模式的子空间,Ω2表示第二类模式的子 空间,满足:
第17页
管理信息学 杨善林 .2.4 信息的识别
信息识别模型
信息识别方法:模式匹配法
信息识别方法:统计分类识别 信息识别方法:神经网络方法
第18页
管理信息学 杨善林 胡笑旋编著
第3章 信息采集与存储
信息识别模型 •信息识别是判断所感知、收集的信息是否是所希望的信息。 信息感知是确定“有没有信息” ,信息识别是确定“有什么
相关主题