第二章习题参考答案一.名词解释(1)信息收集:信息收集就是信息的接收或汇集。
它是指根据特定的目标和要求,将分散蕴涵在不同时空域的相关信息,通过特定的手段和措施,采掘和汇聚的过程。
信息收集是信息处理过程的起点,并贯穿于信息处理过程的始终。
(2)信息感知:信息感知,就其本身而言,它只是感受到了事物运动状态及状态变化方式的形式化方面,并不理解事物运动状态及其变化方式的逻辑含义和它的效用价值。
因此,信息感知的输出结果只是语法信息,而不是语义信息或语用信息。
(3)数据采集:信息传感一般是指通过物理手段收集信息,就是我们一般意义上的数据采集。
(4)模式识别:基于语法信息的信息识别模型正是人工智能中模式识别理论所研究的基本问题。
这里,所谓模式,就是某种事物运动状态及其变化方式的形式,即语法信息。
因此,模式识别就是语法信息的识别。
二.论述题1. 信息收集的原则是什么?有哪些常用方法?答:(1)信息收集的原则主要有可靠性原则、完整性原则、实时性原则、准确性原则和易用性原则。
(2)信息收集的常用方法有调查法,观察法,实验方法,文献检索和网络信息收集。
信息收集的方法还有查阅法、视听阅读法、集采法、联系法等2. 调查法有哪些方式?实验法有哪些形式?根据加工深度,文献是如何分类的?答:(1)调查方法一般分为普查和抽样调查两大类。
(2)实验方法也有多种形式,如实验室实验、现场实验、计算机模拟实验、计算机网络环境下人机结合实验等等。
(3)文献根据加工深度的不同可分为四个级别:零次文献、一次文献、二次文献和三次文献。
所获取的相应信息分别是零次信息、一次信息、二次信息和三次信息。
①零次文献是指未经出版社发行的或未进入社会交流的最原始的文献,如私人笔记、考察笔记等,内容新颖,但不成熟,不公开交流,难以获得。
②一次文献是以作者本人取得的成果为依据而创作的论文、报告等经公开发表或出版的各种文献,如期刊论文、科技报告等。
其特点是内容新颖丰富、叙述详尽以及参考价值大,但数量庞大而且分散。
③二次文献是指报道和查找一次文献的检索工具书刊,如各种目录、题录、文摘和索引等。
二次文献是按照特定目的对一定范围和学科领域内的一次文献进行鉴别、筛选、分析、归纳和加工整理等,使之有序化后出版的。
其主要功能是检索、控制一次文献,帮助人们较快地获取所需的信息,具有汇集性、工具性、综合性和交流性等特点。
④三次文献是根据二次文献提供的线索,选用大量的一次文献的内容,经过筛选、分析、综合和浓缩而再度出版的文献,包括专题评述、年鉴、百科全书、词典、导读与文献服务目录、工具书目录等。
3. 简述网络信息的收集系统的组成以及各部分的主要作用。
答:互联网网络信息搜索网络信息整合数据库保存检索服务各部分主要作用:网络信息搜索是基于网络信息收集系统自动完成的。
网络信息搜索系统首先按照用户指定的信息需求或主题,调用各种搜索引擎进行网页搜索和数据挖掘,将搜索的信息经过滤等处理过程剔除无关信息,从而完成网络信息资源的“收集”;然后通过计算机自动搜索、重排等处理过程,剔除重复信息,再根据不同类别或主题自动进行信息的分类,从而完成网络信息的“整合”;分类整合后的网络信息采用元数据方案进行索引编目,并采用数据压缩及数据传输技术实现本地化的海量数据存储,从而完成网络信息的“保存”,当然要通过网络及时更新;经过索引编目组织的网络信息正式发布后,即可通过检索为读者提供网络信息资源的“服务”。
网络信息收集系统是一个汇集了各种网络信息收集技术的计算机程序集成系统,其中主要采用了网页收集、网络信息挖掘和网络信息过滤等技术。
4.对信息源进行评价的方法有哪些?简述间接评价法的具体程序。
答:(1)对信息源进行评价一般采用两种方法:一种是信息工作者根据对信息源的一般要求对信息源进行评分,这种方法称为直接评价法:另一种是调查信息利用者对各种信息源的利用情况或由信息利用者根据自己的实践需要来评价信息源,该方法称为间接评价法。
(2)计算评分平均值评分比重最高评分频度平均名次指标来评定5.对信息收集的效率如何评价?信息准确度的比较评价怎么进行?信息的经济性评价从哪些方面进行?答:(1)对于信息收集的过程,可以用收全率、收准率、及时率、费用率和劳动耗费等五个指标来衡量和评价其效率,这些指标一般通过信息内容与信息需求的相关程度(切题性或相关性的概念)来确定。
(2)信息评价的另一个重要方面是比较评价信息的准确度,可以从两种角度来进行。
第一种角度包括下面三种方法:①从不同的信息源获得同一性质的信息,对这些信息进行比较;②定期地、系统地收集信息,调查过去同种信息是否出现并和新获取的信息进行比较评价;③从多种信息源搜集、分析同种信息和相关信息,与切题的信息进行比较评价。
第二种角度是从信息所含的六个要素出发评价信息的准确度。
任何信息都包含六个要素:内容(What)、原因(Why)、时间(When)、地点(Where)、人(Who)、状况(How),即“5W1H”。
对信息进行比较评价时,要把信息分解成上述六个方面,其步骤大致如下:①把信息分成六个要素,按要素分成不同的组;②分析各组中有无共同点,把具有共同点的信息抽出来;③将抽出来的具有共同点的信息要素构成信息形态;④把组成信息形态的要素分别同原信息进行比较;⑤根据比较结果,对被认为最有共同点的原信息做进一步调查检验,分析它与其他信息的相关程度、相关的交接点等。
(3)为了经济而有效地搜集信息,可以从以下几个方面出发来进行信息评价:①对所需信息存在率的评价:这一步要调查有关的信息源、载体、实物(产品等)是否存在,如果存在,要用什么方法从何种途径获得,评价获取的难易程度。
②对所需信息适合率的评价:评价获取的信息与所需信息的内容吻合程度。
例如,解决问题的有效程度,为利用该信息而需要加工处理的必要程度等都是评价的尺度。
③对所需信息可靠性的评价:对于二次信息和三次信息,应评价其性质、加工深度、是否能获得证明来确认其可靠性。
此外,由于信息既可以传递某一事物或课题的全部内容,也可以传递部分内容,因此,根据其所处的位置便可评价信息的可靠性。
6.简述数据采集系统的基本功能和基本组成部分。
答:数据采集系统的软件功能十分丰富,主要功能有(1)系统总貌。
提供所有输入点信号的位号、名称、单位、当前指示值、上下限及有关说明;(2)流程图画面。
显示过程对象带检测点的整个工艺流程图、动态显示各测点位置及当前值、各设备运行状态(如开停、超限等);(3)历史数据。
存储并显示有关测量点在一定时间范围内的一定时间间隔的实时数据值;(4)历史趋势。
存储并显示有关测量点在一定时间范围的变化曲线。
相关参数曲线可同时在一幅画面上用不同颜色显示,即趋势分组;(5)量程分段及线性化处理。
为提高显示精度,可将某些参数的量程分成数段,每屏一段,并可用软件方式对被测量过程进行线性化处理;(6)打印或通信。
可实现定时或即时打印或通信。
此外,根据用户要求,可编制其它管理和服务程序,如操作指导、统计分析等。
数据采集系统的结构参见图2.6。
7.阐述模式识别的处理过程及各部分的主要功能。
答:参见图2.8给出了模式识别的基本过程。
对于非电量输入模式,首先必须先把它们转换成电信号,然后通过模/数转换,使之成为计算机能接受的数字量。
为了使输入模式满足识别的要求,还要根据具体情况对模式进行预处理,如滤波、坐标变换、图象增强、边界检测等,以便滤除样品收集过程中掺入的干扰和噪声,并人为的突出有用信号,使模糊的模式变得清晰,以得到良好的识别效果。
经过预处理后,要根据识别方法的要求对满足识别要求的模式进行抽取、选择特征和基元,作为识别的依据。
这是模式识别的关键,对识别的效果有直接的影响,好的模式特征能使不同类别的模式表现出很大的差别,有利于设计出性能较高的分类方法。
8. 模式识别有哪些主要方法?简述它们的主要特点。
答:模式分类的方法大致可分为统计识别方法、句法结构方法、模糊判决方法和人工神经网络方法四大类。
统计识别方法是从被识别的模式中选择能足够代表它的若干特征,每个模式的特征都组成一个特征向量,于是每一个模式就在特征空间中占有一个位置。
可以用不同的方法来分割特征空间,使得同一类模式大体上都在特征空间的同一区域中。
这样,对于待分类的模式,就可根据它的特征向量位于特征空间中哪一个区域而判断它属于哪一类模式。
句法结构方法立足于分析模式的结构信息,可以把模式类比于语言中句子的构造。
句子由单词按文法规则构成,同样,模式由一些模式基元按一定的规则组合而成。
分析模式如何由基元构成的规则,就是结构分析的内容,这相当于对一个句子作句法分析。
句法结构模式识别就是检查代表这个模式的句子,是否符合事先规定的某一类文法规则。
如果符合,那么这个模式就属于该文法所代表的那个模式类。
模糊判决方法以模糊数学为基础,是一种集合运算。
对某模糊集合设计隶属度函数,作为样品与模板间相似程度的度量,从而将模糊集合划分为若干子集,然后根据就近原则分类。
人工神经网络方法以神经生理学和神经心理学为基础,是一个模拟神经机理的非线性动态系统。
它通过对样本的学习建立起记忆,然后将未知模式按其最接近的模式进行判别。
这四类方法各有优缺点,但在图象识别中都得到了广泛应用。
前两类方法发展得比较成熟,是研究模式分类的基础方法。
模糊数学和人工神经网络应用于图象识别领域也取得了较大进展,拓宽了研究者的思路。
三.讨论题1.信息收集还有哪些新技术(除了书本所介绍的技术外)?2.如何评价网络信息的价值?请举出实际例子。
[说明]讨论题要求学生从其他途径,如查阅资料,上网等方式,结合实际具体例子解答。