当前位置：文档之家› 第八章_机器学习与空间信息处理_研究生

第八章_机器学习与空间信息处理_研究生

举例说明
例如，由“麻雀会飞”、“鸽子会飞”、“燕子会飞”…… 这样一些已知事实，有可能归纳出“有翅膀的动物会飞”、 “长羽毛的动物会飞”等结论。这些结论一般情况下都是正确的，但当发现鸵鸟有羽毛、有翅膀，可是不会飞时，就动摇了上面归纳出的结论。上面归纳出的结论不是绝对为真的，只能以某种程度相信它为真。
第四阶段：
从20世纪80年代后期至现在，机器学习的研究进入了一个全面化、系统化的时期。一方面，传统符号学习的各种方法已全面发展并且日臻完善，应用领域不断扩大，达到了一个巅峰时期。另一方面，机器学习基础理论的研究越来越引起人们的高度重视。随着机器学习技术的不断成熟和计算学习理论的不断完善，机器学习必将会给人工智能的研究带来重大突破。
（1）学习过程
（2）检索过程
可以把执行部分抽象地看成某一函数，这个函数在得到自变量输入值(x1,…,xm)之后，计算并输出函数值(y1,……yn)，然后系统会把输入值与输出值合并起来作为一个存储对[(x1,…,xm) ， (y1,…,yn)]存储起来。对于该系统，输入值(x1,…,xm)表示待解决的问题，而输出值 (y1,…,yn)则对应于问题的解决方案。以后若遇到求解问题(x1,…,xm)时，系统会从知识库中寻找对应的(y1,…,yn)而不是重新计算。
影响学习系统设计主要的因素： 1. 信息的质量 2. 知识的表示
信息质量的因素
环境向系统提供的信息，即信息的质量是影响学习系统设计的最重要的因素。知识库中存放的是指导执行的一般原则，而环境向系统提供的是各式各样的信息。如果提供的信息质量比较高，与一般原则的差别比较小，则学习部分就比较容易处理，反之，如果外界输入的信息比较杂乱无章，系统处理这些信息的难度将会大大增加。
存储与计算间的权衡
机械学习的根本目的是改进系统的执行能力，对于机械学习来说很重要的一点是它不能降低系统的效率。如果检索一个数据比重新计算一个数据所花的时间更多，那么这样的机器学习就失去了意义。这种存储与计算之间的权衡问题的解决方法有两种。 ①一种方法是估算一下存储信息所要花费的存储空间以及检索信息时所花费的时间，然后将其代价与重新计算所花的代价比较，再决定存储信息是否有利。 ②另一种方法是把信息先存储起来，但为了保证有足够的检索速度，限制了存储信息的量，系统只保留那些最常使用的信息，“忘记”那些不常使用的信息。这种方法也叫“选择忘却”技术。
基于机械学习的空间信息处理
机械学习的基本思想：当机械学习系统的执行部分解决完一个问题后，系统就记住这个问题和它的解，将知识的输入值和输出值作为一个存储对进行存储，以后遇到新问题时不需要重新计算，只需要从知识库中查找与新的输入值匹配的知识，直接将其输出值输出作为问题的解。在空间知识库中有很多规则性知识，其基本形式为 IF A THEN B 可将这种规则性的空间知识的前件A和后件B分别作为机械学习的输入值和输出值直接存储，即(A, B)。
在教育学领域中，学习一般被认为是人类个体在认识与实践过程中获取经验和知识，掌握客观规律，使身心获得发展的社会活动。在心理学领域中，学习是指人和动物因经验而引起的倾向或能力相对持久的变化过程。在人工智能中，学习是系统内部的适应性变化，使系统在以后从事同一任务或同一问题范围中类似的任务时，效率更高。
机械学习需要注意的几个问题：
（1）信息的存储与组织。（2）信息的适应性。（3）存储与计算间的权衡。
信息的存储与组织
只有当检索一个项目的时间比重新计算一个项目的时间短时，机械学习才有意义，检索的越快，其意义也就越大。采用适当的存储方式，使检索速度尽可能地快，是机械学习中的重要问题。在数据结构与数据库领域，为提高检索速度，人们研究了许多卓有成效的数据存储方式，如索引、排序、杂凑等，在机械学习中可以充分利用这些成果。
机器学习的基本结构
以西蒙的学习定义作为出发点，建立学习模型。
学习就是系统在不断重复的工作中对本身能力的增强或者改进，使得系统在下一次执行同样任务或类似任务时，会比现在做得更好或效率更高。（西蒙）
环境是指外部信息的来源，它向系统的学习提供有关信息；学习指系统的学习机构，它利用环境提供的外部信息进行分析、综合、类比、归纳等思维过程获得知识，并将这些知识存入知识库中，以增进系统执行部分完成任务的效能；知识库用来存储知识，存储时要进行适当的组织，使它既便于应用又便于维护和更新；执行环节根据知识库中的知识完成任务，处理系统面临的问题，即应用学习到的知识求解问题；评价环节用于验证、评价执行环节的效果，并将获得的信息反馈给学习部分，学习部分将根据反馈的信息对知识库进行修改和调整从而完善知识库的构成。
机器能否象人类一样能具有学习能力呢？
持否定意见的人的一个主要论据：机器是人造的，其性能和动作完全是由设计者规定的，因此无论如何其能力也不会超过设计者本人。这种意见对不具备学习能力的机器来说的确是对的，可是对具备学习能力的机器就值得考虑了，因为这种机器的能力在应用中不断地提高，过一段时间之后，设计者本人也不知道它的能力到了何种水平。
机器学习(machine learning)的定义
至今，还没有统一的“机器学习”定义，而且也很难给出一个公认的和准确的定义。从字面上理解，机器学习是研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，方式上主要适用归纳、综合而不是演绎(Michael Dawson, 1998)。 Tom M.Mitchell对“机器学习”的定义：对于某类任务T和性能度量P，如果一个计算机程序在T上以P衡量的性能随着经验E 而自我完善，那么称这个计算机程序在从经验E中学习。
第二阶段：
20世纪60年代中期至70年代中期，被称为机器学习的冷静时期。本阶段的研究目标是模拟人类的概念学习过程，并采用逻辑结构或图结构作为机器内部描述。机器能够采用符号来描述概念，并提出关于学习概念的各种假设。本阶段的代表性工作有Winston的结构学习系统和Hayes Roth等人的基于逻辑的归纳学习系统。虽然这类信息系统取得较大的成功，但只能学习单一概念，而且未能投入实际应用。
8.3 归纳学习与空间信息处理
归纳(induction)是人类拓展认识能力的重要方法，是一种从个别到一般、从部分到整体的推理行为。归纳推理是应用归纳方法，从足够多的具体事例中归纳出一般性知识，提取事物的一般规律。在进行归纳时，一般不可能考察全部相关事例，因而归纳出的结论无法保证其绝对正确，但又能以某种程度相信它为真。这是归纳推理的一个重要特征。
机器学习的策略
按照学习策略中使用推理的多少，机器学习策略大体可分为4种：机械学习归纳学习类比学习解释学习推理过程使用的越多，学习系统的能力就越强。
8.2 机械学习与空间信息处理
机械学习基本方法机械学习又被称为死记硬背式的学习，它是一种最简单用到相关知识的时候直接搜寻知识库，整个过程中没有推理和重新计算的环节。机械学习的过程比较简单，是其它学习的基础，任何学习系统都必须记住问题和与它相关的求解知识。
举例说明
医疗系统的程序：这个程序是根据患者的症状自动找出相应的治疗方案，对于这样一个系统输入的是某个病症的描述，输出的是该病症相对应的治疗手段。这个系统是一个机械学习系统，所以对于一个输入的症状描述，它首先会在知识库中寻找能够与之对应的病例案例，如果不能找到这样的病例，则由医生人为地进行诊断，并将最终的诊断结果与病症作为一个知识存入知识库，以便后续治疗使用。另外，对于有些病症，它的治疗方案会随着时间的推移发生变动，知识库也应该做相应的调整以保证正确性和完整性。
信息的适应性
对于一个变化的环境，系统的知识库中的知识必须能够适应这种变化过程并作出及时的调整，否则系统一旦遇到外界环境的变化就会瘫痪。上述的医疗系统为例，我们知道，流行感冒是一类随着时间变化而变化的病症，对于这种病症，就不能采取某一种固定的治疗方案，以往的治疗经验并不足以治愈它。因此，这样的医疗系统必须有比较强的信息适应性，能够根据实际情况及时更新知识库以适应外界环境的变化。在急剧变化的环境下，机械学习策略是不适用的。作为机械学习基础的一个重要假定是在某一时刻存储的信息必须适用于后来的情况。然而如果信息变换得特别频繁，这个假定就被破坏了。
归纳学习
归纳学习(induction learning)是应用归纳推理进行学习的一种方法。根据归纳学习有无教师指导，可把它分为 1. 示例学习 2. 观察与发现学习前者属于有师学习，后者属于无师学习。
20世纪50年代中期到60年代中期，属于热烈时期。这个时期研究的是“没有知识”的学习，即“无知”学习；其主要研究方法是不断修改系统的控制参数以改进系统的执行能力，不涉及与具体任务有关的知识。这一阶段的机器学习主要侧重于非符号的神经元模型的研究，研制通用学习系统，即神经网络或自组织系统。这种脱离知识的感知型学习系统具有很大的局限性，远不能满足人们对机器学习系统的期望。
第三阶段：
20世纪70年代中期至80年代后期，称为复兴时期。在这个时期，人们从学习单个概念扩展到学习多个概念，探索不同的学习策略和各种学习方法。大量的学习系统涌现出来，比较有代表性的是Michalski的 AQVAL，Buchana等人的Meta-Dendral，Lenat的AM， Langley的BACON，Quinlan的ID3等。 1980年，在美国的Carnegie-Mellon大学召开了第一届机器学习国际研讨会，标志着机器学习研究已在全世界兴起。 1986年，第一个机器学习杂志《Machine Learning》正式创刊，迎来了机器学习蓬勃发展的新时期。
地理信息智能化处理, 武汉大学遥感信息工程学院2010级硕士生

e商务文档

第八章_机器学习与空间信息处理_研究生

相关文档推荐：