当前位置:文档之家› 神经网络与人工智能论文

神经网络与人工智能论文

人工神经网络及其应用总论人工神经网络及其应用总论【摘要】本文介绍了人工神经网络的概念,主要讲述了人工神经网络的特征、基础知识、一般结构和分类,进一步说明了人工神经网络学习和训练,模型的建立过程,最后综述了其应用。

【Abstract】This paper introduces the concept of artificial neural networks ,mainly discusses the features,base knowledges,the general structure and classification of artificial neural networks.And it further illustrates the artificial neural networks' learning, training,the process of model building.finally it introduces the applications of artificial neural networks.【关键词】神经网络人工智能【Kay words】Artificial Neural Networks Artificial intelligence0 引言人工神经网络(Artificial Neural Network,ANN),是由大量处理单元(即神经元Neurons)广泛连接而成的网络,是对人脑的抽象、简化和模拟,反映人脑的基本特征。

人工种经网络的研究是从人脑的生理结构出发来研究人的智能行为,模拟人脑信息处理的功能。

它是根值于神经科学,数学.统计学、物理学、计算机科学及工程等学科的一种技术[1]。

人工神经网络是计算智能和机器学习研究中最活跃的分交之一。

1 神经网络概念lech-Nielsen将神经网络定义为一个并行、分布处理结构,它由神经元及其称为联接的无向讯号通道互连而成。

这些神经元具有局部内存,并可以完成局部操作。

每个神经元有一个单~的输出联接,这个输出可以根据需要被分支成希望个数的许多并行联接,且这些并行联接都输出相同的信号,即相应神经元的信号,信号的大小不因分支的多少而变化。

神经元的输出信号可以是任何需要的数学模型,每个神经元中进行的操作必须是完全局部的。

也就是说,它必须仅仪依赖于经过输入联接到达神经元。

人工神经网络(ANN)与基于传统模型的方法相比,它具有非线性、数据驱动并自适应等特点。

它是建模强有力的工具,尤其是当基本数据之间的关系未知时,其显威力。

ANN能够辨识和学习输入数据集和相应目标值之间的关系。

训练后,ANNs用来预言新输入数据的输出值。

ANN能模仿人脑的学习过程,能够处理含有非性并复杂数据的问题,即使数据不完整及带有噪音。

因此,它很适合于被认为复杂和非线性的农业数据建模。

这些网络最重要的特征就是适应属性,即问题解决中,“由事例学习”替代“编程”。

此特征使该计算模型适用于训练数据现成,但对问题理解少或不完整的情况。

ANN一直用于使用传统统计方法的许多不同领域。

它一直用于分类问题,如识别水下声纳流,语音识别及预测球状蛋白的次结构。

时问序列方面,ANN被用于预测股市行情。

对于统计学者,这些问题一般通过经典统计方法如离散分析、逻辑回归、贝叶斯分析、多层回归和ARIMA时间序列模型来解决。

神经网络因强大的数据分析能力,将替代经典数据分析方法。

[2]随着人工神经网络的发展,其用途日益广泛,应用领域也在不断拓展,已应用于工智能、自动控制、计算机科学、信息处理机器人、模式识别等各个工程领域。

2 人工神经网络的基础人工神经网络术语来自人脑的生物模型神经网络由互相连接的细胞(神经元)集组成。

神经元接受来自输入细胞或者其它神经元的脉冲,对输入进行某种转换,然后将输出传递给其它神经元或输出细胞。

神经网络由互相连接的神经元层组成,并接受从前层神经元发送过来的信息,作为自己的输入。

将此输入传输给面层的神经元,依此下去。

神经元是输入向量(X1,...,Xn)的实函数。

那么输出为,f为一个传递函数,为阈值。

最典型的为S型(双曲正切,对数S型)传递函数。

其模型如图(一)所示。

[3]3 神经网络的一般结构和分类3.1神经元是人工神经网络里面最基本、最关键的部件。

它是一个多输入、单输出的非线性元件,图(二)所示为一种常用的神经元模型。

图(二)人工神经元模型其输入、输出关系可表示为(1)式(1)中x;(i=l,2,---,n)是从其他神经元传来的输入信号;e。

是阈值;Wij 表示从神经元i到神经元J的连接权值;f(·)为传递函数,传递函数可以为线性函数、阶跃函数,或者S状的非线性函数,如logistic函数、双曲正切函数等,如表一所示。

[4]表一神经元模型中常用的非线性传递函数3.2人工神经网络由大量的神经元互连而成,按其拓扑结构出层为止;第二个阶段是由输出层开始逐层计算各层神经元来分,可以分成层次网络模型和互连网络模型;按神经网络的输出误差,并根据误差梯度下降原则来调节各层的连接权的功能来分,现在常用的网络有如下各类:一个人工神经网络是由许多人工神经元高度相互连接构成的数据处理系统。

其结构源于人脑神经结构。

按照神经元的连接方式,人工神经网络可分为两种:没有反馈的前向网络和相互结合型网络。

[5]前向网络。

前向网络是多层映像网络,每一层中神经元只接受来自前一层神经元的信号,因此信息的传播是单方向的,任何一层的输出不影响本层和前层。

BP 网络是这类网络最典型的例子。

[6]此类网络模型如图(三)所示。

图(三) 前向网络相互结合型网络。

在相互结合型的网络中,任意神经元之间都可能有连结,因此,输入信号要在网络中往返传播,从某一初态开始,经过若干变化,渐渐趋于某一稳定状态或进入周期震荡等其它状态,这方面的网络有Hopfield网络、SOM网络等。

此类网络模型如图(四)所示。

图(四)结合型网络4 人工神经网络特征4.1 神经网络有映射能力,即将输入模式映射成相应输出模式。

4.2 神经网络通过事例学习。

它在对问题进行“推理”前,用此问题相关的已知的事例来“训练”自己。

所以,其能辨认新对象。

4.3 神经网络拥有归纳能力。

因此,从过去趋向可预算新输出。

4.4 神经网络是具有鲁棒性和抗错误,能够从不完整、局部、有噪音模式中构造出完整的模式。

4.5 神经网络以并行、快速和分布方式处理信息。

[7]5 人工神经网络的学习学习功能是人工神经网络的核心任务,由神经元连接的神经网络系统的全部“知识”,主要体现为网络中全部神经元之间的连接权重。

通过一定的学习规则,根据神经元的输入状态、连接权以及有无教师示范的信息来调整连接权重,这就是神经网络的学习过程。

常用的学习规则有:联想式学习——Hebb规则、误差传播式学习——Delta学习法则、概率式学习.竞争式学习。

人工神经网络学习方法大致分为三类:有教师学习(监督学习),无教师学习(无监督学习)和增强式学习。

5.1有教师学习。

有师学习能够根据期望的和实际的网络输出(对应于给定输入)问的差来调整神经元问连接的强度或权。

因此,有师学习需要有个老师或导师来提供期望或目标输出信号。

有师学习算法的例子包括规则、广义规则或反向传播算法以及LVQ 算法等。

5.2 无教师学习。

无师学习不需要知道期望输出。

在训练过程中,只要向神经网络提供输入模式,神经网络就能够自动适应连接权,以便按相似特征把输入模式分组聚集。

无师学习算法的例子包括Kohonen算法和Carpenter-Grossberg自适应共振理论(ART)等。

5.3 增强式学习。

此方法虽然有教师存在,并不指出网络期望值,只是判断输出是否正确该步骤帮助网络的学习。

若输出正确给予奖励,否则给予惩罚。

但增强式网络并不是流行的学习方式。

[8]6 人工神经网络建立神经网络就是由许多神经元互连在一起所组成的神经结构。

把神经元之间相互作用的关系进行数学模型化就可以得到神经网络模型。

目前已有几十种不同的神经网络模型。

代表的网络模型有感知器、反向传播BP网络、GMDH 网络、RBF网络、双向联想记忆(BAM)、Hopfield网络、Boltsmann机、自适应共振网络(ART)、自组织特征映像(SOM)网络等。

[9]建立神经网络模型的不同的步骤如下:6.1训练、测试和验证集的规范化。

数据集分成3个不同集:训练、测试、验证集。

其中训练集最大并神经网络用其学习隐藏在数据集中的模式;测试集用来评价训练过神经网络的归纳能力。

检验训练网络的最后一个就是验证集。

6.2 神经网络模型设计。

神经网络设计决定其结构,即输入层神经元数、隐藏层数和每层神经元数、输出层神经元数等。

隐藏层数:其实现神经网络归纳、分类能力。

理论上,只有一个隐藏层并该层有足够神经元的神经网络能够逼近任何连续函数。

实际上,有一个或偶尔有两个隐藏层的神经网络应用广泛且效果很好。

隐藏层神经元数:没有统一的方法能确定该层最佳神经元数。

然而,有一些拇指规则帮助计算神经元数。

粗略的数字由Masters(1993)提出的几何金字塔规则来确定。

N个输入神经元和M个输出神经元的三层网络来说,其隐藏层的神经元数为sqrt(N M 1·输出神经元数:有多个输出的神经网络,特别是这些输出问隔宽时,比起单个输出的神经网络产生出还差的结果。

激活函数:该函数是一个数学公式决定处理单元的输出。

每个单元网络输入通过激活函数变为输出。

非线性函数一直用作激活函数如S函数,对数S函数等。

传递函数(激活函数)的作用就是避免输出值变大,从而瘫痪神经网络和抑制训练。

[10]6.3 验证标准。

神经网络最常用的误差函数是平方和误差。

其它的误差函数有:最小绝对偏差,非对称平方和百分比差异等。

6.4 神经网络的训练。

训练神经网络的目的是去发现已有数据集中的内在联系(模式)。

神经网络训练通过调整各个神经元之间的连接权值来达到误差函数的全局最小。

这涉及到学习循环数、何时停止网络学习、学习速率和趋向值(过去的权值如何影响目前的权值变化)。

7 人工神经网络的应用近些年来神经网络在众多领域得到了广泛的运用。

在民用应用领域的应用,如语言识别、图像识别与理解、计算机视觉、智能机器人故障检测、实时语言翻译、企业管理、市场分析、决策优化、物资调运、自适应控制、专家系统、智能接口、神经生理学、心理学和认知科学研究等等;在军用应用领域的应用,如雷达、声纳的多目标识别与跟踪,战场管理和决策支持系统。

军用机器人控制各种情况、信息的快速录取、分类与查询,导弹的智能引导,保密通信,航天器的姿态控制等。

[11]参考文献【1】高隽.人工神经网络原理及仿真实例【M】.北京:机械工业出版社,2003.【2】朱剑英.智能系统非经典数学方法【M】.武汉:华中科技大学出版社,2001.【3】周宇恒,赵书玲,李钟侠.BP网络范化能力的改进【J】.兵工自动化测控技术,2004,23(5):63-64.【4】黄琳,魏保立.BP网络的范化能力改进方法及应用【J】.石家庄铁道学院学报,2005,(9).【5】罗若谷,陈敏.BP神经网络范化能力改进研究【J】.福建电脑,2007,(1).【6】Martin T.1lagan等著.戴葵等译.神经网络设计【M】.北京:机械工业出版社,2005,8.【7】Gencay R,Qi M.Pricing and Hedging Derivative Securities with Neural Networks Bayesian(Early Stopping)。

相关主题