毕业论文文献综述计算机科学与技术基于人工神经网络的赤潮预测方法研究引言:近年来,赤潮发生的频率越来越高,对海洋渔业、海水养殖业和滨海旅游业等均造成了一定的危害,经济损失严重。
因此,弄清楚赤潮发生的机理并对其进行准确地预报,对预防赤潮的发生以及减少赤潮灾害带来的损失至关重要。
鉴于赤潮突发性和复杂性和对其机理的认识,目前常用的预测方法主要依据赤潮影响因子的变化判断其是否发生,它是一个模式识别过程。
由于生态系统各因子之间表现出高度的非线性和不确定性,传统的预测方法有效的很少。
人工神经网络具有较好的处理非线性模式识别特性,它独特的信息处理和解算能力对机制尚不明确的高维非线性系统具有很好的建模能力。
目前神经网络在生态系统模拟、生态数据处理以及要干生态参数的提取方面等方面得到广泛应用[1,2]。
本文介绍一种常见的神经网络算法网络,即BP(Back Propagation)网络,以及它在赤潮预测中的应用。
1 赤潮及赤潮的预测研究1.1赤潮赤潮(red tide)也称红潮,通常是指一些海洋微藻、原生动物或细菌在水体中过度繁殖或聚集而令海水变色的现象,藻华(algal bloom)有时称水华或藻花,是指水体中藻类大量繁殖的一种现象,习惯上将水体中藻类达到一定密度后的藻华称作赤潮[3]。
自20世纪70年代有比较齐全的赤潮资料以来,我国赤潮发生主要有以下趋势:赤潮的发生以每10年3倍的速度不断上升;赤潮的规模不断扩大;危害程度增加。
有害赤潮是一种有多种因素综合作用引起的生态异常现象,人们至今还没有对其发生机理有完整、统一的认识,而且赤潮生物的繁殖与其影响因子之间具有高度的复杂性和非线性,从而很难采用传统的偏微分方程对其规律进描述。
在这种情况下,以数据挖掘技术为主的数据驱动模型就开始显示出其优势。
其中,人工神经网络ANN(Artificial Neural Network)的应用最为广泛,尤其是在寻求和建立信号输入和输出方面,具有许多其他方法所不具有的优势,并在实际应用中取得了很好的效果[4]。
1.2 赤潮的预测赤潮是一种由多因素综合作用引发的生态异常现象,具有突发性及非线性等特点,并且赤潮生物种类繁多,不同海域发生赤潮的主要影响因子又不尽相同,因此,对其进行成功预测并进行有效的预防减灾已成为社会迫切需要[5]。
国内外学者从不同角度开展了赤潮预测的研究,并提出了众多的赤潮预测方法。
近几年随着计算机软件技术、人工智能以及生物技术的迅猛发展,人们开始探索将其应用与赤潮的预测。
20世纪90年代,RECKNAGEL[6]将ANN(Artificial neural networks)运用于蓝-绿藻的种类丰度和演替预测研究,结果证明,ANN浮游植物模型具有较好的预测潜力,并促进了ANN 在水华、赤潮方面的研究。
WILSON和RECKNAGEL[7]与KUDELA和COCHLAN[8]虽然将ANN应用于赤潮预测计算中,但未在网络结构的优化方面做工作,而国内的一些学者则在这一方面作了大量的工作。
蔡如钰[9]、董婧等[10]、吴京洪[11]谢中华和晏丽红[12]等在人工神经网络对赤潮进行预测方面做出了巨大贡献。
上述研究初步表明,ANN用于赤潮生物生长的研究是一种行之有效的新途径,与传统统计模型相比有一定的优越性,与传统统计模型相比,人工神经网络方法不要求监测数据具有很强的规律性,就可以用训练后的网络模型对其进行预测,具有一定的实用性。
2 人工神经网络及BP算法网络人工神经网络(Artificial Neural Network)是指由大量与自然神经系统细胞类似的人工神经元连接而形成的网络,其由应用工程技术、计算机手段模拟生物神经网络的结构和功能,实现只是并行分别处理,是一个人工智能信息处理系统,与较高的建模能力和对数据良好的拟合能力[13]。
人工神经网络模仿人脑神经的活动,力图建立脑神经活动的数学模型。
近年来,只能控制作为一门新的交叉学科蓬勃兴起。
人们在更高层次上寻求控制、计算机和神经生理学的新结合,以此来解决显示世界中常规控制论难以解决的一些问题。
2.1 神经网络国内外研究现状20世纪90年代以来,神经网络网络的应用领域迅速扩大。
近百种近百种网络结构、学习算法相继出现,硬件实现的研究工作也取得了重要进展。
神经网络理论的应用研究已经渗透到大量的工程领域,并取得了令人瞩目的成果。
1987年6月IEEE在San Diego召开了第一节神经网络会议,标志着神经网络研究在世界范围内形成了高潮,此后国际上每年都有以神经网络为主题的国际会议召开。
随着神经网络理论研究的进展,其应用产品开发也获得了初步的成功。
目前已有的神经网络应用产品有HNC公司的手写体识别,Neural teach的专家系统设计,HNC的脑电图分析,HNC和AI-WARE的过程与机器人控制等众多产品。
在举世瞩目的海湾战争中,美国空军也采用了神经网络进行决策和控制。
近年来,我国在神经网络的研究方面发展规模大、速度快而且取得了不少成果。
中国科学院半导体研究所神经网络组在王守觉院士的带领下,研究开发了一种适合我国神经网络研究需要的通用神经网络处理机--“预言神”神经计算机;承担的“九五”国家重点攻关“半导体神经网络技术及其应用”、“高精度双权值突出神经计算机”、“高速二值Hopfield网络神经计算机”等项目于2000年12月通过了中科院的鉴定、验收。
我国在神经网络的应用研究中的另一项具有较大影响的成果是国防科技大学的胡守仁教授等人研制成功的一个通用神经网络模拟系统NNSS,该系统能按用户意图建立各种复杂的互连模型,实现从学习、分别到识别结果的全过程[14]。
2.2 BP神经网络(一)、BP神经网络的基本原理BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。
BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。
它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。
BP神经网络模型拓扑结构包括输入层(input layer)、隐层(hide layer)和输出层(output layer)(图 1)。
X1(p)X2(p)Xn(p)O1(p)O2(p)On(p)输入层节点隐层节点输出层节点图 1 神经网络结构示意图(二)、BP 网络及其权值调整规则1、BP 算法由数据流的前向计算(正向传播)和误差信号的反向传播两个过程构成。
正向传播时,传播方向为输入层→隐层→输出层,每层神经元的状态只影响下一层神经元。
若在输出层得不到期望的输出,则转向误差信号的反向传播流程。
通过这两个过程的交替进行,在权向量空间执行误差函数梯度下降策略,动态迭代搜索一组权向量,使网络误差函数达到最小值,从而完成信息提取和记忆过程。
1.1正向传播n q mVWZ1Y1YjYm图 2 前向运算(正向传播)设 BP 网络的输入层有n 个节点,隐层有q 个节点,输出层有m 个节点,输入层与隐层之间的权值为ki v ,隐层与输出层之间的权值为jk w ,如图5.4所示。
隐层的传递函数为f 1(·),输出层的传递函数为f 2(·),则隐层节点的输出为(将阈值写入求和项中):)(01∑==ni i ki k x v f z q k ,......,2,1= (1.1)输出层节点的输出为:)(02∑==qk k jk j z w f y m j ,......,2,1= (1.2)至此B-P 网络就完成了n 维空间向量对m 维空间的近似映射。
1.2反向传播1) 定义误差函数输入p 个学习样本,用px x x ,...,,21来表示。
第p 个样本输入到网络后得到输出pj y (m j ,...,2,1=)。
采用平方型误差函数,于是得到第p 个样本的误差p E :∑=-=m j p j pj p y t E 12)(21 (1.3)式中:p j t 为期望输出。
对于P 个样本,全局误差为:∑∑∑====-=P p m j Pp p pj p j E y t E 111)(21 (1.4)2)输出层权值的变化采用累计误差BP 算法调整jk w ,使全局误差E 变小,即∑∑==∂∂-=∂∂-=∂∂-=∆P p jk p P p p jk jk jk w E E w w E w 11)()(ηηη (1.5) 式中:η—学习率 定义误差信号为:ijj p j pyj S y y E S E ∂∂⋅∂∂-=∂∂-=δ (1.6) 其中第一项:∑∑==--=⎥⎦⎤⎢⎣⎡-∂∂=∂∂m j pj p j m j p j p j jj py t y t y y E 112)()(21 (1.7)第二项:)('2j jj S f S y =∂∂ (1.8)是输出层传递函数的偏微分。
于是:)()('21j mj p j p j yj S f y t ∑=-=δ (1.9)由链定理得:∑=⋅--=-=∂∂⋅∂∂=∂∂m j k j p j p j k yj jk j j p jk pz S f y t z w S S E w E 1'2)()(δ (1.10) 于是输出层各神经元的权值调整公式为:k j p p mj p j p j jk z S f y t w )()('211∑∑==-=∆η (1.11)3)隐层权值的变化∑∑==∂∂-=∂∂-=∂∂-=∆pp ki p pp p ki ki ki v E E v v E v 11)()(ηη (1.12)定义误差信号为:k kk p kp k S z z E S E z ∂∂⋅∂∂-=∂∂-=δ (1.13)其中第一项:k j m j pj p j m j p j p j kk pz y y t y t z z E ∂∂--=⎥⎦⎤⎢⎣⎡-∂∂=∂∂∑∑==112)()(21 (1.14) 依链定理有:jk j kj j j k jw S f z S S y z y )('2=∂∂⋅∂∂=∂∂ (1.15) 第二项:)('1k kk S f S z =∂∂ (1.16) 是隐层传递函数的偏微分。
于是:)()()('11'2k jk mj j p j p j zk S f w S f y t ∑=-=δ (1.17)由链定理得:ik jk j m j p j p j i zk ki k k p ki px S f w S f y t x v S S E v E ⋅--=-=∂∂⋅∂∂=∂∂∑=)()()('1'21δ (1.18) 从而得到隐层各神经元的权值调整公式为:i k j p p mj ki x S f S f v )()(()'111'2∑∑===∆η (1.19)1.3 BP 算法的改进BP 算法用于具有非线性转移函数的三层前馈网后可以以任意精度逼近任何非线性函数,这一非凡优势使BP 网络得到越来越广泛的应用。