课程设计作业——翻译课题:介绍遗传算法神经网络穆姣姣0808490233物流08-班介绍遗传算法神经网络理查德·坎普1. 介绍一旦一个神经网络模型被创造出来,它常常是可取的。
利用这个模型的时候,识别套输入变量导致一个期望输出值。
大量的变量和非线性性质的许多材料模型可以使找到一个最优组输入变量变得困难。
在这里,我们可以用遗传算法并试图解决这个问题。
遗传算法是什么?遗传算法是基于搜索algo-rithms力学的自然选择和遗传观察到生物的世界。
他们使用两个方向(\适者生存”),在这种条件下,探索一个强劲的功能。
重要的是,采用遗传算法,这不是必需要知道功能的形式,就其输出给定的输入(图1)。
健壮性我们这么说是什么意思呢?健壮性是效率和效能之间的平衡所使用的技术在许多不同的环境中。
帮助解释这个问题,我们可以比其他搜索和优化技术,如calculus-based,列举,与随机的求索。
方法Calculus-based假设一个光滑,无约束函数和要么找到点在衍生为零(知易行难)或者接受一个方向梯度与当地日当地一所高中点(爬山)。
研究了这些技术已经被重点研究、扩展、修改,但展现自己缺乏的鲁棒性是很简单的。
考虑如图2所示的功能。
利用Calculus-based在这里发现极值是很容易的(假定派生的函数可以发现…!)。
然而,一个更复杂的功能(图3)显示该方法是当地——如果搜索算法,在该地区的一个开始,它就会错过低高峰目标,最高的山峰。
图1 使用网络神经算法没必要知道它的每一项具体功能。
一旦一个局部极大时,进一步改进需要一个随机的重启或类似的东西。
同时,假设一个函数光滑,可导,并明确知道很少尊重现实。
许多真实世界充满了间断模型和设置在嘈杂的多通道搜索空间(图4)。
虽然calculus-based方法在某些环境中至非常有效的,但内在的假设和当地的特点意味着他们不够强劲的穿过一个广泛的问题。
在这种情况下,它会立刻尝试计算整个表面,找到极大值。
这是蛮力方法,平静地说具有极高的效率。
或者,random-walk方法可以用来探索表面。
这也是效率低下——尽管两种方法在通过广泛的问题类型保留其适用性,不同于calculus-based方法。
怎么了,那么,就遗传算法(气)不同于这些方法吗?吸取来自生物遗传学和自然选择,有三个基本不同点:1、气体从成群的点收索,而不是一个单一点。
2、燃气仅用一个客观的功能,而不是衍生物或其他与搜索空间相关的信息。
图2:calculus-based单峰函数是容易的方法。
图3:我们应该攀登哪座山呢?一个复杂的多峰函数calculus-based带来了严重的问题的方法。
图4:许多实际功能很吵,不连续,因此不适合calculus-based搜索方法。
图3:燃气用概率规则而非确定性的规则。
这一组合的特性允许一个大的、多参数空间探索有效、有效,只要他们明智地应用。
2. 进化——利用遗传算法首先,这是必要的,为染色体以编码模型设置参数xi。
这是一个信息的表达方式,让各种形式的变异发生在参数的设置,并由一组基因组成[xi1,xi2,xi3,xi4…]。
这组基因,当给模型作为输入,将输出fi。
染色体然后依据健康因素被评选、Fi,描述履行如何与期望和对方息息相关。
然后允许染色体繁殖(可能成比例的健身)或者变异。
实际上进化发生有两种方式——交叉(见表1和2)和随机变化。
在这个例子中,突变将被一个随机挑选的翻转点表示。
在一个神经网络优化算法中, 变异将涉及到一个小变化——加上或者减去——在一个随机挑选的基因里。
字符串号字符串Fi Fi/∑Fi存活序号交配池1011011690.14101101 2110005760.49211000 301000640.06011000 4100113610.31110011表1:一个初始种群的字串,他们的健康因素,繁殖的机会以及随后的育种游泳池基于概率随机选择在第四栏{通常称为转轮”程序)。
这个事例的健身因素是在假设字符串代表二进制数,并围绕着它的情况下得到。
表2:交配池(从表1,表明交叉部位),随机交配、随机交叉站点,合成新的人口和他们的健康因素(例如从歌德堡(1989)。
这个简单的例子演示了一个简单的优化问题。
对于复杂的多参数模型,,更多的人口对有效的探索参数空间是必须的,,进一步提高效率,多种群可能被使用。
这允许一个范围的形式的变化发生于每一代。
通常,说从人口20条染色体,对于下一代最好的(最适合的)可能是保持不变(主义):还有18个地方,对交叉和变异,可能是基于他们随机填充相对适合的(表1),而这最后的地方填充一个全新的,随机生成的染色体。
综上所述,其过程是:1、选择一个初始种群;2、根据适合性排列人群等级;3、在人群中根据适合性随机选择伴侣对;4、让伴侣对和交叉对繁衍,变异;5、如果需要,在剩下的空白里填满新一代与最好的表演者的前世和/或新生成的成员。
6、转到(2)。
该算法将重复进行,直到:* 找到了解决办法,满足一个目标* 固定数量的一代已经产生了* 排位最高的解趋于平稳,没有进一步改进反复迭代,或……* 你没有时间或钱。
3、物种形成——遗传算法形成了贝叶斯神经网络对于贝叶斯人工神经网络(ANN),我们有一套输入参数和两个输出值,预测输出值(从网络和相关的不确定性中预测出来)。
如果我们想要避免野生预测,我们可以用一个包含这些值的适合的函数集,列如:Fi=1/σi(1)在这里 σi2= σy,i(l)2+(t-f i)2(2)这里面,L是预测值的数目,σy,i是与不同预测值相关的不确定的数值,l、t是为优化得到的目标输出,f i是委员会预测值。
这里提到的变异算子是一个很浓缩的所有技术的名单,这个名单自从天然气在1970s出现以来一直被探讨。
图5:当基因在染色体上相去甚远,他们从一个单一的交叉被分离开(左)。
如果他们非常接近,则他们会呆在一起(右)。
基本的染色体,如上所述,可以组成这个网络的大量的输入值。
当应用于ANN时有一些方法可以帮助优化程序适用。
首先,这就需要避免利用物质价值找到一个“最优”输入集。
像所有的输入值在神经网络被应用前已经正规化一样,完全可以预测钢含1 wt %碳,例如。
这可以通过两种方式避免{通过限制基因突变的范围和新的基因的产生,或者为了惩罚这些可以通过添加条款的适应度函数另外惩罚这些非物质基因,,因此使用这样的基因进化反抗他们。
此外,由于单点交叉有效地选择组合基因在染色体紧密时结合但在相距甚远时分开(图5),输入有组合效应的值应该与和他紧密相连的被分成一组。
这个效果可以通过使用均匀交叉来避免{从父母任何一方随意的选择基因(图6))(即使这将使算法在发现非常“适合的”组合效率不够好)。
父母交叉面具后代123451122112895 67890它也很常见,作为一个人工神经网络模型的输入,变量是其他的输入变量的功能,比如,说,你的阿伦尼斯形式包括(1 / KT)以及温度本身。
在这种情况下,必须谨慎,一个变量总是与另一个变量有关的,,他们不允许独立的变化。
我们可以有许多我们希望保持不变的输入变量,_如果我们试图在某一温度优化刚性能。
计算参数遗传算法参数人口数交叉速率世代数变异速率人口混合速率人口规模图6:均匀交叉(后代的基因被从父母身上随即挑选出来(即产生随机交叉面具)表3:基因算法基本参数设置的优化4、殖民化——算法优化在一个简单的遗传算法运行中,有相当数量的基本参数,如表3所示。
计算参数很简单{可一次性允许其他多种群多领域的网络进行探索,但增加了计算能力的需要(那么你需要多长时间来运行程序呢?GA-specific参数需要更多一点的解释,虽然人口规模是不言而喻的。
交叉率是新一代在经过交叉时各自所占的比重。
变异率是突变发生时的速率。
在优化神经网络模型,我们需要一个相对较高的基因突变率。
那里突变基因价值的一个小的微调。
人口混合率是不同人群可进行交叉的频率。
这些参数的影响在Delorme(2003)2中被探索。
综上所述,3个种群竞选3000代中的20个染色体对许多贝叶斯神经网络的优化是一个好的开始、交叉率为90%(例如人口20,18条染色体被选择采用轮盘法与另18条染色体用同样的方法交叉,产生18个后代)。
其余槽填充前一代最优秀的表现者和一个全新的随机产生的染色体。
每一代人,种群里的一个基因是突变过的。
保存的精英表演者模拟局部极大收索技术的一些特点,使目前被发现的优化染色体在种群不变的情况下得到保存。
这可能导致算法在次优解的地方被卡住——如果模型非常多,但是用多种群和较高的基因突变率将吧这种可能性降到最低,正如在每一代中包含一系列基因一样。
5、Tarpits (潜在的陷阱)与遗传算法优化相关的主要问题是:1、应用约束问题。
2、GA欺骗的功能。
3、早期收敛。
4、在达到优化解时缺乏收敛。
5、过度高突变率。
6、适合性的意义。
一个约束问题正如网络中的输入值是有限的一样(如化学成分不能是负的),虽然ANN和天然气的性质是自然无约束的。
解决这个问题的两种方法在上面已经提到{限制上述转变过程或修改适应度函数以适应约束条件和惩罚那些违背他们的染色体。
GA欺骗功能函数的遗传算法在选择个体基因混合GA,当两者的组合会导致最优状态时不惜以另一些基因为代价,。
这将导致,在某种程度上,一些基因在最佳基因池中消失。
这可以通过精英主义避免(如上所述),使用多的人口,和一个高基因突变率再次引入丢失的基因。
早熟收敛是一个类似的问题(如果一个染色体在早期就比竞争对手更适合,它可以来控制人口,可能导致基因的消失,以后,可以有更好的解决方案。
这可以通过利用高突变率,或者通过适当的缩放比例来避免。
这是一个在尊重平均人口基础上重收缩绝对Fi的过程,因此,只有最适合的染色体,作为普通染色体有两倍的几率可能被选中参加杂交。
这个程序也可以帮助优化程序快结束时缺乏收敛的问题。
在这种情况下,人口同样高绩效的染色体不会彼此竞争激烈。
适应度尺寸保留了染色体之间的竞争并且保持算法的高效率。
一个潜在的危险是,任何留下在种群中的可怜表演者将导致在重收缩后的负面Fi。
在这种情况下,这些染色体可以被指定一个适合度为零。
过度高突变率使过程效率低下,因为遗传算法对其求解然后开始一个类似随机步,而不是一个直接的过程。
最后,有些人以为应该给予“适合性”一个意义。
当设计遗传算法时,你真正想要它做的是什么?答案很简单,为找到一套最优值,这将给一个神经网络一个特定的输出,。
当把气体问题应用到其他方面,定义一个适当的适度性函数能够与成功和出乎意料的随机结果大不相同。
6、例子神经网络模型来预测辐射在钢体(被称为reduced-activation钢的铁素体/马氏体steels3(RAFM))屈服应力上的效用。