基于遗传算法的参数优化估算模型
【摘要】支持向量机中参数的设置是模型是否精确和稳定的关键。
固定的参数设置往往不能满足优化模型的要求,同时使得学习算法过于死板,不能体现出来算法的智能化优点,因此利用遗传算法(Genetic Algorithm,简称GA)对估算模型的参数进行优化,使得估算模型灵活、智能,更加符合实际工程建模的需求。
【关键词】遗传算法;参数优化;估算模型
1.引言
随着支持向量机估算模型在工程应用的不断深入。
研究发现,支持向量机算法(包括LS-SVM算法)存在着一些本身不可避免的缺陷,最为突出的是参数的选取和优化问题,以往在参数选取方面,一般依靠专家系统或者设定初始值盲目搜寻等等,在实际应用必然会影响模型的精准度,造成一定影响。
如何选取合理的参数成为支持向量机算法应用过程中应用中关注的问题,同时也是目前应用研究的重点。
而常用的交叉验证试算的方法,不仅耗时,且搜索目的不清,使得资源浪费,耗时耗力。
不能有效的对参数进行优化。
针对参选取的问题,本文使用GA算法对模型中的参数设置进行优化。
2.遗传算法
2.1 遗传算法的实施过程
遗传算法的实施过程中包括了编码、产生群体、计算适应度、复制、交换、变异等操作。
图1详细的描述了遗传算法的流程。
其中,变量GEN是当前进化代数;N是群体规模;M是算法执行的最大次数。
遗传算法在参数寻优过程中,基于生物遗传学的基本原理,模拟自然界生物种群的“物竞天则,适者生存”的自然规律。
把自变量看作生物体,把它转化成由基因构成的染色体(个体),把寻优的目标函数定义为适应度,未知函数视为生存环境,通过基因操作(如复制、交换和变异等),最终求出全局最优解。
2.2 GA算法的基本步骤
遗传算法操作的实施过程就是对群体的个体按照自然进化原则(适应度评估)施加一定的操作,从而实现模型中数据的优胜劣汰,使得进化过程趋于完美。
从优化搜索角度出发,遗传算法可使问题的解,一代一代地进行优化,并逼近最优解。
通常采用的遗传算法的工作流程和结果形式有Goldberg提出的,常用的GA 算法基本步骤如下:
①选择编码策略,把参数集合X和域转换为位串结构空间S。
常用的编码方法有二进制编码和浮点数编码。
②定义合适的适应度函数,保证适应度函数非负。
③确定遗传策略,包括选择群体大小,选择、交叉、变异方法,以及确定交叉概率、变异概率等其它参数。
④随机初始化生成群体N,常用的群体规模:N=20~200。
⑤计算群体中个体位串解码后的适应值。
⑥按照遗传策略,运用选择、交叉和变异算子作用于群体,形成下一代群体。
⑦判断群体性能是否满足某一个指标,或者以完成预订迭代次数,若满足则
输出最优结果,不满足则返回步骤⑥,或者修改遗传策略再返回步骤⑥。
2.3 遗传算法对参数优化的实现
结合遗传算法的计算原理,给出基于遗传算法的支持向量机估算模型的参数优化流程,并定义了适应度函数。
将电力工程造价小样本估算模型进行改进,对新模型进行仿真分析。
对上述参数进行二进制编码,并随机产生初始群体。
③对群体中的染色体解码,计算各个个体对应的适应度函数。
④判断群体性能是否满足某一优化准则(本文中选取完成最大遗传代数作为优化准则),若满足则输出最优参数,否则按照遗传策略,运用选择、交叉和变异算子作用于群体,产生下一代群体,并开始新一代的遗传。
4.参数优化模型仿真与分析
结合估算模型中参数的设置,在此将原始参数值设置为:ε=0.01,σ=6,C=50。
在MATLAB7.0中调用GA算法工具箱,对应设置GA模型参数设:种群大小N=40,交叉概率Pc=0.5,变异概率Pm=0.007,最大进化代数为60,群体规模为40。
将原始估算模型中的参数输入GA工具箱,并调入适应度函数程序段。
经优化最终参数值如表1所示。
得到最优的参数后,我们利用基于遗传算法参数优化估算模型代替原先的参数固定估算模型,将二者的输出结果进行比对分析,如表2所示。
GA-LSSVM算法的平均绝对值相对误差为2.940个百分点,而原始LS-SVM 算法为4.211个百分点,明显可以看出,经过GA算法参数优化的网络模型在估算方面明显优于LS-SVM网络模型,在平均绝对值相对误差上提升了近1.27个百分点。
可见基于GA参数优化的工程造价估算模型在进行电力工程造价中有较好的指导意义.同时,遗传算法与LS-SVM结合实现了LS-SVM模型参数的自动优化选择,但遗传算法的优化过程也增加了模型的训练时间。
因此确定一个尽可能小的参数取值空间,减少遗传算法训练时间,有助于提高整个模型的训练速度。
5.小结
将遗传算法对参数优化的思想糅合到支持向量机估算中去,适应度函数采用了网络学习结果和实际结果之间的误差,优化了模型参数选取,总结得到新模型的计算步骤。
在Matlab平台下,对参数优化模型进行仿真分析。
结果表明:新模型输出的结果比原模型的输出结果在准确度方面有很大的提升,同时网络的稳定性也得到进一步加强。
参考文献
[1]顾绍红,王永生,王光霞.主成份分析模型在数据处理中的应用[J].测绘科学技术学报,2007,24(5):387-390.
[2]Lu Shuang,Li Meng,Bearing Fault Diagnosis Based on PCA and SVM[C].Proceedings of the 2007 IEEE.international Conference on Mechatronics and Automation 3503-3507.
[3]张红梅,卫志农,龚灯才.基于离子群支持向量机的短期电力负荷预测[J].继电器,34(3):28-31.
[4]基于遗传算法优化支持向量机的网络流量预测[J].计算机科学研究,2008,35(5):177-179.
[5]熊建秋,邹长武,李柞泳.基于免疫进化支持向量机的年用电量预测[J].四川大学学报:工程科学报,2005,38(2): 2-38.
[6]姚智胜,邵春福,熊志华.基于主成分分析和支持向量机的道路网短时交通
流量预测[J].吉林大学学报:工学报,2008,38(1):48-52.。