当前位置：文档之家› SVM核函数对分类精度影响的研究

SVM核函数对分类精度影响的研究

为，测试样本不变时，ｌ，随着ｑ值变化即多项式次数的变化，同一样本分类精度有明显下降趋势．因此在多项式核函数分类中，并不是多项式次数越高分
第４期
刘大宁，：Ｖ核函数对分类精度影响的研究等ＳＭ对比实验数据如下表．
表４组合核函数１
２，定它们的类别为正类ｔ＝０１（０１；）给ｙ１８５，）如２￣
＝４＋ａｄ（２，ｒｎｎ，）给定他们的类别为负类＝一
ｏｅ（０１．ｎｓ５，）这样选用的样本点在每次实验中当样（ｆ（，）・）＞取代（）３式中的，．不变时，随机产生的数据保持不变，ｎ当改根据Ｈｂｒ —Ｓｈｉ原理，ｉｔｃｍｄｅｔ只要一种运算满本量ｎ训练样本数据仍然保持和／７，变化之前数据的足Ｍｒｅ条件就可以作为内积使用．ｅｃｒ】常用于分变时，相关性．１为核函数为线性时，练样本点为／图训１，类的核函数有以下四种：ａ）线性核函数，／（，）＝即Ｃｘ可分的ＳＶＭ分类器；；应线性对
６９２
类效果越好．于该实验数据当我们选取样本量为对１０多项式次数为２的核函数时，可以达到００，就．９０７０的分类精度．表２不同样本下高斯核函数不同参数分类精度
（高斯核函数（＝１与线性核函数））
ＩＩ＿．２
量为１０线性核函数分类所获取的分类模型图．０，
二
｝，对应ＳＭ是一种径向基函数分类器；Ｖ
ｄＳ）形核函数，Ｋ，如（）＝ｔｈｖｘｘ）＋ａ（（ｒｉｎ
Ｃ，ＳＭ实现的就是一个两层的感知器神经网）则Ｖ络，对应ＳＭ是ｓｍｉＶｉｏｄ函数分类器．ｇ】根据Ｍｒｒｅｅ条件，ｃ核函数的性质有封闭性、对称性、复合性．于是除了常用的四种函数外，可以也线性构造新的核函数：
ｉ＝ｌ
Ⅱ ｍｎ虿似ＩｎｉＩｌＩｆＩ
① 收稿日期：０２— ６－８２１０ቤተ መጻሕፍቲ ባይዱ０
Ｌ（）１
（）５
基金项目：数学地质四川省重点实验室开放基金（ＣＸＺ０９１）ＳＳＤ２００９．作者简介：刘大宁（９６，，１８一）女湖北荆门人，硕士，研究方向为ＧＳ间分析与软件开发．Ｉ空
Ｊｌｕｙ
２１０２
文章编号：ｏ１ｏ（０２０ — ６７０１８— ４２２１）４０２ — ４０
ＳＭ核函数对分类精度影响的研究 ① Ｖ
刘大宁，杨永乐，白林
（成都理工大学管理科学学院。四川成都６０５）１０９
Ｋ ‘ ，（，）＝Ｋ（，，１）＋磊 ‘ ，２（，）ｇ（ｆｆ＝ａ（，（＞０ｘ，）Ｋ１巧）ａ）（）６（）７
图１样本容量为１０线性核函数分类０，
于是本文实验使用如下的组合核函数（中核函其数系数为正）：
关键词：ＳＭ；函数参数；ｅｅ条件；Ｖ核Ｍｒｒｃ分类精度中图分类号：Ｔ３１４Ｐ９．文献标识码：Ａｓｂｃｔｉ（，＋ｂ］一１，ｉ，，，ｕｅＹ［ｔｊｔｏｔｉ） ≥０（＝１２ …，）１
定义Ｌｇａｇａｒｎｅ函数：
１ＳＭ分类原理Ｖ
ＳＭ是从线性可分情况下的最优分类面发展Ｖ而来的，最优分类面问题可以表示成如下的约束优化问题：
约束条件求解，由此求得的最优分类函数是（其中
ｓｎ）ｇ（为符号函数）：
）ｓ（ ’ ６）ｓ（ｉｂ）＝ｇ（） ’ ＝ｇ ∑ａｙｉ＋’ ｎ＋ｎ＊．
原约束条件可以把原问题转化为如下凸二次规划
的对偶问题：
ｍｘ一ａ∑ ÷∑∑
Ｉ１ｌｌＪ。１＝
（）
（）３
在神经网络方法中无法避免的局部极值问题；３（）ＳＭ将实际问题通过非线性变换转换到高维的特Ｖ
征空间，在高维空间中构造线性判别函数来实现原空间中的非线性判别函数，特殊性质能保证ＳＭＶ有较好的推广能力，同时它巧妙地解决了维数问题，其算法复杂度与样本维数无关【．２通过计算机Ｊ对比实验得到两个方面因素，它们对分类精度的影响包括：１核函数参数对分类精度的影响；２线（）（）性组合核函数对分类精度的影响．
ｒｎｎ￣ａｅ３ａｄ（ｔｔ．）状态语句，后通过给定样本数／然１，的大小来产生第一类二维训练样本＝ｒｎｎＩａｄ（，ｔ２，）赋予对应的类别为Ｙ。＝ｏｅ（，）第二类训ｎ５ｎ１；
；另一种方案通过非线性变换将输入空间变换
ｓｔ．
ａ ≥ Ｏｉ＝１… ，，，，ｌ
∑ａｉ０ｉ＝Ｙ
这是一个在不等式约束下的二次函数机制问题，存
在唯一最优解．若 ’为最优解，则
’
＝
∑ａｙ￣ｉｘ
＝ｌ
（）４
ａ’ 不为零的样本即为支持向量，因此，最优分类
面的权系数向量是支持向量的线性组合． ’可由ｂ
Ｋ（，，＝ａ（，，）Ｋ１ ‘ ）＋ｂｉ（‘ ，￥ｘ，）２（）８
３１核函数参数对分类精度影响．本实验对如下情况进行讨论：三种核函数的参数取整数值，样本容量为１０２０，０，Ｏ．且０，０３０４Ｏ具体获取的分类精度值如下所示：表１不同样本下多项式核函数不同参数分类精度
第３０卷第４期
２１年ｏ月０２７
佳木斯大学学报（自然科学版）ＪｕｎｌｆｉｓＵｉｒ（ａｒｌｃｅｃｄｉｎｏｒａｏａｉｎｖＳＮｔａＳｉｅＥｉｏ）Ｊｍｕｅｕｎｔ
Ｖ１３Ｎ．ｏ．０ｏ４
分析三组实验数据，组合核函数ｌ中高斯函数（＝１与线性核函数各自组合前分类精度都比）
较好，同一训练样本以不同的比例组合核函数分类
效果较差，但是分类效果的区别我们可以很明显的
看出来．于实验训练样本容量为１０，用形核对０采
＿
一∑ ）ＷＸ＋）Ｉ［（ｒ６一］，
Ｉ＝Ｊ
（）２
是专门针对有限样本情况的，目标是得到现有信其息下的最优解而不仅仅是样本数趋于无穷大时的
最优值；２ＳＭ最终将转化成为一个二次型寻优（）Ｖ问题，从理论上说，得到的将是全局最优点，解决了
表２中实验数据可以观察到除了样本容量为２０方差＝１４时，０，和针对于同一方差，随着样本
表５
组合核函数２
高斯（＝１与多项式组合核（）ｑ：２函数））
容量的变大，分类精度逐渐减小．当样本容量为１０高斯参数取值为１和２时，０，获取最优精度０．
ｔ＾
０引言
支持向量机是建立在统计学习理论的ＶＣ维理论和结构风险最小原理基础上，根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折中的方法 … ．持向量机的优点主要有：１ＳＭ支（）Ｖ
Ｌ１ｂ［（，０ｌ，）＝Ｊ
６８２
佳木斯大学学报（自然科学版）
实验中我们调用
２１年０２
Ｍａｌｂ．１０下ｔ７１．ａ
２ＳＭ核函数Ｖ
当样本数据线性不可分时主要有两种解决方案，一种是引入松弛变量 § （§ ０，１２．ｌｉ＝，… ｎ，超平面ｔ＋ｂ＝０满足，（，ｉ）≥ １一）使ｔ，，ｔ戈＋６ｌ
到一个高维空间，后在这个新空间中求取最优线然性分类面．】这种非线性变换是通过定义适当的核函数（积函数）实现的，令Ｋｘ，内（）＝＜
练样本点为＝５＋ａｄ（，）赋予对应的类别ｒｎｎｎ２，为Ｙ２＝一ｏｅ（，）ｔ ‘ ｉ８，１．测试样本我们选取的是：。＝１＋ｒｎｎ５，ｔｘａｄ（０
＝
１０的分类情况，０训练点１和训练点２为选取的
训练点，测试点１测试点２测试点分类情况，与为计算得出其分类精度为０９０．图１．７０下为一张样本容
ｂ多项式形式的核函数，／ｘ）＝［））即ｃ，（（
＋１；］对应ＳＭ是—个ｑＶ阶多项式分类器；Ｃ高斯核函数，即），）＝ｅｐ一ｘ｛

e商务文档

SVM核函数对分类精度影响的研究

相关文档推荐：