当前位置:文档之家› SVM核函数对分类精度影响的研究

SVM核函数对分类精度影响的研究


为 , 测试样本不变时 , l , 随着 q 值变化 即多项式次数 的变化 , 同一样本分类精度有 明显下降趋势. 因此 在多项式核函数分类中, 并不是多项式次数越高分
第 4期
刘 大宁 , :V 核 函数 对分类 精度 影响 的研 究 等 SM 对 比实 验数 据如 下表 .
表 4组 合核 函数 1
2 , 定 它们 的类 别 为 正 类 t = 01 (0 1 ; )给 y 185 ,)如2  ̄
=4+ a d ( 2 , rnn ,) 给定他们 的类别 为负类 =一
o e(0 1. ns5 ,) 这样 选用 的样 本 点在每 次 实验 中当样 (f (, )・ )>取代( ) 3 式中的 , . 不变时 , 随机产生 的数据保持不变 , n 当 改 根据 H br —Sh i 原理 , i t cm d e t 只要一种运算满 本量 n 训练样本数据仍然保持和 / 7 , 变化之前数据的 足 M re 条件就可 以作为 内积使用 . ecr 】常用于分 变时, 相关 性. 1为 核 函数 为 线 性 时 , 练样 本 点 为 / 图 训 1 , 类 的核 函数 有 以下 四种 : a )线 性核 函数 , /( , ) = 即 Cx 可 分的 S VM分类 器 ; ; 应线 性 对
69 2
类 效果 越好 . 于该 实验 数 据 当我们 选 取样 本量 为 对 10 多 项式 次 数 为 2的 核 函数 时 , 可 以达 到 0 0, 就 . 90 70的分类 精 度. 表 2 不 同样 本 下高 斯核 函数 不 同参 数分 类精 度
( 高斯 核 函数 ( = 1 与 线性核 函数 ) )
I I _ .2
量为 10 线性核 函数分类所获取的分类模型图. 0,

} , 对应 S M是一种径向基函数分类器; V
dS ) 形核函数 , K , 如 ( )=t h vxx)+ a (( ri n
C , S M实现的就是一个两层 的感知器神经 网 )则 V 络, 对应 S M是 s m i V i od函数分类器 . g 】 根据 M r r e e 条件 , c 核函数的性质有封闭性 、 对 称性、 复合性 . 于是 除 了常用 的四种 函数 外 , 可 以 也 线 性构 造新 的核 函数 :
i=l
Ⅱ m n 虿 似I n i I l I f I
① 收 稿 日期 :02— 6- 8 21 0ቤተ መጻሕፍቲ ባይዱ0
L () 1
() 5
基金项 目: 数学地质四川省重点实验室 开放基金 ( C X Z0 9 1 ) S S D 2 00 9 . 作者 简介 : 刘大 宁( 9 6 , , 1 8 一) 女 湖北荆 门人 , 硕士 , 研究方向为 GS 间分析 与软件开发 . I空
J l uy
2 1 02
文章编号 : o 1o (0 2 0 — 6 7 0 1 8— 4 2 2 1 )4 0 2 — 4 0
S M 核 函数 对 分 类 精 度 影 响 的 研 究 ① V
刘大 宁 , 杨永乐 , 白 林
( 成都理工大学管理科学学院 。 四川 成都 605 ) 109
K ‘ , ( , )= K ( ,, 1 )+磊 ‘ , 2( , ) g(f f =a ( , ( >0 x, ) K1 巧) a ) () 6 () 7
图 1 样 本容量为 1 0 线性核函数分类 0,
于是本文实验使用 如下的组合核 函数 ( 中核 函 其 数 系数 为正 ) :
关键词: S M; 函数参数 ; e e 条件 ; V 核 Mr r c 分类精度 中图分 类 号 : T 3 14 P 9 . 文 献标 识码 : A sb c t i(, +b ]一1 ,i ,, , u e Y[ t j to t i ) ≥0 ( =12 …,) 1
定义 L gag arne函数 :
1 S M 分 类 原 理 V
S M是从线性可分情况下 的最 优分类面发展 V 而来 的, 最优分类面问题可以表示成如下的约束优 化 问题 :
约束条件求解 , 由此求得的最优分类 函数是 ( 其中
sn ) g ( 为符号函数 ) :
) s ( ’ 6) s ( i b) =g ( ) ’ =g ∑ayi+’ n + n * .
原约束条件可以把原问题转化为如下 凸二次规划
的对 偶 问题 :
mx 一 a∑ ÷∑∑
I 1 l l J。 1 =
( )
() 3
在神经网络方法 中无法避免的局部极值问题 ;3 () S M将实际问题通过非线性变换转换到高维的特 V
征空间, 在高维空间中构造线性判别函数来实现原 空间中的非线性判别 函数 , 特殊性质 能保证 S M V 有较好的推广 能力 , 同时它巧妙 地解决 了维数 问 题, 其算法复杂度与样本维数无关 【 . 2 通过计算机 J 对比实验得到两个方面因素 , 它们对分类精度的影 响包括 :1 核 函数参 数 对分 类精 度 的影 响 ;2 线 () () 性组合核函数对分类精度的影响.
rn n  ̄ae 3 ad ( tt. )状 态语 句 , 后 通过 给定 样 本数 / 然 1 , 的大小来 产 生第一 类 二维 训练 样本 =rn n I ad ( , t 2, ) 赋予对 应 的类 别 为 Y 。=oe( ,) 第 二 类 训 n5 n 1 ;
; 另一种方案通过非线性变换 将输入空间变换
st .
a ≥ O i= 1… , , , , l
∑ai 0 i = Y
这是一个在不等式约束下的二次 函数机制问题 , 存
在唯 一最优 解. 若 ’为 最优 解 , 则


∑ay  ̄i x
=l
() 4
a’ 不为零 的样本 即为支持 向量 , 因此 , 最优分类
面的权 系数 向 量 是 支 持 向量 的线 性 组 合. ’可 由 b
K( ,, =a ( ,, ) K1 ‘ )+bi(‘ , ¥ x, ) 2 () 8
3 1 核函数参数对分类精度影响 . 本实验对如下情况进行讨论 : 三种核 函数的参 数取 整 数 值 , 样 本 容 量 为 1020,0 ,O . 且 0 ,0 304 O 具 体获取的分类精度值如下所示 : 表 1 不 同样 本下 多项式 核 函数不 同参数分类精 度
第3 0卷 第 4期
21 年 o 月 02 7
佳 木 斯 大 学 学 报 (自 然 科 学 版 ) Jun l f i s U i r ( a rl cec d in o ra o a i nv S N t a S i eE io ) J mu e u n t
V 13 N . o. 0 o4
分析三组实验数据 , 组合核函数 l 中高斯函数 ( =1 与线性核函数各 自组合前分类精度都 比 )
较好 , 同一训 练样 本 以不 同 的 比例 组合 核 函数 分类
效果较差, 但是分类效果的区别我们可以很明显的
看 出来. 于 实 验 训 练 样 本 容 量 为 10, 用 形 核 对 0 采
_
一∑ ) WX+ ) I [ (r 6 一 ] ,
I= J
() 2
是专门针对有限样本情况的 , 目标是得到现有信 其 息下的最优解而不仅仅是样本数趋于无穷大时的
最优值 ;2 S M最终将转化成为一个二次型寻优 ()V 问题 , 从理论上说 , 得到的将是全局最优点 , 解决了
表 2中实验 数据 可 以观 察 到 除 了样 本 容 量 为 20 方 差 =1 4时 , 0, 和 针对 于 同一 方差 , 随着样 本
表5
组 合核 函数 2
高斯 ( = 1 与 多项 式 组合 核 ( ) q:2 函数 ) )
容量 的变 大 , 分类精 度逐渐 减小. 当样 本容量 为 10 高斯参数取值为 1和 2时 , 0, 获取最优精度 0 .
t ^
0 引 言
支持 向量机是建立在 统计学 习理论 的 V C维 理论和结构风险最小原理基础上 , 根据有限的样本 信息在模型的复杂性 和学习能力 之间寻求最佳折 中 的 方法 … . 持 向量 机 的优 点 主 要 有 : 1 S M 支 ( )V
L1b [ (, 0 l ,)= J
68 2
佳 木 斯 大 学 学 报 (自然 科 学 版 )
实 验 中 我 们 调 用
2 1 年 02
Malb . 10 下 t 7 1. a
2 S M 核 函数 V
当样本 数 据 线性 不 可 分 时 主要 有 两 种 解决 方 案, 一种 是 引入松 弛变 量 § (§ 0, 12 . l i= ,… n , 超平 面 t +b=0满足 ,(, i )≥ 1一 )使 t , , t戈 +6 l
到一个 高维 空间 , 后 在这 个新 空 间 中求取最 优线 然 性分类面 . 】这种非线性 变换是通 过定义适 当的 核 函 数 ( 积 函 数 )实 现 的 ,令 K x, 内 ( ) =<
练样本点为 =5+ a d ( ,)赋予对应的类别 rn n n2 , 为Y 2=一o e( ,) t ‘ i8, 1 . 测试 样本 我 们选 取 的是 : 。=1+rn n 5 , t x a d (0

10的分类情况 , 0 训练点 1 和训练点 2 为选取的
训 练点 , 测试 点 1 测试 点 2 测试 点分类 情况 , 与 为 计 算得 出其 分类 精度 为 0 90 . 图 1 .70 下 为一 张样本 容
b 多项式形式的核函数, / x )=[ ) ) 即 c , ( (
+1 ; ] 对应 S M是—个 q V 阶多项式分类器 ; C 高 斯 核 函 数, 即 ) , ) = ep 一 x{
相关主题