教育资源为主的文档平台

当前位置: 查字典文档网> 所有文档分类> 工程科技> 兵器/核科学> 一种SVM分类器自动模型选择方法

一种SVM分类器自动模型选择方法

上传者:丁辅茂
|
上传时间:2015-05-10
|
次下载

一种SVM分类器自动模型选择方法

第28卷第1期2006年1月

北京科技大学学报

Beijing

V01.28NO.1

Jan.2006

JournalofUniversityofScienceandTechnology

一种SVM分类器自动模型选择方法

筠1,2’

斌1’

郝卫东1’

扬1)

1)北京科技大学信息工程学院,北京1000832)石家庄铁道学院计算机系,石家庄050043

摘要提出了一种基于粗网格与模式搜索相结合的支持向量机分类器模型参数优化方法。采用Jaakkola—Haussler误差上界作为模型选择的评价标准.以黎曼几何为理论依据,提出了一种新的保角变换,对核函数进行数据依赖性改进,进一步提高分类器泛化能力.在研究人工非线性分类问题的基础上,将该方法应用于手写相似汉字识别,实验结果表明分类精度得到了明显提高.关键词支持向量机;模型选择;黎曼几何;保角变换;汉字识别分类号TP391.43

支持向量机(SVM)是由Vapnik等人…于1995年在统计学习理论基础上提出的一种实现结构风险最小化准则的机器学习方法.模型选择【2】是SVM从理论走向实际应用时所必须解决的一个关键问题,它将直接显著地影响分类器泛化性能的好坏,但目前对于该问题的研究还很不深入.SVM分类器的模型选择问题可被描述为:对于某一给定的问题,如何寻找到最适合的核函数,其中包括核函数类型的确定、核参数的优化以及针对具体给定数据的核函数的修正等方面.在核函数类型的确定上,如何根据实际问题来选择最优的核函数至今仍未有明确的答案.从理论上来说,所有满足Mercer条件的核函数都可作为支持向量核使用.研究表明,高斯核函数SVM具有很强的学习能力[1|,因此它是一种应用最多的核函数.本文将重点讨论高斯核函数,其表示形式如下式所示:

两方面的问题,即选择标准和所采用的搜索方法.本文提出了一种基于Jaakkola—Haussler误差上界评价标准及粗网格与模式搜索相结合的模型参数优化策略.

因为在研究模型参数优化时所采用的核函数类型是确定的,所以并未充分考虑实际数据的影响.然而为了进一步提高分类的精度,有必要从数据的角度重新定义核函数.本文完成核参数优化后,以黎曼几何[4]为理论依据,对核函数进行数据依赖性改进,进而提高分类器泛化能力.

1模型选择评价标准

这里重点讨论常用的L2范数非线性软间隔SVM分类器.根据已知训练集T={(xl,Y1),…,(x。,Y。)}∈(X×Y)”,其中xf∈X=R”,Yi∈Y={1,~1},i=1,…,咒,建立L2范数非线性软间隔SVM的优化问题对偶形式如下:

1广

K(X,xi)=exp(一i与I|x~xi

二盯

l【2(1)

min寺∑∑ycvjaiajlK(xi,xj)+

。i=1

J=1

.1

除了核函数中的自由参数(比如高斯核函数中的宽度参数仃)外,对于软间隔分类情况,在SVM设计时需要引入常量参数C作为误差惩罚因子.通过变换核函数可将问题转变为硬间隔

SVM[3J,从而将C看作是核函数中的一个自由参

扣巧1一∑口i

_V

(2)(3)

i=1

S.t.口i≥0,i=1,2,…,72

其中,

数.在研究模型参数优化选择方法时,需要考虑

收稿日期:2004—11—01修回日期:2004—12—28

基金项目:河北省科学技术研究与发展指导计划项目(No02213560)

作者简介:封筠(1971一),女,副教授,博士研究生

驴㈦荔

所构造的齐次决策函数为

求解该最优化问题,得到最优解口。=(口f,…,a:)T,其中a?≠0的训练样本为支持向量.

,(x):。gn(奎d;yiK(x,工i))

(5)

万方数据 

封筠等:一种SVM分类器自动模型选择方法

模型选择的评价标准提供了问题解决的原则,通常可用泛化误差(GE)表示分类器推广能力.能够作为评价准则的数量指标主要分为两大类:一类来自实际数据的实验验证结果;一类来自理论分析所给出的界.实验验证准则的获得完全依赖于经验数据,该类方法将所得训练样本的部分作为验证数据用来评估泛化性能,主要包括K一折交叉验证(K—foldcross—validation)误差估计、留一(Leave—one—out,简称L00)误差估计.理论分析的目的就是要寻求与期望GE最紧的界.因为LOO误差估计被认为是对GE的近似无偏估计,所以也经常采用通过理论分析所获得的L00误差上界作为模型选择的评价标准.

由于实验验证准则的计算代价很高,所以本

文采用了一种经过理论推导获得的L00误差上界估计,即Jaakkola-Haussler误差上界[5|.针对L2范数非线性软间隔SVM分类器,其L00误差满足下式:

1—L

RLOO(丁)≤寺∑sgn(一Yif(xi)+a*K(xi,xi))

¨’

i=1

(6)

上式的右边项被称为Jaakkola-Haussler误差上界.对于高斯核函数,式(6)可写成

1』L

RLOO(T)≤专∑sgn(一y/(xi)+口f)(7)

’‘

i=1

显然,在计算Jaakkola—Haussler误差上界时只需要利用所有训练样本做一次分类器训练,获得分类决策函数f(X),因此与经验验证方法相比较,计算Jaakkola—Haussler误差上界所花费的代价要小很多.

2搜索策略

在确定了模型选择的准则后,需要设计一种能寻找到使得该准则全局最优的模型参数点的搜索方法.本文提出了一种粗网格与模式搜索相结合的优化策略,该算法先执行粗网格搜索寻找全局优化区域,再利用模式搜索寻找在该优化区域的最优点.2.1粗网格搜索

该搜索算法首先在参数空间定义统一的网格.研究发现在优化核参数时采用对数坐标是比较合理的[2].然后计算所有网格点的Jaakkola—Haussler误差上界,寻找全局最小区域.网格的粒度决定了解的质量与搜索效率.2.2模式搜索

该搜索算法将当前优化参数点置为模式中

万 

方数据心,利用所定义的模式确定搜索的方向.对于R2核参数空间,所采用的模式如图1所示,对应的模式矩阵为:

广1

10—1—1—1

0]

PK=L0

一1—1—1

oJ

(8)

喉罗。吵夕/

\雒

图1

R2核参数空间对应的模式

Fig.1

Patternfor

all

R2kernel

parameter

space

模式矩阵的每一列确定了以模式中心为起点的下一个搜索计算参数点的位置.通过模式搜索步长△P取值的不同,可以实现以模式中心为圆心的360。范围搜索.参数变化量可由下式计算得到:

S=APPK

(9)

广△已]T

对于R2核参数空间,其中AP=l:I.

L△譬.J

模式搜索算法描述如下:

Step

1确定初始的模式中心为粗网格搜索

所得到的优化参数点,给定对数参数搜索步长△P及足够小的允许步长8;

Step

2根据式(9)计算对数参数的变化量

s,然后依次求得当前模式中心的各邻域参数点的Jaakkola—Haussler误差上界,并将其中使得该评价准则最小的参数点置为新的模式中心;

Step3

若模式中心不变,则减小搜索步长

厶P并转到Step2重新寻找新的模式中心;

Step

4重复执行Step2与Step3,直到AP

小于允许步长8为止,最终确定的模式中心即为最优参数点.

3基于黎曼几何的核函数修正

3.1核函数的几何特性

Burges在文献[6]中讨论了基于核函数的非线性支持向量机的几何问题,认为非线性映射9是一个曲子流形,它定义了从输入空间I到特征空间F(再生核Hilbert空间)的一个嵌入.

定理1在特征空间中,黎曼度规与核函数之间满足如下关系式:

北京科技大学学报2006年第1期

go(x)2孟静(x,x引。,:。(10)

在黎曼空间中,体积微元可被定义为:

dV=√g(x)dxldx2…dxd

(11)

其中g(X=detlg“(X)l,放大因子√g(x)表示在映射∞下输入空间f的局部区域如何在特征空间F中被放大.

3.2

Amari的核函数修正思想

根据在输入空间所诱导的黎曼几何结构的基

础上,日本学者Amari等人提出了通过修正核函数来提高SVM分类性能的方法[4,7|。该方法的基本思想是通过改变不同区域的体积元来增大SVM分界面处的空间分解力,即增大f(x)=0分离边界曲面附近区域的黎曼度规g甜(X),而同时减小其他区域的g甜(X).基于在实际应用中分离边界曲面是未知的这一事实,Amari则通过增加支持向量邻域的黎曼度规矩阵来锯决这个问题,提出了如下定义的修正核函数的准保角映射,

定义1对于一个正的标量函数D(X),定义:

霞(X,X7)=D(X)D(x7)K(X,X7)

(12)

称之为核函数通过因子D(X)的保角变换,则良(X,x7)成为支持向量机的修正核函数.同时,

非线性映射9被修正为(o(xl=D(x)9(x).

对于高斯核函数,在其经过D(X)的保角变换后,黎曼度规gi(X)将变为:

g巧(X)=D{(x)DI(x+D2(x)g巧(童)(13)

其中,Di(工):粤盟.

uZi

由式(13)知,所选择的D(X)应该在支持向量处取值大而在其他点取值小.3.3保角变换

本文提出了一种新的保角变换D(X),如下式:

D(x)=∑exp(一恢一xi112/r;)(14)

i∈SV

其中,r;=}Ix。一置lI2,X。的取值可由下式给出:

fx二,Yi=+1

X。={

(15)

Izm,Yi2一l

』sv

在式(15)中,x未=÷∑托,咒≥是类标签为+1

的支持向量数目,x二表示属于正类的支持向量

月SV

样本的特征均值;Xm=去∑墨,挖二是类标签

万 

方数据为一l的支持向量数目,x二表示属于负类的支持向量样本的特征均值.所以,t表示支持向量样本X;与其所属类的支持向量特征中心矢量X。间的Euclidean距离.显然,从式(14)可知映射D(x)与样本到支持向量的距离呈指数递减.

定理2采用式(14)所示保角变换D(x)的修正核函数良(X,x7)满足Mercer定理的条件.

证明

设A为RN的紧子集,对于任意的

h(x)∈L2(A),有l矗2(工)dx<00.

由式(12),易见K(x,x7)具有连续性和对称性.下面证明K(X,X7)的半正定性.由式(14)可得到D(x)>0,因此必存在一个正数口,使得D(x)≥口>0,从而有:

rr

7)h(X)h(X7)dxdx7=

JJ

ll

K(X,xAXA

|l

D(x)D(x7)K(x,X7)h(x)h(X7)dxdx7≥

JJ

AXA

J92¨

K(x,X7)h(X)h(X7)dxdx7≥o.

JJ

AXA

定理得证.

在所提出的保角变换D(X)基础上,给出了数据依赖型修正核函数的支持向量机训练算法.该算法可描述为:

Step

1根据具体问题初步确定所选核函数

类型;

Step2

利用本文提出的核参数优化算法,

求得优化核参数,进而确定初始的核函数K;

Step

3使用核函数K训练SVM,获取支持

向量的信息,并计算xI::和x三,然后按式(12),

(14)和(15)修正它,得到修正核函数K;

Step4使用修正核函数KiJLl练SVM;Step

5重复执行Step3与Step4,直到获得

最好的分类性能.

4实验结果与分析

4.1人工非线性分类问题

为了测评本文所提出的模型选择方法性能,首先研究了它在人工非线性分类问题上的应用.这里选用在区域[一0.5,0.5]×[一0.5,0.5]内随机均匀分布的数据点.两类数据由非线性分界线y=0.5sin(2nx)所决定,如图2所示.在仿真实验中,每类随机选取100个样本构成训练集,每类再另选1000个样本构成测试集.

由核参数优化算法所得到的误差惩罚因子C

封筠等:一种SVM分类器自动模型选择方法

圈2人工数据集(两类分别用…和‘*’表示J

Fig.2

Artificial

data

set.the

two

classes

are

denotedby

and‘*’。respectively

为2048,宽度参数盯为2.在此优化值的基础上,利用本文所提出的保角变换对核函数进行迭代修正计算,其结果如图3所示.可见,在第1步迭代时SVM分类器就达到了最好的性能0.033,与没有修正前的0.09相比较,测试误差要降低63.3%,性能得到了大大改善.

图3人工非线性分类问题的核函数修正结果

Fig.3

Simulatedresultformodifiedkernelontheartificial

non?linearclassification

problem

4.2手写相似汉字识别问题

相似字的识别是脱机手写汉字识别技术需要解决的一个关键问题.尝试应用本文所提出的模型选择方法来解决相似字识别这一难题.首先采用弹性网格与小波变换相结合的方法提取汉字的特征,具体做法是:先将规范化后的二维手写体汉字图像(64×64)按行、列分别进行一级小波变换,对得到的低频分量LL子图(保持了汉字基本信息)按汉字图像在水平和垂直两个方向上的直方图投影的均匀划分构造一组弹性网格(N×N格),再计算每个网格内的像素概率分布,进而得到一个N2维的特征向量.然后,利用部分空间法选择那些能表明相似字间主要差别的特征分

万 

方数据量,形成最终输入分类器的特征向量.图4以某.个汉字样本为例说明了本文所采用的特征提取方法.另外,实验中发现弹性网格数N×N选为8×8时分类效果最好.

巳固

囝4特征提取示例.(1l规范化汉字;(2)LL子图;(3j弹性网

格化的LL子图

Hg.4

Illustrationoffeature

extraction:f1)normalized

char-

acter;(2)LLsub-image;(31meshed

LL

sub-image

以相似字组“己巳”为例来研究本文所提出的模型选择方法在手写相似字识别中的应用.在实验中,每个汉字选用900套不同的书写样本,其中400套用作训练,剩余500套用于测试.由核参数优化算法所得到的误差惩罚因子C为16,宽度参数仃为8.对核函数进行迭代修正计算的结果如图5所示.在第1步迭代时GE达到了0.033并且此时支持向量占总的训练样本比例为17.0%,与没有修正前的GE为0.06及支持向量比例为54.9%相比较,GE要降低45%,支持向量比例要降低69%,由此可见SVM分类器性能得到了较大程度地改善.另外,对比图3可以发现两者的核函数修正迭代曲线变化趋势很相似,都是在第1步迭代时SVM分类器就达到了最好的性能,并在后面的迭代中泛化误差GE趋于基本不变.

图5相似字组“己巳”识别的核函数修正结果Fig.3

Simulated

result

formodified

kernelonthesimilarset

‘己已’recognitionproblem

结论

本文提出了一种SVM分类器自动模型选择的新方法,有效地解决了SVM从理论走向实际

?92?

北京科技大学学报

Ed.New

2006年第1期

应用时所面临的模型选择这一“瓶颈”问题.首先针对高斯核函数以Jaakkola-Haussler误差上界为模型选择性能评价标准,应用粗网格与模式搜索相结合的优化算法寻找优化的模型参数.该优化算法充分利用了粗网格全局搜索及模式搜索的高效率优点,特别适合于计算导数困难的低维优化问题.然后基于黎曼几何理论提出了一个新的保角变换,对核函数进行数据依赖性的进一步改进,并证明了对应的修正核函数满足Mercer条件.最后,在人工非线性分类问题实验研究的基础上,将该方法应用于手写体相似汉字识别,实验结果表明SVM分类器性能得到了明显地改善.

参考文献

[1]Vapnik

York:Springer,2000

support

vector

吲Ⅲ

GoldC.SollichbP.Modelselectionfor

ma—

chineelassifcation.Neurocomputing,2003,55:221

Cortes

C,VapnikV.Support

vector

networks.MaehLearn,

1995,20:273

Amari

S,WuS.Improvingsupport

vector

machineclassifiers

bymodifyingkernelfunctions.Neural

783

Networks,1999,12:

ChapetleO,Vapnik

N.Choosingmultipleparameters

Learn,2002,46:131

for

support

Burges

vector

machines.Mach

JC.Geometry

andinvarianceinkernelbasedmeth?

ods{}Sch61kopf

Kernel

B。BurgesCJC。Smola1.Advances

in

Methods—Support

Vector

Learning.Cambridge:MIT

Press,1999

WuS.AmariS.ConforlTlaltransformationofkernel

tions:a

func.

data-dependentway

to

improvesupport

vector

machine

classifiers.Neural

N.The

nature

ProcessLett,2002,15:59

ofstatisticallearningtheory.2nd

Automaticmodelselectionmethodfor

supportvectormachinesclassifiers

FENGJunl?扪,XIEBinl’,HAOWeidong",YANGYan91)

1)Information2)Department

Engineeringof

School,Universityof

Science

andTechnologyBeijing,Beijing100083,ChinaofRailway,Shijiazhuang050043,China

ComputerScience,Shijiazhuang

Institute

ABSTRACT

er

Anoptimalapproachwaspresentedformodelparametersof

coarse

as

support

vector

machineclassifi—

error

based

on

gridsearchcombinedwithpatternsearch,inwhichtheJaakkola—Hausslertheevaluationcriterionofmodelselection.Based

on

bound

wasconsidered

theRiemanniangeometrytheory,a

novelconformaltransformationwasproposedandthekernelfunctionwasmodifiedbythetransformationin

data—dependentway.Simulatedresultsfortheartificialdata

set

showedthattheapproachforautomatic

modelselectionwasveryeffective.AnapplicationoftheapproachinhandwrittensimilarChinesecharactersrecognitionwasfurtherinvestigated.Theexperimentalresultshowedremarkableimprovementoftheper—formanceoftheclassifier.KEY

WORDS

support

vector

machines;modelselection;Riemanniangeometry;conformal

transforma—

tion;Chinesecharacterrecognition

万方数据 

版权声明:此文档由查字典文档网用户提供,如用于商业用途请与作者联系,查字典文档网保持最终解释权!

下载文档

热门试卷

2016年四川省内江市中考化学试卷
广西钦州市高新区2017届高三11月月考政治试卷
浙江省湖州市2016-2017学年高一上学期期中考试政治试卷
浙江省湖州市2016-2017学年高二上学期期中考试政治试卷
辽宁省铁岭市协作体2017届高三上学期第三次联考政治试卷
广西钦州市钦州港区2016-2017学年高二11月月考政治试卷
广西钦州市钦州港区2017届高三11月月考政治试卷
广西钦州市钦州港区2016-2017学年高一11月月考政治试卷
广西钦州市高新区2016-2017学年高二11月月考政治试卷
广西钦州市高新区2016-2017学年高一11月月考政治试卷
山东省滨州市三校2017届第一学期阶段测试初三英语试题
四川省成都七中2017届高三一诊模拟考试文科综合试卷
2017届普通高等学校招生全国统一考试模拟试题(附答案)
重庆市永川中学高2017级上期12月月考语文试题
江西宜春三中2017届高三第一学期第二次月考文科综合试题
内蒙古赤峰二中2017届高三上学期第三次月考英语试题
2017年六年级(上)数学期末考试卷
2017人教版小学英语三年级上期末笔试题
江苏省常州西藏民族中学2016-2017学年九年级思想品德第一学期第二次阶段测试试卷
重庆市九龙坡区七校2016-2017学年上期八年级素质测查(二)语文学科试题卷
江苏省无锡市钱桥中学2016年12月八年级语文阶段性测试卷
江苏省无锡市钱桥中学2016-2017学年七年级英语12月阶段检测试卷
山东省邹城市第八中学2016-2017学年八年级12月物理第4章试题(无答案)
【人教版】河北省2015-2016学年度九年级上期末语文试题卷(附答案)
四川省简阳市阳安中学2016年12月高二月考英语试卷
四川省成都龙泉中学高三上学期2016年12月月考试题文科综合能力测试
安徽省滁州中学2016—2017学年度第一学期12月月考​高三英语试卷
山东省武城县第二中学2016.12高一年级上学期第二次月考历史试题(必修一第四、五单元)
福建省四地六校联考2016-2017学年上学期第三次月考高三化学试卷
甘肃省武威第二十三中学2016—2017学年度八年级第一学期12月月考生物试卷

网友关注视频

小学英语单词
【部编】人教版语文七年级下册《逢入京使》优质课教学视频+PPT课件+教案,安徽省
化学九年级下册全册同步 人教版 第22集 酸和碱的中和反应(一)
外研版英语七年级下册module3 unit1第二课时
外研版英语三起5年级下册(14版)Module3 Unit1
【部编】人教版语文七年级下册《逢入京使》优质课教学视频+PPT课件+教案,安徽省
冀教版小学数学二年级下册第二周第2课时《我们的测量》宝丰街小学庞志荣
冀教版小学数学二年级下册第二单元《余数和除数的关系》
沪教版牛津小学英语(深圳用) 六年级下册 Unit 7
冀教版小学英语五年级下册lesson2教学视频(2)
化学九年级下册全册同步 人教版 第25集 生活中常见的盐(二)
三年级英语单词记忆下册(沪教版)第一二单元复习
冀教版小学数学二年级下册1
【部编】人教版语文七年级下册《泊秦淮》优质课教学视频+PPT课件+教案,湖北省
北师大版数学四年级下册第三单元第四节街心广场
30.3 由不共线三点的坐标确定二次函数_第一课时(市一等奖)(冀教版九年级下册)_T144342
外研版英语七年级下册module3 unit2第一课时
沪教版牛津小学英语(深圳用) 五年级下册 Unit 10
苏科版数学八年级下册9.2《中心对称和中心对称图形》
外研版英语七年级下册module1unit3名词性物主代词讲解
第4章 幂函数、指数函数和对数函数(下)_六 指数方程和对数方程_4.7 简单的指数方程_第一课时(沪教版高一下册)_T1566237
沪教版牛津小学英语(深圳用) 四年级下册 Unit 3
【部编】人教版语文七年级下册《老山界》优质课教学视频+PPT课件+教案,安徽省
冀教版英语三年级下册第二课
19 爱护鸟类_第一课时(二等奖)(桂美版二年级下册)_T502436
【部编】人教版语文七年级下册《逢入京使》优质课教学视频+PPT课件+教案,辽宁省
第19课 我喜欢的鸟_第一课时(二等奖)(人美杨永善版二年级下册)_T644386
3月2日小学二年级数学下册(数一数)
北师大版小学数学四年级下册第15课小数乘小数一
人教版历史八年级下册第一课《中华人民共和国成立》