2009年4月7日星期二

Relative Margin Machine

我们知道,传统的SVM是基于最大化margin的,目标函数仅考虑使得margin最大同时错误率最小.但这种方法没有考虑到数据的扩散(spread)情况.例如有两组采样数据,第一组从(1,1)点开始向x轴正向扩散,第二组从(-1,-1)点开始向x轴负向扩散.传统的SVM会将y=x作为分类器,而事实上最好的分类器是y=0,并且如果数据沿x轴放缩(scale),采用SVM得到的分类器错误率还会上升.所以在最大化margin的同时,还需要考虑数据的扩散情况,使数据沿w方向的扩散程度最小.这就需要在目标函数中再加进一个正则项.接下来就是对新的目标函数的求解问题.

没有评论:

发表评论