SVM的本質是尋覓最大間隔的分割超平面。
SVM的假定也是在樣本的每一個屬性前面乘以1個系數,代價函數是基于LR演變而來的。LR中是S型函數的假定,SVM中是分段函數cost的情勢,再包括正則項,最后SVM的代價函數為:
當C1般要設置地很大,這模樣的SVM才能夠找到最大間隔的超平面,thetaT*x>=1或thetaT*x<=⑴的時候,我們可以把第1項疏忽。這樣,轉換以后的SVM的目標函數就是我們熟習的:
我們構建拉格朗日函數:
分別對w和b求偏導,令偏導等于0,回代,可以得到w和b的最優解,以下:
W和b都是alpha表示的,我們使用SMO算法求得alpha。
利用核函數的概念,解決數據的線性不可分問題。核函數的作用,把顯示映照到高維空間轉換到隱式映照到高維空間。
SVM還可以擴大到多類分類中,利用one vs. one或one vs. other的規則。
SVM的優點:效果較好,既可以適用線性數據,也能夠非線性。
缺點:對參數選擇敏感。