Boosting的思想是集成學習,把許多個弱分類器結合起來,構成1個強分類器。
首先輸入原始的訓練樣本,得到1個弱分類器,可以知道它的正確率和毛病率。計算該弱分類器的權重,以下:
然后提高毛病分類樣本的權重,讓后面的分類器focus它們,調劑樣本的權重:
如果本來分類正確:
如果樣本分類毛?。?img src="http://www.vxbq.cn/uploadfile/cj/20150307/20150305103942182.png" alt="">
把新的樣本輸入到后面學習,重復這個進程,得到許多個弱分類器,及其分類器的權重。
注意,Boosting算法中有兩個權重,1個是分類器的權重,1個是樣本的權重。
Boosting算法的優點:性能好,可以避免過擬合,可以綜合多個分類器的優勢。
缺點:對離群點比較敏感。