VC維理論和結構風險最小化準則是統計學習理論中的重要內容,基于這一理論的支持向量機算法由于具有好的泛化性能受到重視,并被研究用于文本分類問題.基于多項式核的研究工作認為SVM的泛化能力不受多項式階數的影響,并且能夠處理很高維的分類問題,用于文本分類無需進行特征選擇.研究發現,隨著多項式核階數的升高,SVM文本分類器會出現過學習現象,并且特征數越多越明顯,特征選擇是必需的.通過估計函數集的VC維,基于結構風險最小化理論對此問題進行分析,得出的結論跟實驗結果相符.
標簽:
SVM
多項式
風險
準則
上傳時間:
2013-12-01
上傳用戶:c12228