VC維理論和結(jié)構(gòu)風險最小化準則是統(tǒng)計學習理論中的重要內(nèi)容,基于這一理論的支持向量機算法由于具有好的泛化性能受到重視,并被研究用于文本分類問題.基于多項式核的研究工作認為SVM的泛化能力不受多項式階數(shù)的影響,并且能夠處理很高維的分類問題,用于文本分類無需進行特征選擇.研究發(fā)現(xiàn),隨著多項式核階數(shù)的升高,SVM文本分類器會出現(xiàn)過學習現(xiàn)象,并且特征數(shù)越多越明顯,特征選擇是必需的.通過估計函數(shù)集的VC維,基于結(jié)構(gòu)風險最小化理論對此問題進行分析,得出的結(jié)論跟實驗結(jié)果相符.
標簽:
SVM
多項式
風險
準則
上傳時間:
2013-12-01
上傳用戶:c12228