?? 2.txt
字號:
發(fā)信人: GzLi (笑梨), 信區(qū): DataMining
標 題: [合集]有人談談決策樹中的剪枝和特征子集選擇的關系嗎?
發(fā)信站: 南京大學小百合站 (Thu Apr 25 00:06:13 2002), 站內(nèi)信件
boy (劉芳百是) 于Mon Apr 22 11:04:34 2002提到:
我感覺兩者是一回事,
剪枝的過程就相當于wapper方式的特征子集選擇,
不知道是不是正確
tyqqre (tyqqre) 于Mon Apr 22 11:15:14 2002)
提到:
我覺得剪枝是為了防止樹過分的大,或者對訓練例過分的吻合。
而特征子集的選擇,例如在文本挖掘中,由于每個文本的特征太多了所以要選擇最重要的
的特征來表示文本。
GzLi (笑梨) 于Mon Apr 22 16:50:43 2002提到:
特征選擇是為了防止訓練速度和識別速度過慢,以及為了防止訓練樣本與特征的比例過低
造成過擬合,才采用的。
如果剪枝是這個作用的活,應該說是一種wrapper形式的FS(Feature Selection)。
文本挖掘中,由于采用的特征中含有一定量的irrelavant Features and weak relavant
features, 所以要FS,可以有多種方法,如果利用decision tree,就可以同時pruning,
如果采用SVM,也可以同時計算輸入的參數(shù)的權重,進行選擇。
mnls (蒙娜麗莎的微笑) 于Tue Apr 23 09:20:25 2002提到:
我覺得不是一回事。一棵子樹被剪枝,意味著被一個葉子節(jié)點或者它的一棵子樹代替,
其結果子樹對應的特征集合與特征子集選擇的結果未必相同。
ericwzx (風子) 于Tue Apr 23 20:07:33 2002提到:
如果一個葉子節(jié)點代表一個特征的話,剪枝的結果應該是就是達到了特征子集選擇的效果
了吧?我也覺得應該就是用決策樹作為分類器的wrapper model。
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -