?? 93.txt
字號:
發(fā)信人: singhoo (tony), 信區(qū): DataMining
標 題: Re: 文本分類特征項的選擇?
發(fā)信站: 南京大學小百合站 (Mon Sep 23 10:15:22 2002), 站內(nèi)信件
從信息增益的公式可以看出
它對于每個詞IG值的計算使用了所有類別的信息,所以應(yīng)該只有一個特征集合
互信息MI公式有所不同,先獨立計算每個類的特征集合,在求并集,最后還是一個集合
【 在 pxh1018 (耐思) 的大作中提到: 】
: 我想建立一個文本分類模型,通過對訓(xùn)練文本集分詞,
: 用信息增益選取特征項,請問是每個分類主題(例如體育類)一個
: 特征項集,還是所有的主題的特征項集是一樣的?
:
--
※ 來源:.南京大學小百合站 bbs.nju.edu.cn.[FROM: 202.38.197.76]
?? 快捷鍵說明
復(fù)制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -