?? 640.txt
字號(hào):
發(fā)信人: singhoo (tony), 信區(qū): DataMining
標(biāo) 題: 關(guān)于naive bayes的問(wèn)題
發(fā)信站: 南京大學(xué)小百合站 (Mon Aug 19 16:57:34 2002), 站內(nèi)信件
打算使用簡(jiǎn)單Bayes算法作為文本分類器,但是對(duì)于文檔的特征提取有些疑問(wèn)
有的使用multinomial模型,即計(jì)算詞頻,不計(jì)算文檔頻率
使用TF/IDF。即計(jì)算詞頻,也計(jì)算文檔頻率
到底使用哪個(gè)模型比較好?如果使用TF/IDF,在使用Bayes計(jì)算的時(shí)候如何使用
TF/IDF得到的權(quán)值?THX!
--
※ 來(lái)源:.南京大學(xué)小百合站 bbs.nju.edu.cn.[FROM: 202.38.197.76]
?? 快捷鍵說(shuō)明
復(fù)制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號(hào)
Ctrl + =
減小字號(hào)
Ctrl + -