?? 945.txt
字號:
發信人: tyqqre (tyqqre), 信區: DataMining
標 題: Re: 關于naive bayes的問題
發信站: 南京大學小百合站 (Mon Sep 16 10:51:44 2002)
我的理解是:
p(wi|cj)是在訓練例集上求得的,也就是說,只要訓練例集不變,這個值應該是固定的。
而÷來了一個需要分類的新文檔di
在計算p(cj|di)的時候,nid次方的這個nid是在這個新文檔di中wi出現的次數。
所以nid越大,p(wi|cj)的nid次方就越小。
這樣能不能說,用這種方法只能比較同一篇文章屬于不同類別的概率,
而不能比較不同文章屬于同一類別的概率。
【 在 singhoo 的大作中提到: 】
: 但是p(wi|cj)會變大阿
: 你的前提條件是wi出現多次
: 本來出現一次p(wi|cj)=0.8,不計算次方
: 出現2次,p(wi|cj)=0.9,平方后是0.81
: 變小了嗎?
--
※ 來源:.南京大學小百合站 http://bbs.nju.edu.cn [FROM: 211.99.42.120]
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -