?? readme.txt
字號:
1 介紹:嵌入式機器學習,在自己的算法中調用Weka現文本分類,是一個小的數據挖掘程序,雖然實用價值不是很大,但對于Weka的理解和使用是有幫助的。本例子來自《數據挖掘:實用機器學習技術》第2版。大家可以到 http://blogger.org.cn/blog/message.asp?name=DMman#23691 下載該書察看對算法的詳細解釋。算法中作了詳細的注釋,雖然是英文的,但還是比較簡單。下面對例子的使用作了淺顯的介紹,有興趣的朋友可以研究。(DMman整理http://blogger.org.cn/blog/blog.asp?name=DMman)
2 功能:使用weka中的j48分類器實現了文本分類的一個小程序。文本文件通過weka的過濾器StringToWordVector預處理。
3 注意:把weka.jar加入你的classpath中,才可以通過編譯。
4 使用方法:
命令行參數:
-t 文本文件路徑
-m 你的模型文件路徑
-c 可選,類別(hit 或 miss)
如果提供了-c則用于訓練,否則被模型分類,輸出該文本的類型(hit或miss)
模型是動態建立的,第一次使用命令行必須指定-c參數,才可以建立模型。
1) 建立模型
>java MessageClassifier -t data/1.bmp -m myModel -c hit
可以看到myModel建立了。然后繼續訓練一下這個模型。使用的文本實例越多,模型的分類性能越好
>java MessageClassifier -t data/2.bmp -m myModel -c hit
>java MessageClassifier -t data/1.gif -m myModel -c miss
......
2) 使用模型分類
有了模型,就可以使用它為文本文件分類了,如
>java MessageClassifier -t data/2.gif -m myModel
3) 可以使用提供-c參數的命令繼續完善模型
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -