官方說明:“刨丁解羊中文分詞器,主要用于對網絡蜘蛛或網絡爬蟲抓取的網頁進行分詞,支持繁體中文分詞、簡體中文分詞、英文分詞,是制作通用搜索引擎和垂直搜索引擎的核心組件。該軟件在普通PC機器上測試顯示:TXT格式正文分詞速度約為3000萬字/分鐘,網頁分詞速度約為277.8個網頁/秒。該軟件采用基礎詞庫(63萬詞語)+擴展詞庫(用戶可手工添加新詞)。DLL及OCX調用請聯系QQ(601069289)。”
很小的綠色中文分詞軟件,我也是從網上找到的,還是足夠日常中一些小場景使用,對不懂程序的同學而言,可能用這樣的小軟件比去想辦法自學程序再去研究一套分詞工具出來要干脆。當然更復雜的需求,這個可能也解決不了。
標簽:
分詞
分詞軟件
中文分詞
上傳時間:
2017-10-21
上傳用戶:hanboy