官方說(shuō)明:“刨丁解羊中文分詞器,主要用于對(duì)網(wǎng)絡(luò)蜘蛛或網(wǎng)絡(luò)爬蟲(chóng)抓取的網(wǎng)頁(yè)進(jìn)行分詞,支持繁體中文分詞、簡(jiǎn)體中文分詞、英文分詞,是制作通用搜索引擎和垂直搜索引擎的核心組件。該軟件在普通PC機(jī)器上測(cè)試顯示:TXT格式正文分詞速度約為3000萬(wàn)字/分鐘,網(wǎng)頁(yè)分詞速度約為277.8個(gè)網(wǎng)頁(yè)/秒。該軟件采用基礎(chǔ)詞庫(kù)(63萬(wàn)詞語(yǔ))+擴(kuò)展詞庫(kù)(用戶可手工添加新詞)。DLL及OCX調(diào)用請(qǐng)聯(lián)系QQ(601069289)。”
很小的綠色中文分詞軟件,我也是從網(wǎng)上找到的,還是足夠日常中一些小場(chǎng)景使用,對(duì)不懂程序的同學(xué)而言,可能用這樣的小軟件比去想辦法自學(xué)程序再去研究一套分詞工具出來(lái)要干脆。當(dāng)然更復(fù)雜的需求,這個(gè)可能也解決不了。
標(biāo)簽:
分詞
分詞軟件
中文分詞
上傳時(shí)間:
2017-10-21
上傳用戶:hanboy