計算所漢語詞法分析系統(tǒng)ictclas.分詞正確率高達97.58%(973專家組評測),未登錄詞識別召回率均高于90%,其中中國人名的識別召回率接近98%處理速度為31.5Kbytes/s。ictclas的特色還在于:可以根據(jù)需要輸出多個高概率結(jié)果,有多種輸出格式,支持北大詞性標(biāo)注集,973專家組給出的詞性標(biāo)注集合。
標(biāo)簽: ictclas 97.58% 973 分
上傳時間: 2014-01-09
上傳用戶:1079836864
計算所漢語詞法分析系統(tǒng)ictclas介紹 詞是最小的能夠獨立活動的有意義的語言成分。 但漢語是以字為基本的書寫單位,詞語之間沒有明顯的區(qū)分標(biāo)記,因此,中文詞語分析是中文信息處理的基礎(chǔ)與關(guān)鍵。為此,我們中國科學(xué)院計算技術(shù)研究所在多年研究基礎(chǔ)上,耗時一年研制出了漢語詞法分析系統(tǒng)ictclas(Institute of Computing Technology, Chinese Lexical Analysis System),該系統(tǒng)的功能有:中文分詞;詞性標(biāo)注;未登錄詞識別。分詞正確率高達97%以上,未登錄詞識別召回率均高于90%,其中中國人名的識別召回率接近98%處理速度為31.5Kbytes/s。ictclas的特色還在于:可以根據(jù)需要輸出多個高概率結(jié)果,有多種輸出格式,支持北大詞性標(biāo)注集,973專家組給出的詞性標(biāo)注集合。該系統(tǒng)得到了專家的好評,并有多篇論文在國內(nèi)外發(fā)表。 計算所漢語詞法分析系統(tǒng)ictclas同時還提供一套完整的動態(tài)連接庫ictclas.dll和相應(yīng)的概率詞典,開發(fā)者可以完全忽略漢語詞法分析,直接在自己的系統(tǒng)中調(diào)用ictclas,ictclas可以根據(jù)需要輸出多個高概率的結(jié)果,輸出格式也可以定制,開發(fā)者在分詞和詞性標(biāo)注的基礎(chǔ)上繼續(xù)上層開發(fā)。
上傳時間: 2014-01-02
上傳用戶:15736969615
ictclas的JNI調(diào)用接口文件: Title:ictclas Caller * <p>Description:do chinese word segmentation.don t change the pakage and CLASS name, orelse you can t use it. * 請不要改變包名、類名以及native的方法名,否則調(diào)用將失效。 * 由于ictclas本身存在很多魯棒性問題,調(diào)用segSentence時,string參數(shù)請保證不要過長或帶有亂碼。調(diào)用次數(shù)過多(如處理幾十G的數(shù)據(jù))會有可能造成內(nèi)存溢出。 * 故基本只能用于較小規(guī)模數(shù)據(jù)(相對幾十G來說)。 * 請運行時設(shè)置jvm足夠的堆棧空間。
標(biāo)簽: ictclas segmentation Description chinese
上傳時間: 2014-01-25
上傳用戶:it男一枚
基于中科院的ictclas實現(xiàn)中文分詞系統(tǒng) 開發(fā)工具是JAVA.經(jīng)測試,效果很好.
上傳時間: 2015-06-12
上傳用戶:stvnash
Sharp ictclas分詞系統(tǒng),對ictclas分詞系統(tǒng)進行了詳盡的分析,并將代碼移植到C#。
上傳時間: 2015-09-17
上傳用戶:z754970244
對ictclas源碼進行了詳盡的分析,對系統(tǒng)的理解相當(dāng)有幫助。
上傳時間: 2015-09-17
上傳用戶:wang5829
漢語詞法分析系統(tǒng)ictclas windows版本,我將FreeictclasLinux移植到windows下,開發(fā)環(huán)境VS2005
標(biāo)簽: windows FreeictclasLinux ictclas 漢語
上傳時間: 2015-10-05
上傳用戶:蟲蟲蟲蟲蟲蟲
中文分詞, N-最短路徑算法 ictclas研究學(xué)習(xí)組 http://groups.google.com/group/ictclas?msg=subscribe
標(biāo)簽: subscribe ictclas ictclas groups
上傳時間: 2014-08-24
上傳用戶:heart520beat
k Shortest Paths David Eppstein s method ictclas研究學(xué)習(xí)組 http://groups.google.com/group/ictclas?msg=subscribe
標(biāo)簽: Shortest Eppstein ictclas ictclas
上傳時間: 2013-12-30
上傳用戶:youmo81
ictclas java實現(xiàn) 很不錯的 包含全部所需的文件包 能對句子進行詳細的詞法分析.
上傳時間: 2013-12-04
上傳用戶:三人用菜
蟲蟲下載站版權(quán)所有 京ICP備2021023401號-1