漢語詞法分析系統(tǒng)ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),該系統(tǒng)的功能有:中文分詞;詞性標注;未登錄詞識別。分詞正確率高達97.58 (973專家組評測),未登錄詞識別召回率均高于90 ,其中中國人名的識別召回率接近98 處理速度為31.5Kbytes/s。ICTCLAS的特色還在于:可以根據(jù)需要輸出多個高概率結(jié)果,有多種輸出格式,支持北大詞性標注集,973專家組給出的詞性標注集合。該系統(tǒng)得到了專家的好評,并有多篇論文在國內(nèi)外發(fā)表。
標簽:
Technology
Computing
Institute
Analysis
上傳時間:
2013-12-24
上傳用戶:ANRAN