Ictclas分詞系統
Ictclas分詞系統,文詞法分析是中文信息處理的基礎與關鍵。中國科學院計算技術研究所在多年研究工作積累的基礎上,研制出了漢語詞法分析系統ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)...
Ictclas分詞系統,文詞法分析是中文信息處理的基礎與關鍵。中國科學院計算技術研究所在多年研究工作積累的基礎上,研制出了漢語詞法分析系統ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)...
漢語詞法分析系統ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),該系統的功能有:中文分詞;詞性標注;未登錄詞識別。分詞正確率高達97.58 (973專家組評測),未登錄詞識別召回率均高于90 ,其...
對ICTCLAS的API進行了包裝,提供了一個LexUtil的工具類,用來簡化對ICTCLAS的API的調用。 本項目是netbeans工程格式。...
含有多個分詞算法。畢業設計的時候獲得的,希望對大家在漢字處理中能用的到。 ICTCLAS算法,中科院,對名字識別能力很強。VC開發。 CSharp分詞,向前匹配加向后最大匹配,C#開發,容易擴展。 小叮咚分詞,由后向前最大匹配,C#開發。 xerdoc分詞,基于ICTCLAS的Java版本分...
XPDF:把pdf文檔轉化為TEXT文檔的庫,如需中文支持,請到官方網站下載中文語言包 HTM2TXT:把HTML文件轉化為TEXT文件的庫 ICTCLAS:對中文字符串進行分詞的庫 PS2TXT:把Postscript文件轉化為TEXT文件的源碼...