亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

蟲蟲首頁| 資源下載| 資源專輯| 精品軟件
登錄| 注冊

您現在的位置是:蟲蟲下載站 > 資源下載 > 多國語言處理 > 計算所漢語詞法分析系統ICTCLAS介紹 詞是最小的能夠獨立活動的有意義的語言成分。 但漢語是以字為基本的書寫單位

計算所漢語詞法分析系統ICTCLAS介紹 詞是最小的能夠獨立活動的有意義的語言成分。 但漢語是以字為基本的書寫單位

  • 資源大小:111 K
  • 上傳時間: 2014-01-02
  • 上傳用戶:fzjw0803005
  • 資源積分:2 下載積分
  • 標      簽: ICTCLAS 漢語 計算

資 源 簡 介

計算所漢語詞法分析系統ICTCLAS介紹 詞是最小的能夠獨立活動的有意義的語言成分。 但漢語是以字為基本的書寫單位,詞語之間沒有明顯的區分標記,因此,中文詞語分析是中文信息處理的基礎與關鍵。為此,我們中國科學院計算技術研究所在多年研究基礎上,耗時一年研制出了漢語詞法分析系統ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),該系統的功能有:中文分詞;詞性標注;未登錄詞識別。分詞正確率高達97%以上,未登錄詞識別召回率均高于90%,其中中國人名的識別召回率接近98%處理速度為31.5Kbytes/s。ICTCLAS的特色還在于:可以根據需要輸出多個高概率結果,有多種輸出格式,支持北大詞性標注集,973專家組給出的詞性標注集合。該系統得到了專家的好評,并有多篇論文在國內外發表。 計算所漢語詞法分析系統ICTCLAS同時還提供一套完整的動態連接庫ICTCLAS.dll和相應的概率詞典,開發者可以完全忽略漢語詞法分析,直接在自己的系統中調用ICTCLAS,ICTCLAS可以根據需要輸出多個高概率的結果,輸出格式也可以定制,開發者在分詞和詞性標注的基礎上繼續上層開發。

相 關 資 源

主站蜘蛛池模板: 肃宁县| 白朗县| 万载县| 韩城市| 佛山市| 武义县| 沐川县| 成武县| 新巴尔虎左旗| 武安市| 哈尔滨市| 商丘市| 淮滨县| 华蓥市| 香格里拉县| 嘉黎县| 遂川县| 昭苏县| 綦江县| 霍林郭勒市| 桓仁| 宁乡县| 临漳县| 镇原县| 漳浦县| 南雄市| 台湾省| 成安县| 内黄县| 丰城市| 连山| 晋宁县| 阳东县| 萨嘎县| 邯郸县| 元氏县| 故城县| 庄河市| 仙游县| 精河县| 柳州市|