給定帶有分詞和詞性標(biāo)注信息語(yǔ)料,從中總結(jié)單詞的詞頻,并按照出現(xiàn)次數(shù)排序輸出
資源簡(jiǎn)介:給定帶有分詞和詞性標(biāo)注信息語(yǔ)料,從中總結(jié)單詞的詞頻,并按照出現(xiàn)次數(shù)排序輸出
上傳時(shí)間: 2013-12-25
上傳用戶(hù):Ants
資源簡(jiǎn)介:一個(gè)集分詞、詞性標(biāo)注和格式轉(zhuǎn)換的強(qiáng)大的工具包
上傳時(shí)間: 2013-12-22
上傳用戶(hù):ztj182002
資源簡(jiǎn)介:中科院的漢語(yǔ)詞法分析系統(tǒng)ICTCLAS,主要功能包括中文分詞;詞性標(biāo)注;命名實(shí)體識(shí)別;新詞識(shí)別;同時(shí)支持用戶(hù)詞典。
上傳時(shí)間: 2014-01-20
上傳用戶(hù):水口鴻勝電器
資源簡(jiǎn)介:學(xué)習(xí)漢語(yǔ)自動(dòng)分詞與詞性標(biāo)注軟件的組件化有助于更好的理解中文分詞系統(tǒng)
上傳時(shí)間: 2017-06-03
上傳用戶(hù):WMC_geophy
資源簡(jiǎn)介:自動(dòng)分詞與詞性標(biāo)注評(píng)測(cè)有助于學(xué)習(xí)NLP,并且理解其更深的含義
上傳時(shí)間: 2017-06-03
上傳用戶(hù):2404
資源簡(jiǎn)介:計(jì)算所漢語(yǔ)詞法分析系統(tǒng)ICTCLAS介紹 詞是最小的能夠獨(dú)立活動(dòng)的有意義的語(yǔ)言成分。 但漢語(yǔ)是以字為基本的書(shū)寫(xiě)單位,詞語(yǔ)之間沒(méi)有明顯的區(qū)分標(biāo)記,因此,中文詞語(yǔ)分析是中文信息處理的基礎(chǔ)與關(guān)鍵。為此,我們中國(guó)科學(xué)院計(jì)算技術(shù)研究所在多年研究基礎(chǔ)上,耗時(shí)一...
上傳時(shí)間: 2014-01-02
上傳用戶(hù):15736969615
資源簡(jiǎn)介:用于中文分詞的算法。包括逆向分詞和反向分詞
上傳時(shí)間: 2015-11-09
上傳用戶(hù):wfl_yy
資源簡(jiǎn)介:Classifier4J是一個(gè)很好的基于java的分類(lèi)器,里面有Native bayes和KNN等方法的文本分類(lèi).另外還 提供了分詞和自動(dòng)摘要等功能
上傳時(shí)間: 2016-08-14
上傳用戶(hù):lwwhust
資源簡(jiǎn)介:本系統(tǒng)實(shí)現(xiàn)了分詞和倒排索引,分詞采用正向最大匹配,
上傳時(shí)間: 2013-12-17
上傳用戶(hù):luke5347
資源簡(jiǎn)介:ICT分詞程序接口 用以進(jìn)行中文文本分詞,詞性標(biāo)注。
上傳時(shí)間: 2016-12-10
上傳用戶(hù):AbuGe
資源簡(jiǎn)介:這是一個(gè)中科院中文詞法分析器,能對(duì)輸入的文本進(jìn)行分詞,詞性標(biāo)注,未登陸詞識(shí)別等功能,正確率相當(dāng)高,很有用哦
上傳時(shí)間: 2014-01-23
上傳用戶(hù):xiaoxiang
資源簡(jiǎn)介:1. 先打開(kāi)規(guī)則庫(kù),讀入規(guī)則集 (可比較兩個(gè)規(guī)則文件rule1.txt 和 rule2.txt的差異) 2. 選擇經(jīng)過(guò)分詞和詞性標(biāo)注的文件,進(jìn)行句法分析 3. 分析結(jié)果文件與測(cè)試文件在同一個(gè)目錄下,文件后綴名為 .pcfg 4. 分析結(jié)束后,同時(shí)產(chǎn)生一個(gè)新的規(guī)則文件,后綴名為.new...
上傳時(shí)間: 2013-12-28
上傳用戶(hù):梧桐
資源簡(jiǎn)介:漢語(yǔ)詞法分析系統(tǒng)ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),該系統(tǒng)的功能有:中文分詞;詞性標(biāo)注;未登錄詞識(shí)別。分詞正確率高達(dá)97.58 (973專(zhuān)家組評(píng)測(cè)),未登錄詞識(shí)別召回率均高于90 ,其中中國(guó)人名的識(shí)別召回率接近98 ...
上傳時(shí)間: 2013-12-24
上傳用戶(hù):ANRAN
資源簡(jiǎn)介:用于中文分詞的切分詞典,還有詞性標(biāo)注,以這個(gè)詞典數(shù)據(jù)庫(kù)為基礎(chǔ)建立文本分類(lèi),文本檢索或文本過(guò)濾可以節(jié)省很多時(shí)間.很全,強(qiáng)烈推薦!
上傳時(shí)間: 2015-03-11
上傳用戶(hù):lijinchuan
資源簡(jiǎn)介:采用復(fù)雜數(shù)據(jù)結(jié)構(gòu)從文件中生成一個(gè)帶有拼音和詞性信息的詞典,用perl語(yǔ)言實(shí)現(xiàn)
上傳時(shí)間: 2013-12-10
上傳用戶(hù):jennyzai
資源簡(jiǎn)介:對(duì)中文進(jìn)行分詞并對(duì)其詞性標(biāo)注;命名實(shí)體識(shí)別;新詞識(shí)別;同時(shí)支持用戶(hù)詞典
上傳時(shí)間: 2017-03-22
上傳用戶(hù):kiklkook
資源簡(jiǎn)介:基于逆向最大匹配算法的分詞及基于HMM模型的詞性標(biāo)注系統(tǒng),包括了未登錄詞的識(shí)別、數(shù)據(jù)庫(kù)的添加等內(nèi)容。(需要手動(dòng)修改數(shù)據(jù)庫(kù)的路徑才可以運(yùn)行)
上傳時(shí)間: 2017-06-24
上傳用戶(hù):從此走出陰霾
資源簡(jiǎn)介:中文信息處理方面的一個(gè)源碼。此為一個(gè)分詞軟件,這個(gè)分詞的算法雖然簡(jiǎn)單,但是原理和其他相同,是最大概率法分次。功能強(qiáng)大,代碼簡(jiǎn)潔易懂。
上傳時(shí)間: 2016-01-05
上傳用戶(hù):hxy200501
資源簡(jiǎn)介:基于java語(yǔ)言的分詞系統(tǒng),可以標(biāo)注詞性、詞頻等信息,可用于二次開(kāi)發(fā)
上傳時(shí)間: 2016-05-13
上傳用戶(hù):mikesering
資源簡(jiǎn)介:中文信息處理的分詞詞庫(kù),百度分詞詞庫(kù),用于中文信息處理的詞庫(kù)分析和源程序鏈接
上傳時(shí)間: 2016-05-22
上傳用戶(hù):標(biāo)點(diǎn)符號(hào)
資源簡(jiǎn)介:實(shí)現(xiàn)中文信息處理中的漢語(yǔ)分詞的功能,采用了正向最大和逆向最大的分詞算法。
上傳時(shí)間: 2014-12-01
上傳用戶(hù):ljt101007
資源簡(jiǎn)介:計(jì)算所漢語(yǔ)詞法分析系統(tǒng)ICTCLAS.分詞正確率高達(dá)97.58%(973專(zhuān)家組評(píng)測(cè)),未登錄詞識(shí)別召回率均高于90%,其中中國(guó)人名的識(shí)別召回率接近98%處理速度為31.5Kbytes/s。ICTCLAS的特色還在于:可以根據(jù)需要輸出多個(gè)高概率結(jié)果,有多種輸出格式,支持北大詞性標(biāo)注集,...
上傳時(shí)間: 2014-01-09
上傳用戶(hù):1079836864
資源簡(jiǎn)介:一個(gè)中文分詞的實(shí)現(xiàn)及演示程序,可用與中文和英文詞組的分割.
上傳時(shí)間: 2015-04-18
上傳用戶(hù):as275944189
資源簡(jiǎn)介:對(duì)文件夾中的各文件的內(nèi)容分詞后按照詞的內(nèi)容進(jìn)行統(tǒng)計(jì)和組織。
上傳時(shí)間: 2014-01-16
上傳用戶(hù):Divine
資源簡(jiǎn)介:一段關(guān)于中文信息分類(lèi)的分詞算法,他實(shí)現(xiàn)了信息過(guò)濾中的分詞,為信息過(guò)濾的分類(lèi)打下基礎(chǔ)
上傳時(shí)間: 2013-12-26
上傳用戶(hù):zhaoq123
資源簡(jiǎn)介:基于詞典和最大匹配算法的的中文分詞組件,達(dá)到很好的分詞準(zhǔn)確率
上傳時(shí)間: 2015-11-03
上傳用戶(hù):yuzsu
資源簡(jiǎn)介:Hieu Xuan Phan & Minh Le Nguyen 利用CRF統(tǒng)計(jì)模型寫(xiě)的可用于英文命名實(shí)體識(shí)別、英文分詞的工具(開(kāi)放源碼)。CRF模型最早由Lafferty提出,全名conditional random fields,該模型后來(lái)被廣泛地應(yīng)用在語(yǔ)言和圖像處理領(lǐng)域,并隨之出現(xiàn)了很多的變體。FlexCRF就是...
上傳時(shí)間: 2014-01-07
上傳用戶(hù):ggwz258
資源簡(jiǎn)介:中文信息處理方面的一個(gè)源碼。此為一個(gè)詞性標(biāo)注軟件,需要有事先做好的詞典的支持。功能強(qiáng)大,代碼簡(jiǎn)潔易懂。
上傳時(shí)間: 2014-01-10
上傳用戶(hù):koulian
資源簡(jiǎn)介:講述面向信息檢索的中文分詞程序的PDF文檔,
上傳時(shí)間: 2016-01-13
上傳用戶(hù):kikye
資源簡(jiǎn)介:通過(guò)隱馬爾可夫模型做詞性標(biāo)注,即給定一個(gè)句子,得到它的最優(yōu)詞性序列
上傳時(shí)間: 2016-01-25
上傳用戶(hù):671145514