將詞庫詞與詞表詞進行統(tǒng)計,得到兩者相同的部分,再找到完全不同的部分
資源簡介:將詞庫詞與詞表詞進行統(tǒng)計,得到兩者相同的部分,再找到完全不同的部分
上傳時間: 2015-12-26
上傳用戶:561596
資源簡介:基于詞庫的中文分詞組件,可以直接用于Lucene的索引建立。以及中文搜索。
上傳時間: 2016-08-22
上傳用戶:llandlu
資源簡介:是用來將掌上電腦與PC之間進行連接,并將掌上電腦的界面發(fā)送到PC上,可以通過PC觀看
上傳時間: 2014-11-23
上傳用戶:Miyuki
資源簡介:輸入一篇英文,程序?qū)锩婷總€單詞的頻率進行統(tǒng)計,從文件輸入,而不是從鍵盤輸入.
上傳時間: 2013-12-25
上傳用戶:3到15
資源簡介:基于正向最大匹配法的分詞。采用hash表技術(shù)將一段連續(xù)的話用所給詞庫進行分詞輸出。
上傳時間: 2016-06-08
上傳用戶:zhengjian
資源簡介:...將該字符串變量與停用詞表中的所有單詞進行比較,若果該詞在停用詞表中出現(xiàn)過則不對其進行統(tǒng)計,否則在對該詞進行詞干抽取。 經(jīng)過以上停用詞、詞干處理后得到的將是實際進行統(tǒng)計的“單詞”(此時的“單詞”實際上已經(jīng)是所有具有相同詞干的原是單詞的統(tǒng)一...
上傳時間: 2016-05-27
上傳用戶:tfyt
資源簡介:python寫的gbk分詞分句程序 可以使用sogou或者谷歌輸入法的詞庫進行分詞
上傳時間: 2014-01-13
上傳用戶:evil
資源簡介:中文分詞算法,效率很高,使用詞典樹裝搜索進行單詞切割,并提供擴充詞庫的函數(shù)!
上傳時間: 2017-03-10
上傳用戶:xauthu
資源簡介:海鷹詞庫編輯器 針對類似于海鷹詞庫的數(shù)據(jù)庫的編輯器,可對數(shù)據(jù)庫進行重復(fù)掃描、比較,從windows系統(tǒng)自帶輸入法碼表轉(zhuǎn)換數(shù)據(jù)等操作
上傳時間: 2014-01-07
上傳用戶:爺?shù)臍赓|(zhì)
資源簡介:access中文詞庫,用于中文搜索,建議與lucene聯(lián)系起來使用
上傳時間: 2013-11-28
上傳用戶:songrui
資源簡介:問題重述:有一個內(nèi)含有大約40萬條常用詞匯的詞庫。現(xiàn)給定一篇文章,使用這個詞庫分析出常用詞匯的出現(xiàn)次數(shù),并按出現(xiàn)次數(shù)由高到低排序這些詞語。 改進算法的思路: 1. 通常一篇文章所包含的詞語遠少于詞庫中40萬的數(shù)量; 2. 數(shù)據(jù)庫建立索引之后,可采用...
上傳時間: 2017-02-25
上傳用戶:busterman
資源簡介:在很大的一個詞庫中尋找所需的單詞
上傳時間: 2014-01-06
上傳用戶:love_stanford
資源簡介:IMEGEN支持90萬詞庫IMEGEN支持 90萬詞庫 IMEGEN支持90萬詞庫 IMEGEN支持90萬詞庫 IMEGEN支持90萬詞庫
上傳時間: 2013-12-17
上傳用戶:笨小孩
資源簡介:一款背單詞的小程序,可以自己在自定義詞庫中加單詞,運行環(huán)境JCreator
上傳時間: 2013-12-17
上傳用戶:lanwei
資源簡介:這是一個詞庫,包含“日漢”“漢英”。對于做自然語言理解、機器翻譯、輔助翻譯有基礎(chǔ)作用。
上傳時間: 2014-07-07
上傳用戶:三人用菜
資源簡介:DDOS源碼,若把此源碼用詞非法用途,與作者無關(guān)
上傳時間: 2013-12-11
上傳用戶:離殤
資源簡介:中文分詞算法。Perl語言編寫。wordlist.txt為詞庫。
上傳時間: 2013-12-23
上傳用戶:小碼農(nóng)lz
資源簡介:此程序解決的問題:較好的, 并適應(yīng)短字符串的中文分詞算法.根據(jù)詞庫 發(fā)現(xiàn)以換行符分隔的眾多標(biāo)題中的 top N 關(guān)鍵字并以此更新詞庫.是一個分類分詞算法
上傳時間: 2014-12-20
上傳用戶:lxm
資源簡介:對文件夾中的各文件的內(nèi)容分詞后按照詞的內(nèi)容進行統(tǒng)計和組織。
上傳時間: 2014-01-16
上傳用戶:Divine
資源簡介:自己的一個判斷詞庫的代碼.能夠很好的去除詞庫中的相同詞匯.并保證詞庫的相異性
上傳時間: 2013-12-15
上傳用戶:趙云興
資源簡介:這是一個向數(shù)據(jù)庫輸入詞庫的一個小的軟件,用了還不錯就是還得完善
上傳時間: 2014-01-25
上傳用戶:exxxds
資源簡介:字典軟件MDICT的詞庫文件,內(nèi)容是C的庫函數(shù),方便大家查詢.MDICT有PC和PPC版本,大家請自己去GOOGLE搜索
上傳時間: 2015-11-24
上傳用戶:star_in_rain
資源簡介:自己寫的一段分詞程序,有2部分 第一個是詞庫的, 第二個是概略的
上傳時間: 2015-12-13
上傳用戶:lili123
資源簡介:詞庫素材,目前已有10萬以上的詞匯量,有中英文
上傳時間: 2014-01-21
上傳用戶:yt1993410
資源簡介:Java寫的一個簡單分詞詞庫。效果還不錯。
上傳時間: 2014-01-08
上傳用戶:dyctj
資源簡介:這是一個詞庫,對于那些做中文分詞的人很有幫助的,是2000年的
上傳時間: 2016-04-27
上傳用戶:wl9454
資源簡介:CT工作站具有打印報告、病歷管理、圖像處理專家詞庫等功能
上傳時間: 2016-04-30
上傳用戶:lizhen9880
資源簡介:這是分詞系統(tǒng)的詞庫,希望能對做分詞的朋友有所幫助。
上傳時間: 2013-12-19
上傳用戶:AbuGe
資源簡介:中文信息處理的分詞詞庫,百度分詞詞庫,用于中文信息處理的詞庫分析和源程序鏈接
上傳時間: 2016-05-22
上傳用戶:標(biāo)點符號
資源簡介:珍藏論文:中文信息學(xué)報知網(wǎng)與同義詞詞林的信息融合研究
上傳時間: 2016-06-28
上傳用戶:aa54