亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

? 歡迎來到蟲蟲下載站! | ?? 資源下載 ?? 資源專輯 ?? 關于我們
? 蟲蟲下載站

?? lucene

?? 中文分詞系統
??
字號:
該組件免費安裝使用傳播,無限制商業應用,但暫不開源,也不提供任何保證 分詞效率: 第一次分詞需要1-2秒(讀取詞典),之后速度基本與Lucene自帶分詞持平 運行環境: Lucene 1.9+ 內存消耗: 30M+ 1.4.0 —— 2006-08-21 增加詞典的動態擴展能力 1.3.3 —— 2006-07-23 修正無法多次增加詞典的問題 1.3.2 —— 2006-07-03 修正細粒度分詞錯誤的問題 1.3.1 —— 2006-06-23 修正在某些情況下分詞遺漏的問題 1.3 —— 2006-06-22 實現了詞尾消歧算法中第一層的過濾 增加日期時間的匹配 1.2.2 —— 2006-06-13 完善了中英文噪聲詞典 1.2.1 —— 2006-06-10 修正中文數字成語無法識別的問題 1.2 —— 2006-06-08 增加中文數字的匹配(如:二零零六) 數量詞采用“n”作為數字通配符 優化詞典結構以便修改調整 1.1 —— 2006-06-06 增加擴展詞典的靜態讀取方法 1.0.1 —— 2006-06-02 修正無法識別生僻字的問題 1.0 —— 2006-05-29 支持英文、數字、中文(簡體)混合分詞 常用的數量和人名的匹配 超過22萬詞的詞庫整理 實現正向最大匹配算法 //采用正向最大匹配的中文分詞算法,相當于分詞粒度等于0 MMAnalyzer analyzer = new MMAnalyzer(); //參數為分詞粒度:當字數等于或超過該參數,且能成詞,該詞就被切分出來 MMAnalyzer analyzer = new MMAnalyzer(2); //增加一個新詞典,采用每行一個詞的讀取方式 MMAnalyzer.addDictionary(reader); //增加一個新詞 MMAnalyzer.addWord(newWord); package demo.analysis; import java.io.IOException; import jeasy.analysis.MMAnalyzer; public class Segment { public static void main(String[] args) { String text = "據路透社報道,印度尼西亞社會事務部一官員星期二(29日)表示," + "日惹市附近當地時間27日晨5時53分發生的里氏6.2級地震已經造成至少5427人死亡," + "20000余人受傷,近20萬人無家可歸。"; MMAnalyzer analyzer = new MMAnalyzer(); try { System.out.println(analyzer.segment(text, " | ")); } catch (IOException e) { e.printStackTrace(); } } } 生成效果: 據 | 路透社 | 報道 | 印度尼西亞 | 社會 | 事務 | 部 | 官員 | 星期二 | 29日 | 表示 | 日惹 | 市 | 附近 | 當地時間 | 27日 | 晨 | 5時 | 53分 | 發生 | 里氏 | 6.2級 | 地震 | 已經 | 造成 | 至少 | 5427人 | 死亡 | 20000 | 余人 | 受傷 | 近 | 20萬人 | 無家可歸 | package demo.analysis; import jeasy.analysis.MMAnalyzer; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.lucene.index.IndexWriter; import org.apache.lucene.queryParser.QueryParser; import org.apache.lucene.search.Hits; import org.apache.lucene.search.IndexSearcher; import org.apache.lucene.search.Query; import org.apache.lucene.store.Directory; import org.apache.lucene.store.RAMDirectory; public class Segment { public static void main(String[] args) { String fieldName = "text"; String text = "據路透社報道,印度尼西亞社會事務部一官員星期二(29日)表示," + "日惹市附近當地時間27日晨5時53分發生的里氏6.2級地震已經造成至少5427人死亡," + "20000余人受傷,近20萬人無家可歸。"; //檢索內容 //采用正向最大匹配的中文分詞算法 Analyzer analyzer = new MMAnalyzer(); Directory directory = new RAMDirectory(); //Directory directory = FSDirectory.getDirectory("/tmp/testindex", true); try { IndexWriter iwriter = new IndexWriter(directory, analyzer, true); iwriter.setMaxFieldLength(25000); Document doc = new Document(); doc.add(new Field(fieldName, text, Field.Store.YES, Field.Index.TOKENIZED)); iwriter.addDocument(doc); iwriter.close(); IndexSearcher isearcher = new IndexSearcher(directory); QueryParser parser = new QueryParser(fieldName, analyzer); Query query = parser.parse("印度尼西亞 6.2級地震");//檢索詞 Hits hits = isearcher.search(query); System.out.println("命中:" + hits.length()); for (int i = 0; i < hits.length(); i++) { Document hitDoc = hits.doc(i); System.out.println("內容:" + hitDoc.get(fieldName)); } isearcher.close(); directory.close(); } catch (Exception e) { e.printStackTrace(); } } } 生成效果: 命中:1 內容:據路透社報道,印度尼西亞社會事務部一官員星期二(29日)表示,日惹市附近當地時間27日晨5時53分發生 的里氏6.2級地震已經造成至少5427人死亡,20000余人受傷,近20萬人無家可歸。 package demo.analysis; import jeasy.analysis.MMAnalyzer; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.TokenStream; import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.lucene.index.IndexReader; import org.apache.lucene.index.IndexWriter; import org.apache.lucene.index.TermPositionVector; import org.apache.lucene.queryParser.QueryParser; import org.apache.lucene.search.Hits; import org.apache.lucene.search.IndexSearcher; import org.apache.lucene.search.Query; import org.apache.lucene.search.highlight.Highlighter; import org.apache.lucene.search.highlight.QueryScorer; import org.apache.lucene.search.highlight.TokenSources; import org.apache.lucene.store.Directory; import org.apache.lucene.store.RAMDirectory; public class Segment { public static void main(String[] args) { String fieldName = "text"; String text = "據路透社報道,印度尼西亞社會事務部一官員星期二(29日)表示," + "日惹市附近當地時間27日晨5時53分發生的里氏6.2級地震已經造成至少5427人死亡," + "20000余人受傷,近20萬人無家可歸。"; //檢索內容 //采用正向最大匹配的中文分詞算法 Analyzer analyzer = new MMAnalyzer(); Directory directory = new RAMDirectory(); //Directory directory = FSDirectory.getDirectory("/tmp/testindex", true); try { IndexWriter iwriter = new IndexWriter(directory, analyzer, true); iwriter.setMaxFieldLength(25000); Document doc = new Document(); doc.add(new Field(fieldName, text, Field.Store.YES, Field.Index.TOKENIZED, Field.TermVector.WITH_POSITIONS_OFFSETS)); iwriter.addDocument(doc); iwriter.close(); IndexSearcher isearcher = new IndexSearcher(directory); QueryParser parser = new QueryParser(fieldName, analyzer); Query query = parser.parse("印度尼西亞 6.2級地震");//檢索詞 Hits hits = isearcher.search(query); System.out.println("命中:" + hits.length()); Highlighter highlighter = new Highlighter(new QueryScorer(query)); for (int i = 0; i < hits.length(); i++) { text = hits.doc(i).get(fieldName); TermPositionVector tpv = (TermPositionVector) IndexReader.open( directory).getTermFreqVector(hits.id(i), fieldName); TokenStream tokenStream = TokenSources.getTokenStream(tpv); String result = highlighter.getBestFragments(tokenStream, text, 3, "..."); System.out.println("內容:" + result); } isearcher.close(); directory.close(); } catch (Exception e) { e.printStackTrace(); } } } 生成效果: 命中:1 內容:據路透社報道,印度尼西亞社會事務部一官員星期二(29日)表示,日惹市附近當地時間27日晨5時53分發生的 里氏6.2級地震已經造成至少5427人死亡,20000余人受傷,近20萬人無家可歸 

?? 快捷鍵說明

復制代碼 Ctrl + C
搜索代碼 Ctrl + F
全屏模式 F11
切換主題 Ctrl + Shift + D
顯示快捷鍵 ?
增大字號 Ctrl + =
減小字號 Ctrl + -
亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频
美女尤物国产一区| 日本亚洲一区二区| 久久影音资源网| 日韩区在线观看| 欧美变态口味重另类| 91精品国产免费| 欧美tickling网站挠脚心| 精品少妇一区二区三区在线播放| 91精品国产综合久久久久久久久久| 欧美日韩不卡在线| 精品久久久久99| 日韩手机在线导航| 精品99一区二区三区| 久久九九全国免费| 国产精品福利一区| 亚洲综合在线视频| 日韩av电影免费观看高清完整版在线观看 | 国产一区美女在线| 成人性生交大片免费看在线播放| 丰满少妇在线播放bd日韩电影| 99视频热这里只有精品免费| 91蜜桃免费观看视频| 9191成人精品久久| 国产欧美日韩综合| 一区二区三区四区国产精品| 日本不卡一二三区黄网| 懂色av噜噜一区二区三区av| 91麻豆文化传媒在线观看| 欧美精品自拍偷拍动漫精品| 久久精品水蜜桃av综合天堂| 1024国产精品| 久久99深爱久久99精品| 99久久久国产精品免费蜜臀| 欧美日韩国产综合一区二区 | 亚洲激情av在线| 男男成人高潮片免费网站| 国产成人啪午夜精品网站男同| 色综合天天做天天爱| 欧美大片日本大片免费观看| 国产精品国产三级国产a | 欧美一区二区国产| 国产精品免费视频观看| 日本视频免费一区| 91色porny在线视频| 精品日韩一区二区三区| 亚洲宅男天堂在线观看无病毒| 国产一区二区三区| 欧美日韩亚洲国产综合| 中文字幕精品在线不卡| 蜜乳av一区二区| 在线亚洲+欧美+日本专区| 久久久久国产成人精品亚洲午夜| 香蕉加勒比综合久久| 成人激情免费电影网址| 久久综合久久综合亚洲| 日韩激情视频网站| 91国产免费看| 亚洲免费伊人电影| eeuss国产一区二区三区| 久久九九久久九九| 精品系列免费在线观看| 91精品啪在线观看国产60岁| 亚洲在线中文字幕| 91搞黄在线观看| 日韩一区在线免费观看| 不卡av电影在线播放| 国产欧美日韩不卡免费| 国产精品一区二区在线观看不卡| 日韩三级电影网址| 久久精品国产亚洲高清剧情介绍| 欧美日韩亚洲综合在线| 亚洲综合激情网| 欧日韩精品视频| 亚洲综合色丁香婷婷六月图片| 色又黄又爽网站www久久| 日韩美女啊v在线免费观看| 成人性生交大片免费看在线播放| 欧美国产精品久久| 国产98色在线|日韩| 中国av一区二区三区| 懂色中文一区二区在线播放| 久久先锋影音av鲁色资源| 国产一区二区三区在线观看精品 | 久久亚洲二区三区| 国产精品一区二区男女羞羞无遮挡| 精品剧情v国产在线观看在线| 蜜桃久久久久久| 欧美va亚洲va在线观看蝴蝶网| 老色鬼精品视频在线观看播放| 欧美电影免费观看高清完整版| 韩国欧美国产1区| 国产精品私人自拍| 日本福利一区二区| 日韩成人免费电影| 精品处破学生在线二十三| 国产精品一线二线三线精华| 自拍视频在线观看一区二区| 欧洲生活片亚洲生活在线观看| 日韩福利视频网| 久久久噜噜噜久久中文字幕色伊伊| 北条麻妃国产九九精品视频| 亚洲最大成人综合| 久久综合九色综合久久久精品综合| 成人午夜又粗又硬又大| 亚洲精品国产第一综合99久久| 欧美军同video69gay| 韩国一区二区视频| 一区二区三区中文字幕在线观看| 宅男噜噜噜66一区二区66| 国产在线精品一区二区不卡了 | 欧美性色综合网| 久久99精品一区二区三区三区| 国产精品美女久久久久高潮| 欧美另类z0zxhd电影| 成人免费观看男女羞羞视频| 亚洲国产视频直播| 欧美国产精品v| 717成人午夜免费福利电影| 懂色av一区二区三区免费看| 日韩高清不卡在线| 亚洲狠狠丁香婷婷综合久久久| 精品理论电影在线| 欧美日本在线看| 99精品视频一区二区三区| 久久精品国产99| 亚洲大片免费看| 亚洲视频在线观看一区| 久久综合九色欧美综合狠狠| 欧美一a一片一级一片| 成人精品免费看| 老司机午夜精品| 日韩一区精品字幕| 亚洲永久免费视频| **欧美大码日韩| 日本一区二区三区高清不卡| 欧美大黄免费观看| 欧美剧情片在线观看| 在线亚洲一区二区| 成人黄色小视频| 成人在线视频一区二区| 国产中文字幕一区| 蜜桃视频在线一区| 蜜桃视频第一区免费观看| 日韩精品视频网| 天天操天天综合网| 图片区日韩欧美亚洲| 亚洲一本大道在线| 亚洲第一激情av| 亚洲超碰97人人做人人爱| 一区二区欧美精品| 亚洲欧美另类小说| 亚洲精品免费电影| 亚洲一卡二卡三卡四卡| 亚洲精品成a人| 亚洲国产cao| 日韩福利电影在线观看| 五月天国产精品| 蜜桃av一区二区三区| 久久精品99久久久| 国产麻豆精品在线观看| 国产成人无遮挡在线视频| 高清不卡一区二区| 一本色道久久综合精品竹菊| 在线亚洲精品福利网址导航| 欧美视频在线播放| 日韩欧美二区三区| 欧美国产激情二区三区| 亚洲婷婷在线视频| 三级成人在线视频| 激情欧美一区二区| 成人国产亚洲欧美成人综合网| 99久久久免费精品国产一区二区| 色综合色综合色综合色综合色综合| 91九色最新地址| 日韩一区二区在线观看视频播放| 久久久影视传媒| 国产精品高潮呻吟久久| 亚洲高清视频的网址| 久久99热这里只有精品| 成人激情免费视频| 欧美日韩精品一区二区三区四区| 日韩欧美的一区二区| 1区2区3区精品视频| 视频一区视频二区在线观看| 国产精品一区二区三区网站| 色婷婷综合久久久| 精品欧美久久久| 亚洲免费观看视频| 国内精品国产成人| 色综合视频在线观看| 精品国产91洋老外米糕| 亚洲精品一二三| 国产一区二区三区在线观看免费视频| 99久久精品情趣| 精品少妇一区二区三区日产乱码| 最新国产精品久久精品| 免费在线观看视频一区| 欧美精品乱人伦久久久久久| 久久久久国产免费免费 | 日韩一级完整毛片|