亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

? 歡迎來到蟲蟲下載站! | ?? 資源下載 ?? 資源專輯 ?? 關于我們
? 蟲蟲下載站

?? luceneindexlocaldisk.java

?? Lucene+nuctch一書的全部源碼 測試源碼 和幾個簡單的項目
?? JAVA
?? 第 1 頁 / 共 2 頁
字號:
package Chapter12;

import java.io.IOException;
import java.io.File;
import java.io.FileReader;

import org.apache.lucene.store.Directory; 
import org.apache.lucene.store.RAMDirectory;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.analysis.*;
import org.apache.lucene.analysis.standard.*;
import java.io.*;

import org.pdfbox.pdmodel.PDDocument;
import org.pdfbox.pdfparser.PDFParser;
import org.pdfbox.util.PDFTextStripper;
import org.pdfbox.searchengine.lucene.LucenePDFDocument;

import org.apache.poi.hwpf.extractor.*;
import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.model.*;
import org.apache.poi.hwpf.usermodel.*;
import org.htmlparser.Node;
import org.htmlparser.NodeFilter;
import org.htmlparser.Parser;
import org.htmlparser.filters.NodeClassFilter;
import org.htmlparser.filters.TagNameFilter;
import org.htmlparser.nodes.TextNode;
import org.htmlparser.util.NodeList;
import org.htmlparser.util.ParserException;
import org.htmlparser.visitors.TextExtractingVisitor;

/*******************************************************************
 * 本代碼完成本地指定目錄的遍歷和文件查找。對指定后綴的文件進行分析,利用Lucene建立
 * 索引,為后續檢索使用做好準備。
 *******************************************************************/
public class LuceneIndexLocalDisk {

	private static String Dest_Index_Path = "D:\\workshop\\alldata3";
	//private static String Text_File_Path  = "D:\\workshop\\ch12\\012\\";
	private static String Text_File_Path  = "D:\\科技部項目\\參考文獻資料\\";
	//private static String Text_File_Path  = "C:\\test\\";
	
	/*========================================================
	 * 主函數,指定索引目錄和待分析的目錄,生成Lucene索引
	 *========================================================*/
	public static void main(String[] args) {
		
		File indexpath = new File(Dest_Index_Path);
		File localPath = new File(Text_File_Path);
		
		try {
			int nums = indexBuilder(indexpath,localPath);
			System.out.println("Index Finished " + nums + "  docs");			
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
	/*========================================================
	 * 索引創建函數,生成IndexWriter創建索引,調用子目錄索引函數,并優化
	 * 存儲本地磁盤索引
	 *========================================================*/
	public static int indexBuilder( File indexPath , File localPath ) 
	throws IOException{
		if(!localPath.exists() || !localPath.isDirectory() || !localPath.canRead()){
			throw new IOException(localPath + "不存在或者不允許訪問" );
		}
		System.out.println("目標路徑完好");		
		IndexWriter FSWriter = new IndexWriter(indexPath,new StandardAnalyzer(),true);
		FSWriter.setUseCompoundFile(true);

		SubindexBuilder(FSWriter,localPath);
		int num =  FSWriter.docCount();
		FSWriter.optimize();
		FSWriter.close();
		return num;
	}
	
	/*========================================================
	 * 判斷當前文件名是否符合文件后綴要求
	 *========================================================*/
	private static boolean IsValidType(String name){
			if(    name.endsWith(".txt") || name.endsWith(".html")
				|| name.endsWith(".ini") ||name.endsWith(".conf")
				|| name.endsWith(".pdf") ||name.endsWith(".doc"))
			{
				return true;
			} else {
				return false;
			}
	}
	/*========================================================
	 * 處理各種不同類型文檔,調用相應的參數,合并到本地磁盤索引當中
	 *========================================================*/
	private static void  fileindexBuilder(IndexWriter fswriter,File subfile)  
	throws IOException{
	
		if( subfile.isHidden() || !subfile.exists() || !subfile.canRead()){
			return ;
		}
        String strname = subfile.getName();
        int dotpos = strname.indexOf(".");
         if( (dotpos >0) && (dotpos < strname.length()))
         {
            String ext = strname.substring(dotpos + 1,strname.length());
            if( ext.equalsIgnoreCase("pdf") )
                 Handlepdf(fswriter ,subfile);
            else if( ext.equalsIgnoreCase("doc") )
                 Handledoc(fswriter ,subfile);
            else if( ext.equalsIgnoreCase("xml") )
                 Handlexml(fswriter ,subfile);
            else if( ext.equalsIgnoreCase("html") || ext.equalsIgnoreCase("htm") )
                Handlehtml(fswriter ,subfile);
            else if( IsValidType(strname))
            	Handletxt(fswriter ,subfile);;
         }
	}
	/*========================================================
	 * 創建RAM內存索引,生成并添純文本文檔,合并到本地磁盤索引當中
	 *========================================================*/	
	private static void  Handletxt (IndexWriter fswriter,File subPath)
	{

		// 處理分析PDF文檔,并索引文檔內容
		try {
			Directory ramdirectory = new RAMDirectory();
			Analyzer TextAnalyzer = new StandardAnalyzer();             // 生成分析器
			IndexWriter RAMWriter = new IndexWriter(ramdirectory ,TextAnalyzer ,true); // 生成索引器
			
			RAMWriter.setUseCompoundFile(true);                        // 根據指定文件創建輸入流

			FileInputStream instream = new FileInputStream(subPath); 
		
			// 由PDF文件生成文檔對象,包含contents字段
			Document document = FileDocument.Document(subPath) ; 

			Field field_name = new Field("filename", subPath.getName(),   
					Field.Store.YES,Field.Index.UN_TOKENIZED);         // 追加名字字段
			document.add(field_name);

			Field field_path = new Field("filepath", subPath.getAbsolutePath(), 
					Field.Store.YES,Field.Index.UN_TOKENIZED);         // 追加路徑字段
			document.add(field_path);
			
			Field field_type = new Field("filetype","txt",   
					Field.Store.YES,Field.Index.UN_TOKENIZED);         // 追加類型字段
			document.add(field_type);
			
			RAMWriter.addDocument(document);                          // 添加文檔到索引
			RAMWriter.optimize();
			RAMWriter.close();                                        // 索引完畢
			fswriter.addIndexes(new Directory[]{ramdirectory});
			
		  }catch (IOException e) {
			e.printStackTrace();
		}
		System.out.println("----------創建索引:Txt 文件成功. ----------");
}			
	
	/*========================================================
	 * 創建RAM內存索引,生成并添新文檔,合并到本地磁盤索引當中
	 *========================================================*/
	private static void  Handlepdf (IndexWriter fswriter,File subPath)
	{
			// 處理分析PDF文檔,并索引文檔內容
			try {
				Directory ramdirectory = new RAMDirectory();
				Analyzer TextAnalyzer = new StandardAnalyzer();            // 生成分析器
				IndexWriter RAMWriter = new IndexWriter(ramdirectory ,TextAnalyzer ,true); // 生成索引器
				
				RAMWriter.setUseCompoundFile(true);                        // 根據指定文件創建輸入流

				FileInputStream instream = new FileInputStream(subPath); 
			
				System.out.println("" + subPath );
				
				int len = (int) subPath.length() + 1;
				byte[] buffer = new byte[ len ] ;
				instream.read(buffer);
				
				
				// 由PDF文件生成文檔對象,包含contents字段
				//Document document = LucenePDFDocument.getDocument( instream ) ;
				Document document = new Document();
				Field field_name = new Field("filename", subPath.getName(),   
						Field.Store.YES,Field.Index.UN_TOKENIZED);         // 追加名字字段
				document.add(field_name);
				
				Field field_path = new Field("filepath", subPath.getAbsolutePath(), 
						Field.Store.YES,Field.Index.UN_TOKENIZED);         // 追加路徑字段

?? 快捷鍵說明

復制代碼 Ctrl + C
搜索代碼 Ctrl + F
全屏模式 F11
切換主題 Ctrl + Shift + D
顯示快捷鍵 ?
增大字號 Ctrl + =
減小字號 Ctrl + -
亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频
91国产免费看| 91精品国产综合久久蜜臀| 丝袜美腿亚洲一区二区图片| 国产欧美精品一区二区色综合| 色欧美片视频在线观看在线视频| 黄色精品一二区| 亚洲午夜久久久久久久久电影网 | 91麻豆精品久久久久蜜臀| 国产成人在线免费观看| 麻豆精品久久精品色综合| 亚洲精品美国一| 久久午夜羞羞影院免费观看| 91精品国产色综合久久不卡蜜臀| 色综合中文综合网| 欧美日韩一二三| 成人国产精品视频| 国产大陆亚洲精品国产| 久久精品999| 日韩国产欧美在线播放| 一区二区欧美精品| 亚洲免费视频成人| 亚洲日本丝袜连裤袜办公室| 久久久精品日韩欧美| 精品国产乱码久久久久久蜜臀| 欧美精品一卡两卡| 欧美性xxxxxxxx| 欧美在线视频你懂得| 色哟哟精品一区| 日本精品裸体写真集在线观看| 成人av网站免费观看| 国产经典欧美精品| 国产99久久久国产精品潘金| 国产成人三级在线观看| 国产久卡久卡久卡久卡视频精品| 免费观看一级欧美片| 日本不卡不码高清免费观看 | 91碰在线视频| 成人激情免费网站| 91小宝寻花一区二区三区| 97国产一区二区| av激情综合网| 色94色欧美sute亚洲线路二| 欧美性猛交xxxx黑人交| 欧美日韩国产小视频| 欧美一级夜夜爽| xnxx国产精品| 国产精品毛片无遮挡高清| 国产精品美女久久久久高潮| 亚洲视频资源在线| 亚洲综合男人的天堂| 午夜精品久久久| 久久99九九99精品| 国产精品一区二区果冻传媒| 高清成人免费视频| 色婷婷久久综合| 欧美日韩久久久久久| 日韩精品一区二区三区在线| 久久久久免费观看| 亚洲丝袜自拍清纯另类| 亚洲电影一区二区| 奇米一区二区三区| 国产激情91久久精品导航| 丰满白嫩尤物一区二区| 91浏览器入口在线观看| 欧美色大人视频| 精品国产乱子伦一区| 中文字幕 久热精品 视频在线| 亚洲男人的天堂在线aⅴ视频| 丝袜亚洲另类欧美| 成人在线视频一区| 欧美亚洲尤物久久| 久久久国产综合精品女国产盗摄| 亚洲视频中文字幕| 日韩不卡在线观看日韩不卡视频| 国产精品自产自拍| 欧美性受xxxx| 精品国产1区二区| 亚洲欧美成人一区二区三区| 日本欧美韩国一区三区| av电影天堂一区二区在线观看| 欧美久久久久久久久| 中文乱码免费一区二区| 亚洲www啪成人一区二区麻豆| 国内外精品视频| 欧美专区日韩专区| 久久久久久99久久久精品网站| 北岛玲一区二区三区四区| 久久色在线视频| 麻豆精品一区二区三区| 图片区日韩欧美亚洲| 国产精品一线二线三线| 欧美性三三影院| 中文无字幕一区二区三区| 97久久超碰国产精品| 69久久夜色精品国产69蝌蚪网| 中国色在线观看另类| 日韩电影在线免费| 91丨九色porny丨蝌蚪| 精品福利一二区| 亚洲成人免费电影| 成人免费高清在线| 精品国产一区a| 亚洲a一区二区| 91国偷自产一区二区三区成为亚洲经典 | 国产精品福利电影一区二区三区四区| 日韩福利视频导航| 欧美中文字幕一区| 亚洲免费电影在线| av不卡免费电影| 国产欧美日韩三区| 国产精品一区专区| 亚洲精品一区二区三区在线观看 | 亚洲精品成a人| 成人在线视频一区| 国产午夜精品一区二区| 精品一区二区三区的国产在线播放| 欧美午夜精品电影| 亚洲人成小说网站色在线| 国产成人av网站| 精品福利二区三区| 老司机午夜精品| 日韩一级二级三级| 免费成人结看片| 欧美日韩国产小视频| 亚洲国产精品一区二区www在线| 91一区二区三区在线观看| 亚洲一区电影777| 久久久777精品电影网影网 | 欧美二区三区91| 亚洲综合男人的天堂| 国产精品天干天干在线综合| 国产在线精品一区二区不卡了 | 亚洲午夜免费视频| 欧美在线|欧美| 亚洲一区在线观看网站| 色一情一乱一乱一91av| 亚洲美女一区二区三区| 色综合色狠狠天天综合色| 亚洲激情五月婷婷| 欧美色图12p| 日本强好片久久久久久aaa| 91精品欧美久久久久久动漫| 日本美女一区二区三区| 欧美电影免费观看完整版| 精品一区二区三区不卡| 国产偷国产偷亚洲高清人白洁 | 国产乱人伦偷精品视频不卡 | 国产91精品久久久久久久网曝门| 国产亚洲欧美激情| 成人亚洲一区二区一| 亚洲色图制服诱惑 | 床上的激情91.| 欧美国产一区二区在线观看| 不卡一区中文字幕| 一区二区三区高清不卡| 91麻豆精品国产91| 精品在线免费视频| 中文字幕不卡在线观看| 91久久久免费一区二区| 日韩国产精品久久久久久亚洲| 日韩一区二区三免费高清| 国产真实乱偷精品视频免| 中文字幕欧美国产| 欧美视频在线观看一区| 久久99精品网久久| 亚洲色图制服丝袜| 欧美一区二区视频网站| 国产精品伊人色| 樱桃视频在线观看一区| 91精品一区二区三区久久久久久| 国产精品一区二区你懂的| 亚洲精品国产第一综合99久久| 91精品一区二区三区久久久久久| 国产aⅴ精品一区二区三区色成熟| 亚洲精品国产第一综合99久久| 日韩精品在线一区| 91丝袜美腿高跟国产极品老师 | 国产午夜精品在线观看| 91久久精品网| 国产专区欧美精品| 亚洲一区二区三区在线看| 精品久久人人做人人爽| 色综合久久99| 国产精品18久久久久久久久 | 9191久久久久久久久久久| 国产在线观看一区二区| 一区二区三区不卡视频| 国产婷婷色一区二区三区四区| 精品视频一区 二区 三区| 欧美精品一区二区三区一线天视频| 成人av午夜影院| 日韩二区三区在线观看| 日韩伦理电影网| 久久亚洲精品小早川怜子| 欧美视频在线观看一区二区| 成av人片一区二区| 国产精品一线二线三线精华| 日本午夜一本久久久综合| 一区二区三区精品视频| 国产精品国产精品国产专区不蜜|