亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

? 歡迎來(lái)到蟲蟲下載站! | ?? 資源下載 ?? 資源專輯 ?? 關(guān)于我們
? 蟲蟲下載站

?? dangdangparser.java

?? 本系統(tǒng)實(shí)現(xiàn)了從五個(gè)網(wǎng)站上搜索的圖書進(jìn)行整合后
?? JAVA
?? 第 1 頁(yè) / 共 2 頁(yè)
字號(hào):
package com.booksearch.service.htmlparser;
/************************************************************
FileName: Dangdangparser.java
Author: fengguang 
Date:11/09/08
Description: 根據(jù)檢索關(guān)鍵字到www.dangdang.com抽取匹配內(nèi)容
Class List: Dangdangparser
***********************************************************/
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.SocketTimeoutException;
import java.net.URL;
import java.net.URLConnection;
import java.util.ArrayList;
import java.util.Iterator;

import org.apache.log4j.Logger;
import org.cyberneko.html.parsers.DOMParser;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;
import org.xml.sax.SAXNotRecognizedException;
import org.xml.sax.SAXNotSupportedException;

import com.booksearch.orm.Book;
import com.booksearch.orm.Price;
/**
 * Class:Dangdangparser
 * Description: 根據(jù)檢索關(guān)鍵字到www.dangdang.com抽取匹配內(nèi)容
 * extens:no
 * implements:HtmlParser<Element>
 * @author  feng guang
 * @since   11/09/08
 */
public class Dangdangparser implements HtmlParser<Element>{

	/*存放本網(wǎng)站某一頁(yè)的記錄*/
	private ArrayList<Book> list;
	/*記錄日志*/
	private static final Logger logger;
	
	static 
    {
        logger = Logger.getLogger(com.booksearch.service.htmlparser.Dangdangparser.class);
    }
	/**
	* Function:  nekohtmlParser
	* Description:  用nekohtml解析器解析指定網(wǎng)頁(yè),并轉(zhuǎn)化為dom對(duì)象
	* Calls:  no
	* Called By:  no
	* @param no
	* @return Document
	* @throws IOException,SAXException
	*/
	
	public Document nekohtmlParser(String url)throws Exception{
		/*生成html 解析器*/
		DOMParser parser = new DOMParser();
		/* 設(shè)置網(wǎng)頁(yè)的默認(rèn)編碼*/
		parser.setProperty("http://cyberneko.org/html/properties/default-encoding","gb2312");

		URL u = new URL(url);
		/*建立與源網(wǎng)站的連接*/
		URLConnection urlconn = u.openConnection();		
		//urlconn.connect();
		urlconn.setReadTimeout(30000);
		//urlconn.setConnectTimeout(30000);
		/*獲得源網(wǎng)站的字節(jié)流,并轉(zhuǎn)化為字符流,設(shè)置編碼為utf-8*/
		BufferedReader in = new BufferedReader(new InputStreamReader(urlconn.getInputStream(),"gb2312"));
	    /*進(jìn)行解析,轉(zhuǎn)化為xml*/
		parser.parse(new InputSource(in));
        /*轉(zhuǎn)化為dom對(duì)象*/
		Document doc = parser.getDocument();
		
		return doc;
	}
	/**
	* Function:  mainService
	* Description:  Dom對(duì)轉(zhuǎn)化過(guò)來(lái)的xml進(jìn)行解析,取得圖書的各個(gè)信息
	* Calls:  getBookImage(),getBookName(),getBookName(),getBookAuthor(),
	*         getBookPublisher(),getBookPublishTime(),getBookPrice()
	* Called By:  no
	* @param doc as Document
	* @return ArrayList<Book>
	* @throws no
	*/
	public ArrayList<Book> mainService(Document doc,boolean flag){
		
		list = new ArrayList<Book>();

		/*取得所有<div>結(jié)點(diǎn)*/
		NodeList servers = doc.getElementsByTagName("div");
		for (int i = 0; i < servers.getLength(); i++) {

			Element serveritem = (Element) servers.item(i);
            /*過(guò)濾出<div class="list_r_list">結(jié)點(diǎn),也就是存放記錄的結(jié)點(diǎn)*/
			if (!"list_r_list".equals(serveritem.getAttribute("class"))) {
				continue;
			} else {

				NodeList childList = serveritem.getChildNodes();
				/*循環(huán)遍歷<div class="list_r_list">的子結(jié)點(diǎn)*/
				/*接受抽取出來(lái)的信息*/
				Book book = new Book();		
				Price price = new Price();
//				if(flag){
//					try {
//						Thread.currentThread().sleep(1000);
//					} catch (InterruptedException e1) {
//						e1.printStackTrace();
//					}
//				}
				for (int j = 0; j < childList.getLength(); j++) {

					Node childNode = childList.item(j);
                    /*如果是元素結(jié)點(diǎn)(<span>,<h2>,<h4>,<h5>,<h6>),則進(jìn)行分類處理,取出其中的文本值*/
					if (childNode.getNodeType() == Node.ELEMENT_NODE) {

						Element childElement = (Element) childNode;
                         /*取出圖片地址*/
						if ("list_r_list_book".equals(childElement.getAttribute("class"))) {
							
							String bookImage = this.getBookImage(childElement);					
							book.setBookImage(bookImage);
					    /*取出圖書名稱*/    
						} else if ("H2".equals(childElement.getTagName())) {
							
							String bookName = this.getBookName(childElement);
							String bookUrl = this.getBookUrl(childElement);
							//System.out.println(bookUrl);
							if(flag){
								try {
									Thread.currentThread().sleep(2000);
									DangdangparserSec dangdangSec = new DangdangparserSec();
									String bookISBN = dangdangSec.getBookISBNSec(bookUrl);
									//System.out.println(bookISBN);
									book.setBookISBN(bookISBN);
								}catch (Exception e) {
									logger.error("==========當(dāng)當(dāng)網(wǎng)二次請(qǐng)求解析" + bookUrl + "時(shí)出錯(cuò)" + "==========" +e);
	                                //book.setBookISBN("");
	                               //e.printStackTrace();
								}
						    }
							book.setBookName(bookName);
							//System.out.println(bookName);
							price.setDangdangUrl(bookUrl);
			
						/*取出作者名*/	
						} else if ("list_r_list_h4".equals(childElement.getAttribute("class"))) {
							
							String bookAuthor = this.getBookAuthor(childElement);
							book.setBookAuthor(bookAuthor);
						/*取出出版社名稱*/
						} else if (("H4".equals(childElement.getTagName()))
								&& (-1 != (childElement.getFirstChild().getNodeValue().indexOf("出版社")))) {
							
							String bookPublisher = this.getBookPublisher(childElement);
							book.setBookPublisher(bookPublisher);
						/*取出詳細(xì)內(nèi)容*/
						}else if("H5".equals(childElement.getTagName())){
							String bookContent = this.getBookContent(childElement);
							book.setBookProspectus(bookContent);
							//System.out.println(">>>>>>"+bookContent);
						
					    /*取出出版時(shí)間*/
						} else if (("H4".equals(childElement.getTagName()))
								&& (-1 != (childElement.getFirstChild().getNodeValue().indexOf("出版時(shí)間")))) {
							String bookPublishTime = this.getBookPublishTime(childElement);
							if(!"".equals(bookPublishTime)&&null!=bookPublishTime)
							    book.setBookPublishTime(bookPublishTime);
						/*取出圖書價(jià)格*/
						} else if ("H6".equals(childElement.getTagName())) {
							String bookFixPrice = this.getBookFixPrice(childElement);
							if(null !=bookFixPrice&&!"".equals(bookFixPrice))
							    book.setBookFixPrice(Double.valueOf(bookFixPrice.trim()));
							String bookPrice = this.getBookPrice(childElement);
							//book.setBookPrice(bookPrice);
							if(null != bookPrice&&!"".equals(bookPrice))
							    price.setDangdangPrice(Double.valueOf(bookPrice));
							String bookDiscount = this.getBookDiscount(childElement);	
                            //book.setBookDiscount(bookDiscount);
						    if(null != bookDiscount&&!"".equals(bookDiscount))
							    price.setDangdangDiscount(Float.valueOf(bookDiscount));
						}
					}
				}
				/*放到存放結(jié)果鏈中*/
				if(book.getBookName() != null){
					book.setPrice(price);
					list.add(book);
				}
			}
		}
		return list;

	}
	/**
	* Function:  getBookImage
	* Description:  獲得圖書封面圖片地址
	* Calls: no
	* Called By:  mainService
	* @param bookElement as Element
	* @return String
	* @throws no
	*/
	public  String  getBookImage(Element bookElement){
		
		Element imageElement = (Element)bookElement.getFirstChild();		
		Element srcElement = (Element)imageElement.getFirstChild();
		
		return srcElement.getAttribute("src");
	}
	/**
	* Function:  getBookName
	* Description:  獲得圖書名稱
	* Calls: no
	* Called By:  mainService
	* @param bookElement as Element
	* @return String
	* @throws no
	*/
	public  String getBookName(Element bookElement){
		
        String bookName = "";
        /*取出<a>結(jié)點(diǎn)*/
		Element Firstelement = (Element)bookElement.getFirstChild(); 
		NodeList nameList = Firstelement.getChildNodes();
		/*循環(huán)遍歷<a>的子結(jié)點(diǎn),并取出其中的文本值*/
		for(int i = 0;i<nameList.getLength();i++){
			
			Node nameNode = nameList.item(i);
			/*分元素結(jié)點(diǎn)和#text結(jié)點(diǎn)兩種不同情況進(jìn)行處理*/
			if(nameNode.getNodeType() == Node.ELEMENT_NODE){
				Element nameElement = (Element)nameNode;
				/*元素結(jié)點(diǎn)取得其中的文本值*/
				if(nameElement.hasChildNodes())
				    bookName += nameElement.getFirstChild().getNodeValue();
			}else{
				/*#text結(jié)點(diǎn)取得其中的文本值*/
				bookName += nameNode.getNodeValue();
			}
		}
		bookName = bookName.replaceAll(" ", "");
		bookName = bookName.trim();
		if(bookName.length()>64){
			bookName = bookName.substring(0, 64);
		}		
		//System.out.println(bookName);
		return bookName;
	}
	/**
	* Function:  getBookAuthor
	* Description:  獲得圖書作者
	* Calls: no
	* Called By:  mainService
	* @param bookElement as Element
	* @return String
	* @throws no
	*/
	public  String getBookAuthor(Element bookElement){
		
		String bookAuthor = "";
	    NodeList authorList = bookElement.getChildNodes();
        for(int i = 0;i<authorList.getLength();i++){
			
			Node nameNode = authorList.item(i);
			
			if(nameNode.getNodeType() == Node.ELEMENT_NODE&&"A".equals(nameNode.getNodeName())){
				Element nameElement = (Element)nameNode;
				NodeList nameList = nameElement.getChildNodes();
				for(int j = 0;j<nameList.getLength();j++){
					Node temNode = nameList.item(j);
					if(temNode.getNodeType() == Node.ELEMENT_NODE){
						Element temElement = (Element)temNode;
						if(temElement.hasChildNodes())
						    bookAuthor += temElement.getFirstChild().getNodeValue() + " ";
					}else
					   bookAuthor += temNode.getNodeValue() + " ";
				    }
				}
		}
        if(bookAuthor.length()>1)
        	bookAuthor = bookAuthor.substring(0, bookAuthor.length() - 1);

	    if(bookAuthor.length()>64){
	    	bookAuthor = bookAuthor.substring(0, 64);
	    }
        bookAuthor = bookAuthor.replace(",", " ");
        bookAuthor = bookAuthor.replace(",", " ");
        bookAuthor = bookAuthor.replace("等", "");
        bookAuthor = bookAuthor.replace("著", "");
        bookAuthor = bookAuthor.replace("編", "");
		return bookAuthor;//.substring(bookAuthor.indexOf("作 者:"+4));
	}
	/**
	* Function:  getBookPublisher
	* Description:  獲得圖書出版社
	* Calls: no
	* Called By:  mainService
	* @param bookElement as Element
	* @return String
	* @throws no
	*/
	public  String getBookPublisher(Element bookElement){
		
		String bookPublisher = "";
		NodeList publisherNode = bookElement.getChildNodes();
        for(int i = 0;i<publisherNode.getLength();i++){
			
			Node publisherNameNode = publisherNode.item(i);	
			if(publisherNameNode.getNodeType() == Node.ELEMENT_NODE&&"A".equals(publisherNameNode.getNodeName())){
				Element elementPublisher = (Element)publisherNameNode;
				if(elementPublisher.hasChildNodes()){
					if(elementPublisher.getChildNodes().getLength()>1){
						NodeList temNodeList = elementPublisher.getChildNodes();
						for(int j = 0;j<temNodeList.getLength();j++){
							Node temNode = temNodeList.item(j);
							if(temNode.getNodeType()==Node.ELEMENT_NODE){
								Element temElement = (Element)temNode;
								if(temElement.hasChildNodes())
								    bookPublisher += temElement.getFirstChild().getNodeValue();
							}else{
								bookPublisher += temNode.getNodeValue();
							}
						}
					}else{
						
						if("FONT".equals(elementPublisher.getFirstChild().getNodeName())){
							Node temNode = elementPublisher.getFirstChild();
							if(temNode.getNodeType() == Node.ELEMENT_NODE){
								Element temElement = (Element)temNode;
							    if(temElement.hasChildNodes())
							        bookPublisher = temElement.getFirstChild().getNodeValue();
							}
						}else 
							bookPublisher = elementPublisher.getLastChild().getNodeValue();
					}
				} 
			}
		}
		
		//System.out.println("bookPublisher:"+bookPublisher);
//        bookPublisher = bookPublisher.trim();
//        if(bookPublisher.length()>64){
//        	bookPublisher = bookPublisher.substring(0, 64);
//        }
		return bookPublisher.trim();
	}
	/**
	* Function:  getBookPublishTime

?? 快捷鍵說(shuō)明

復(fù)制代碼 Ctrl + C
搜索代碼 Ctrl + F
全屏模式 F11
切換主題 Ctrl + Shift + D
顯示快捷鍵 ?
增大字號(hào) Ctrl + =
減小字號(hào) Ctrl + -
亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频
色综合网色综合| 成人影视亚洲图片在线| 精品国精品国产| 国产欧美一区视频| 亚洲精品第1页| 蜜臀av在线播放一区二区三区| 国内精品免费在线观看| 91日韩在线专区| 91精品国产一区二区人妖| 久久婷婷国产综合国色天香| 亚洲女与黑人做爰| 精品制服美女丁香| 日本韩国欧美一区| 欧美精品一区二区久久婷婷| 综合中文字幕亚洲| 麻豆视频一区二区| 在线观看一区日韩| 久久久久久久久久久久电影| 一区二区理论电影在线观看| 激情文学综合丁香| 欧美日韩在线一区二区| 国产日韩高清在线| 日韩福利视频网| 97精品久久久午夜一区二区三区| 日韩一区二区在线观看| 中文字幕亚洲一区二区av在线 | 福利视频网站一区二区三区| 日本高清不卡在线观看| 久久伊人蜜桃av一区二区| 亚洲综合一区在线| 成人一区二区三区视频| 欧美一区二区三区婷婷月色| 亚洲天堂久久久久久久| 精品写真视频在线观看| 欧美日韩电影在线播放| 1000部国产精品成人观看| 久久99蜜桃精品| 欧美三级电影一区| 亚洲欧洲日韩综合一区二区| 国产一区视频网站| 日韩一区二区三区免费观看| 亚洲电影欧美电影有声小说| 99re视频这里只有精品| 久久综合久久综合久久| 美女网站视频久久| 欧美日本国产视频| 一区二区欧美精品| 99国产精品99久久久久久| 国产亚洲自拍一区| 国产一区二区三区精品视频| 欧美一区二区人人喊爽| 亚洲成人av福利| 91成人在线免费观看| 中文字幕在线不卡| 成人免费看视频| 国产日本欧美一区二区| 国产一区中文字幕| 欧美国产成人精品| 国产精品亚洲午夜一区二区三区| 在线观看亚洲a| 亚洲欧美日韩电影| 99国产精品国产精品久久| 国产农村妇女毛片精品久久麻豆| 国内国产精品久久| 欧美mv和日韩mv的网站| 日本视频一区二区| 91麻豆精品国产91| 丝袜亚洲另类丝袜在线| 91精品国产综合久久久久久漫画| 图片区小说区区亚洲影院| 欧美日韩国产小视频在线观看| 亚洲一区二区在线视频| 欧美日韩一区二区不卡| 偷拍日韩校园综合在线| 欧美高清视频不卡网| 日韩精品五月天| 欧美一级xxx| 国产专区综合网| 亚洲国产成人一区二区三区| av男人天堂一区| 亚洲精品国产一区二区三区四区在线| 色婷婷综合久久久久中文一区二区 | 亚洲最大色网站| 欧美日免费三级在线| 午夜亚洲福利老司机| 欧美色男人天堂| 美女任你摸久久| 久久久午夜精品理论片中文字幕| 国产精品91xxx| 国产精品国产成人国产三级 | 亚洲少妇30p| 欧美体内she精高潮| 奇米影视在线99精品| 久久天堂av综合合色蜜桃网| 成人激情图片网| 亚洲精品成人少妇| 91精品午夜视频| 国产制服丝袜一区| 国产精品福利影院| 色av成人天堂桃色av| 日韩二区三区在线观看| 国产喷白浆一区二区三区| 91色在线porny| 天天免费综合色| 久久精品人人做| 在线观看国产日韩| 久久av中文字幕片| 国产精品欧美一级免费| 欧美在线观看一二区| 九九热在线视频观看这里只有精品| 国产欧美精品日韩区二区麻豆天美 | 欧美精品一区二区三| 色婷婷久久久久swag精品| 日韩电影在线免费观看| 日本一区免费视频| 欧美日韩另类一区| 国产成人啪午夜精品网站男同| 一区二区三区在线视频播放| 欧美一区中文字幕| 成人免费视频app| 日本欧美久久久久免费播放网| 中文字幕久久午夜不卡| 欧美日韩视频在线观看一区二区三区| 久久99九九99精品| 亚洲美女免费在线| 久久久久国产精品厨房| 欧美剧情电影在线观看完整版免费励志电影 | 色婷婷国产精品久久包臀| 另类人妖一区二区av| 亚洲女同ⅹxx女同tv| 精品国产网站在线观看| 91福利精品视频| 国产v综合v亚洲欧| 日韩一区精品字幕| 一区二区视频在线看| 亚洲天堂中文字幕| 色嗨嗨av一区二区三区| 国内精品免费**视频| 亚洲aⅴ怡春院| 国产精品国产三级国产aⅴ中文| 日韩午夜av一区| 欧美日韩大陆一区二区| 99久精品国产| 国产精品1区二区.| 麻豆精品一区二区综合av| 亚洲国产精品一区二区久久| 欧美韩国日本一区| 久久综合给合久久狠狠狠97色69| 欧美日韩精品一区二区天天拍小说 | 欧美日韩高清在线| 一本色道久久加勒比精品| 成人免费高清在线| 国产乱码精品一区二区三区忘忧草| 丝袜美腿亚洲综合| 亚洲国产日产av| 一区二区三区不卡在线观看 | 日本国产一区二区| 99re亚洲国产精品| 丁香激情综合五月| 久久er99热精品一区二区| 青青青伊人色综合久久| 无码av中文一区二区三区桃花岛| 一区二区三区久久| 一区二区三区四区精品在线视频| 中文字幕成人av| 国产视频一区在线观看| 精品久久久久久久人人人人传媒 | 精品在线播放午夜| 免费xxxx性欧美18vr| 日韩精品成人一区二区在线| 亚洲综合色丁香婷婷六月图片| 亚洲视频在线观看三级| 中文字幕一区二区三| 亚洲视频综合在线| 亚洲人成电影网站色mp4| 中文字幕在线不卡| 亚洲欧美一区二区三区久本道91 | 欧美亚一区二区| 91福利在线看| 欧美男人的天堂一二区| 欧美日韩小视频| 91精品久久久久久蜜臀| 日韩一区二区精品在线观看| 日韩欧美一级二级| 久久午夜色播影院免费高清| 久久综合色8888| 国产精品网友自拍| 综合欧美一区二区三区| 亚洲天堂2016| 亚洲成av人综合在线观看| 天天综合天天综合色| 裸体在线国模精品偷拍| 国产精品一区二区三区乱码| 国产成人高清视频| 91美女片黄在线| 欧美日韩黄色一区二区| 日韩女优制服丝袜电影| 国产清纯白嫩初高生在线观看91| ...中文天堂在线一区| 有码一区二区三区|