亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

? 歡迎來到蟲蟲下載站! | ?? 資源下載 ?? 資源專輯 ?? 關(guān)于我們
? 蟲蟲下載站

?? dangdangparser.java

?? 本系統(tǒng)實現(xiàn)了從五個網(wǎng)站上搜索的圖書進行整合后
?? JAVA
?? 第 1 頁 / 共 2 頁
字號:
package com.booksearch.service.htmlparser;
/************************************************************
FileName: Dangdangparser.java
Author: fengguang 
Date:11/09/08
Description: 根據(jù)檢索關(guān)鍵字到www.dangdang.com抽取匹配內(nèi)容
Class List: Dangdangparser
***********************************************************/
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.SocketTimeoutException;
import java.net.URL;
import java.net.URLConnection;
import java.util.ArrayList;
import java.util.Iterator;

import org.apache.log4j.Logger;
import org.cyberneko.html.parsers.DOMParser;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;
import org.xml.sax.SAXNotRecognizedException;
import org.xml.sax.SAXNotSupportedException;

import com.booksearch.orm.Book;
import com.booksearch.orm.Price;
/**
 * Class:Dangdangparser
 * Description: 根據(jù)檢索關(guān)鍵字到www.dangdang.com抽取匹配內(nèi)容
 * extens:no
 * implements:HtmlParser<Element>
 * @author  feng guang
 * @since   11/09/08
 */
public class Dangdangparser implements HtmlParser<Element>{

	/*存放本網(wǎng)站某一頁的記錄*/
	private ArrayList<Book> list;
	/*記錄日志*/
	private static final Logger logger;
	
	static 
    {
        logger = Logger.getLogger(com.booksearch.service.htmlparser.Dangdangparser.class);
    }
	/**
	* Function:  nekohtmlParser
	* Description:  用nekohtml解析器解析指定網(wǎng)頁,并轉(zhuǎn)化為dom對象
	* Calls:  no
	* Called By:  no
	* @param no
	* @return Document
	* @throws IOException,SAXException
	*/
	
	public Document nekohtmlParser(String url)throws Exception{
		/*生成html 解析器*/
		DOMParser parser = new DOMParser();
		/* 設(shè)置網(wǎng)頁的默認編碼*/
		parser.setProperty("http://cyberneko.org/html/properties/default-encoding","gb2312");

		URL u = new URL(url);
		/*建立與源網(wǎng)站的連接*/
		URLConnection urlconn = u.openConnection();		
		//urlconn.connect();
		urlconn.setReadTimeout(30000);
		//urlconn.setConnectTimeout(30000);
		/*獲得源網(wǎng)站的字節(jié)流,并轉(zhuǎn)化為字符流,設(shè)置編碼為utf-8*/
		BufferedReader in = new BufferedReader(new InputStreamReader(urlconn.getInputStream(),"gb2312"));
	    /*進行解析,轉(zhuǎn)化為xml*/
		parser.parse(new InputSource(in));
        /*轉(zhuǎn)化為dom對象*/
		Document doc = parser.getDocument();
		
		return doc;
	}
	/**
	* Function:  mainService
	* Description:  Dom對轉(zhuǎn)化過來的xml進行解析,取得圖書的各個信息
	* Calls:  getBookImage(),getBookName(),getBookName(),getBookAuthor(),
	*         getBookPublisher(),getBookPublishTime(),getBookPrice()
	* Called By:  no
	* @param doc as Document
	* @return ArrayList<Book>
	* @throws no
	*/
	public ArrayList<Book> mainService(Document doc,boolean flag){
		
		list = new ArrayList<Book>();

		/*取得所有<div>結(jié)點*/
		NodeList servers = doc.getElementsByTagName("div");
		for (int i = 0; i < servers.getLength(); i++) {

			Element serveritem = (Element) servers.item(i);
            /*過濾出<div class="list_r_list">結(jié)點,也就是存放記錄的結(jié)點*/
			if (!"list_r_list".equals(serveritem.getAttribute("class"))) {
				continue;
			} else {

				NodeList childList = serveritem.getChildNodes();
				/*循環(huán)遍歷<div class="list_r_list">的子結(jié)點*/
				/*接受抽取出來的信息*/
				Book book = new Book();		
				Price price = new Price();
//				if(flag){
//					try {
//						Thread.currentThread().sleep(1000);
//					} catch (InterruptedException e1) {
//						e1.printStackTrace();
//					}
//				}
				for (int j = 0; j < childList.getLength(); j++) {

					Node childNode = childList.item(j);
                    /*如果是元素結(jié)點(<span>,<h2>,<h4>,<h5>,<h6>),則進行分類處理,取出其中的文本值*/
					if (childNode.getNodeType() == Node.ELEMENT_NODE) {

						Element childElement = (Element) childNode;
                         /*取出圖片地址*/
						if ("list_r_list_book".equals(childElement.getAttribute("class"))) {
							
							String bookImage = this.getBookImage(childElement);					
							book.setBookImage(bookImage);
					    /*取出圖書名稱*/    
						} else if ("H2".equals(childElement.getTagName())) {
							
							String bookName = this.getBookName(childElement);
							String bookUrl = this.getBookUrl(childElement);
							//System.out.println(bookUrl);
							if(flag){
								try {
									Thread.currentThread().sleep(2000);
									DangdangparserSec dangdangSec = new DangdangparserSec();
									String bookISBN = dangdangSec.getBookISBNSec(bookUrl);
									//System.out.println(bookISBN);
									book.setBookISBN(bookISBN);
								}catch (Exception e) {
									logger.error("==========當當網(wǎng)二次請求解析" + bookUrl + "時出錯" + "==========" +e);
	                                //book.setBookISBN("");
	                               //e.printStackTrace();
								}
						    }
							book.setBookName(bookName);
							//System.out.println(bookName);
							price.setDangdangUrl(bookUrl);
			
						/*取出作者名*/	
						} else if ("list_r_list_h4".equals(childElement.getAttribute("class"))) {
							
							String bookAuthor = this.getBookAuthor(childElement);
							book.setBookAuthor(bookAuthor);
						/*取出出版社名稱*/
						} else if (("H4".equals(childElement.getTagName()))
								&& (-1 != (childElement.getFirstChild().getNodeValue().indexOf("出版社")))) {
							
							String bookPublisher = this.getBookPublisher(childElement);
							book.setBookPublisher(bookPublisher);
						/*取出詳細內(nèi)容*/
						}else if("H5".equals(childElement.getTagName())){
							String bookContent = this.getBookContent(childElement);
							book.setBookProspectus(bookContent);
							//System.out.println(">>>>>>"+bookContent);
						
					    /*取出出版時間*/
						} else if (("H4".equals(childElement.getTagName()))
								&& (-1 != (childElement.getFirstChild().getNodeValue().indexOf("出版時間")))) {
							String bookPublishTime = this.getBookPublishTime(childElement);
							if(!"".equals(bookPublishTime)&&null!=bookPublishTime)
							    book.setBookPublishTime(bookPublishTime);
						/*取出圖書價格*/
						} else if ("H6".equals(childElement.getTagName())) {
							String bookFixPrice = this.getBookFixPrice(childElement);
							if(null !=bookFixPrice&&!"".equals(bookFixPrice))
							    book.setBookFixPrice(Double.valueOf(bookFixPrice.trim()));
							String bookPrice = this.getBookPrice(childElement);
							//book.setBookPrice(bookPrice);
							if(null != bookPrice&&!"".equals(bookPrice))
							    price.setDangdangPrice(Double.valueOf(bookPrice));
							String bookDiscount = this.getBookDiscount(childElement);	
                            //book.setBookDiscount(bookDiscount);
						    if(null != bookDiscount&&!"".equals(bookDiscount))
							    price.setDangdangDiscount(Float.valueOf(bookDiscount));
						}
					}
				}
				/*放到存放結(jié)果鏈中*/
				if(book.getBookName() != null){
					book.setPrice(price);
					list.add(book);
				}
			}
		}
		return list;

	}
	/**
	* Function:  getBookImage
	* Description:  獲得圖書封面圖片地址
	* Calls: no
	* Called By:  mainService
	* @param bookElement as Element
	* @return String
	* @throws no
	*/
	public  String  getBookImage(Element bookElement){
		
		Element imageElement = (Element)bookElement.getFirstChild();		
		Element srcElement = (Element)imageElement.getFirstChild();
		
		return srcElement.getAttribute("src");
	}
	/**
	* Function:  getBookName
	* Description:  獲得圖書名稱
	* Calls: no
	* Called By:  mainService
	* @param bookElement as Element
	* @return String
	* @throws no
	*/
	public  String getBookName(Element bookElement){
		
        String bookName = "";
        /*取出<a>結(jié)點*/
		Element Firstelement = (Element)bookElement.getFirstChild(); 
		NodeList nameList = Firstelement.getChildNodes();
		/*循環(huán)遍歷<a>的子結(jié)點,并取出其中的文本值*/
		for(int i = 0;i<nameList.getLength();i++){
			
			Node nameNode = nameList.item(i);
			/*分元素結(jié)點和#text結(jié)點兩種不同情況進行處理*/
			if(nameNode.getNodeType() == Node.ELEMENT_NODE){
				Element nameElement = (Element)nameNode;
				/*元素結(jié)點取得其中的文本值*/
				if(nameElement.hasChildNodes())
				    bookName += nameElement.getFirstChild().getNodeValue();
			}else{
				/*#text結(jié)點取得其中的文本值*/
				bookName += nameNode.getNodeValue();
			}
		}
		bookName = bookName.replaceAll(" ", "");
		bookName = bookName.trim();
		if(bookName.length()>64){
			bookName = bookName.substring(0, 64);
		}		
		//System.out.println(bookName);
		return bookName;
	}
	/**
	* Function:  getBookAuthor
	* Description:  獲得圖書作者
	* Calls: no
	* Called By:  mainService
	* @param bookElement as Element
	* @return String
	* @throws no
	*/
	public  String getBookAuthor(Element bookElement){
		
		String bookAuthor = "";
	    NodeList authorList = bookElement.getChildNodes();
        for(int i = 0;i<authorList.getLength();i++){
			
			Node nameNode = authorList.item(i);
			
			if(nameNode.getNodeType() == Node.ELEMENT_NODE&&"A".equals(nameNode.getNodeName())){
				Element nameElement = (Element)nameNode;
				NodeList nameList = nameElement.getChildNodes();
				for(int j = 0;j<nameList.getLength();j++){
					Node temNode = nameList.item(j);
					if(temNode.getNodeType() == Node.ELEMENT_NODE){
						Element temElement = (Element)temNode;
						if(temElement.hasChildNodes())
						    bookAuthor += temElement.getFirstChild().getNodeValue() + " ";
					}else
					   bookAuthor += temNode.getNodeValue() + " ";
				    }
				}
		}
        if(bookAuthor.length()>1)
        	bookAuthor = bookAuthor.substring(0, bookAuthor.length() - 1);

	    if(bookAuthor.length()>64){
	    	bookAuthor = bookAuthor.substring(0, 64);
	    }
        bookAuthor = bookAuthor.replace(",", " ");
        bookAuthor = bookAuthor.replace(",", " ");
        bookAuthor = bookAuthor.replace("等", "");
        bookAuthor = bookAuthor.replace("著", "");
        bookAuthor = bookAuthor.replace("編", "");
		return bookAuthor;//.substring(bookAuthor.indexOf("作 者:"+4));
	}
	/**
	* Function:  getBookPublisher
	* Description:  獲得圖書出版社
	* Calls: no
	* Called By:  mainService
	* @param bookElement as Element
	* @return String
	* @throws no
	*/
	public  String getBookPublisher(Element bookElement){
		
		String bookPublisher = "";
		NodeList publisherNode = bookElement.getChildNodes();
        for(int i = 0;i<publisherNode.getLength();i++){
			
			Node publisherNameNode = publisherNode.item(i);	
			if(publisherNameNode.getNodeType() == Node.ELEMENT_NODE&&"A".equals(publisherNameNode.getNodeName())){
				Element elementPublisher = (Element)publisherNameNode;
				if(elementPublisher.hasChildNodes()){
					if(elementPublisher.getChildNodes().getLength()>1){
						NodeList temNodeList = elementPublisher.getChildNodes();
						for(int j = 0;j<temNodeList.getLength();j++){
							Node temNode = temNodeList.item(j);
							if(temNode.getNodeType()==Node.ELEMENT_NODE){
								Element temElement = (Element)temNode;
								if(temElement.hasChildNodes())
								    bookPublisher += temElement.getFirstChild().getNodeValue();
							}else{
								bookPublisher += temNode.getNodeValue();
							}
						}
					}else{
						
						if("FONT".equals(elementPublisher.getFirstChild().getNodeName())){
							Node temNode = elementPublisher.getFirstChild();
							if(temNode.getNodeType() == Node.ELEMENT_NODE){
								Element temElement = (Element)temNode;
							    if(temElement.hasChildNodes())
							        bookPublisher = temElement.getFirstChild().getNodeValue();
							}
						}else 
							bookPublisher = elementPublisher.getLastChild().getNodeValue();
					}
				} 
			}
		}
		
		//System.out.println("bookPublisher:"+bookPublisher);
//        bookPublisher = bookPublisher.trim();
//        if(bookPublisher.length()>64){
//        	bookPublisher = bookPublisher.substring(0, 64);
//        }
		return bookPublisher.trim();
	}
	/**
	* Function:  getBookPublishTime

?? 快捷鍵說明

復(fù)制代碼 Ctrl + C
搜索代碼 Ctrl + F
全屏模式 F11
切換主題 Ctrl + Shift + D
顯示快捷鍵 ?
增大字號 Ctrl + =
減小字號 Ctrl + -
亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频
精品乱码亚洲一区二区不卡| 一本色道久久综合亚洲精品按摩| 自拍偷拍欧美精品| ...av二区三区久久精品| 国产精品福利在线播放| 国产精品久久久久久久久图文区 | 国产欧美日本一区视频| 久久精品一区二区| 国产精品全国免费观看高清| 亚洲精品国产无套在线观| 夜夜嗨av一区二区三区中文字幕 | 欧美综合在线视频| 欧美日韩成人综合天天影院| 日韩欧美高清dvd碟片| 国产日韩综合av| 亚洲一区二三区| 久久91精品久久久久久秒播| 精品写真视频在线观看| 91久久精品一区二区三| 欧美日本一区二区在线观看| 久久精品亚洲乱码伦伦中文| 亚洲国产精品久久人人爱蜜臀| 美女mm1313爽爽久久久蜜臀| 成人性色生活片| 91精品国产综合久久久蜜臀粉嫩 | 93久久精品日日躁夜夜躁欧美| 91蜜桃在线观看| 久久亚洲精品小早川怜子| 亚洲精品日韩专区silk| 国产精品一级片| 精品国产乱码久久久久久影片| 亚洲一区二区av在线| 91麻豆视频网站| 国产精品网站在线观看| 国产一区 二区| 欧美成人女星排行榜| 丝袜亚洲精品中文字幕一区| 色噜噜狠狠一区二区三区果冻| 国产婷婷色一区二区三区| 久久精品国产第一区二区三区| 欧美性猛交xxxx黑人交| 一区二区在线观看视频| 日本精品裸体写真集在线观看| 国产精品你懂的在线欣赏| 国产精品一级片在线观看| 欧美国产国产综合| 97久久超碰精品国产| 亚洲午夜在线视频| 欧美日韩极品在线观看一区| 欧美电影免费观看高清完整版在线| 91黄色免费观看| 久久久久久久久伊人| 成人精品亚洲人成在线| 亚洲自拍偷拍麻豆| 欧美一区二区播放| 国产综合色精品一区二区三区| www国产亚洲精品久久麻豆| 国产精品夜夜嗨| 亚洲精选视频免费看| 欧美一卡2卡三卡4卡5免费| 国产精品1024| 香港成人在线视频| 久久久www免费人成精品| 91激情在线视频| 国产成人一区在线| 日本三级亚洲精品| 亚洲乱码日产精品bd| 欧美一激情一区二区三区| 国产99精品国产| 久久精品国产99| 亚洲午夜影视影院在线观看| 国产亚洲精品精华液| 91精品福利在线一区二区三区| 成人精品小蝌蚪| 国产99久久久国产精品免费看| 日韩成人一区二区三区在线观看| 亚洲欧美在线观看| 久久久国产综合精品女国产盗摄| 在线成人午夜影院| 欧美亚洲综合色| 91蜜桃传媒精品久久久一区二区| 国内精品国产成人| 国产在线精品一区二区不卡了 | 国产精品资源站在线| 琪琪一区二区三区| 婷婷中文字幕综合| 午夜久久久影院| 美女视频网站黄色亚洲| 久久99精品一区二区三区三区| 首页欧美精品中文字幕| 午夜精品久久久久久久| 日欧美一区二区| 久久精品国产亚洲a| 国产乱人伦精品一区二区在线观看| 日本不卡1234视频| 蜜桃av一区二区在线观看| 国产精品久久久久久久岛一牛影视| 中文字幕免费在线观看视频一区| 精品99一区二区三区| 中文字幕精品综合| 亚洲自拍偷拍麻豆| 国产麻豆91精品| 91在线播放网址| 日韩欧美国产wwwww| 国产精品免费看片| 五月婷婷色综合| 亚洲伊人伊色伊影伊综合网| 久久精品国产网站| 成人免费av网站| 欧美精品日日鲁夜夜添| 国产拍揄自揄精品视频麻豆 | 狠狠色丁香婷综合久久| 国产suv精品一区二区883| 欧美色网站导航| 国产欧美日韩综合精品一区二区| 一区二区成人在线观看| 成人性生交大片| 欧美精品一区二区久久婷婷| 亚洲一区二区高清| 91在线播放网址| 国产精品卡一卡二| 国产一区视频导航| 日韩免费看网站| 日韩国产高清影视| 欧美色爱综合网| 亚洲精品免费视频| proumb性欧美在线观看| 国产色婷婷亚洲99精品小说| 蜜乳av一区二区三区| 欧美另类高清zo欧美| 午夜伦理一区二区| 911精品国产一区二区在线| 久久一区二区三区四区| 日韩免费观看高清完整版在线观看| 国产性做久久久久久| 国产在线麻豆精品观看| 久久久99精品久久| 国产**成人网毛片九色| 2021中文字幕一区亚洲| 国产一区二区三区四区在线观看| 久久蜜桃一区二区| eeuss鲁片一区二区三区在线观看| 日本一区二区综合亚洲| 不卡的av电影在线观看| 亚洲一区二区av在线| 91精品国产综合久久小美女| 久久99国产精品尤物| 国产欧美va欧美不卡在线| 北条麻妃一区二区三区| 亚洲永久精品大片| 国产亚洲污的网站| 在线精品观看国产| 国产在线精品免费| 亚洲嫩草精品久久| 久久久久亚洲蜜桃| 色拍拍在线精品视频8848| 裸体歌舞表演一区二区| 综合久久给合久久狠狠狠97色| 在线播放一区二区三区| 高清久久久久久| 久久99精品久久久久久久久久久久| 国产精品麻豆欧美日韩ww| 6080国产精品一区二区| 99精品国产热久久91蜜凸| 国产一区二区三区视频在线播放| 一区二区三区视频在线观看 | 天堂午夜影视日韩欧美一区二区| 欧美精品一区二区三区四区| 在线观看亚洲精品| 一本色道久久综合狠狠躁的推荐| 久久精品久久99精品久久| 亚洲精品成人天堂一二三| 国产精品久久久一区麻豆最新章节| 欧美一区二区福利在线| 欧美男人的天堂一二区| 欧美人伦禁忌dvd放荡欲情| 99re热视频精品| 一本到不卡精品视频在线观看| 91在线免费看| 91官网在线观看| 9191国产精品| 精品88久久久久88久久久| ww亚洲ww在线观看国产| 中文字幕av一区二区三区| 国产精品区一区二区三区| 亚洲免费观看高清| 一二三四区精品视频| 五月天婷婷综合| 国产露脸91国语对白| 99久久国产免费看| 6080国产精品一区二区| 久久久久久久免费视频了| 亚洲激情六月丁香| 久草精品在线观看| 99久久精品国产网站| 日韩一区二区精品| 亚洲人成在线观看一区二区| 亚洲国产视频一区| 成人一区二区三区中文字幕| 色综合 综合色|