亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

? 歡迎來(lái)到蟲(chóng)蟲(chóng)下載站! | ?? 資源下載 ?? 資源專輯 ?? 關(guān)于我們
? 蟲(chóng)蟲(chóng)下載站

?? nutchanalysis.jj

?? 爬蟲(chóng)數(shù)據(jù)的改進(jìn),并修正了一些bug
?? JJ
字號(hào):
/* Copyright (c) 2003 The Nutch Organization.  All rights reserved.   */
/* Use subject to the conditions in http://www.nutch.org/LICENSE.txt. */

/** JavaCC code for the Nutch lexical analyzer. */

options {
  STATIC = false;
  USER_CHAR_STREAM = true;
  OPTIMIZE_TOKEN_MANAGER = true;
  UNICODE_INPUT = true;
//DEBUG_TOKEN_MANAGER = true;
}

PARSER_BEGIN(NutchAnalysis)

package net.nutch.analysis;

import net.nutch.searcher.Query;
import net.nutch.searcher.QueryFilters;
import net.nutch.searcher.Query.Clause;

import org.apache.lucene.analysis.StopFilter;

import java.io.*;
import java.util.*;

/** The JavaCC-generated Nutch lexical analyzer and query parser. */
public class NutchAnalysis {

  private static final String[] STOP_WORDS = {
    "a", "and", "are", "as", "at", "be", "but", "by",
    "for", "if", "in", "into", "is", "it",
    "no", "not", "of", "on", "or", "s", "such",
    "t", "that", "the", "their", "then", "there", "these",
    "they", "this", "to", "was", "will", "with"
  };

  private static final Set STOP_SET = StopFilter.makeStopSet(STOP_WORDS);

  private String queryString;

  /** True iff word is a stop word.  Stop words are only removed from queries.
   * Every word is indexed.  */
  public static boolean isStopWord(String word) {
    return STOP_SET.contains(word);
  }

  /** Construct a query parser for the text in a reader. */
  public static Query parseQuery(String queryString) throws IOException {
    NutchAnalysis parser =
      new NutchAnalysis(new FastCharStream(new StringReader(queryString)));
    parser.queryString = queryString;
    return parser.parse();
  }

  /** For debugging. */
  public static void main(String[] args) throws Exception {
    BufferedReader in = new BufferedReader(new InputStreamReader(System.in));
    while (true) {
      System.out.print("Query: ");
      String line = in.readLine();
      System.out.println(parseQuery(line));
    }
  }

}

PARSER_END(NutchAnalysis)

TOKEN_MGR_DECLS : {

  /** Constructs a token manager for the provided Reader. */
  public NutchAnalysisTokenManager(Reader reader) {
    this(new FastCharStream(reader));
  }

}

TOKEN : {					  // token regular expressions

  // basic word -- lowercase it
<WORD: ((<LETTER>|<DIGIT>|<WORD_PUNCT>)+ | <IRREGULAR_WORD>)>
  { matchedToken.image = matchedToken.image.toLowerCase(); }

  // special handling for acronyms: U.S.A., I.B.M., etc: dots are removed
| <ACRONYM: <LETTER> "." (<LETTER> ".")+ > 
    {                                             // remove dots
      for (int i = 0; i < image.length(); i++) {
	if (image.charAt(i) == '.')
	  image.deleteCharAt(i--);
      }
      matchedToken.image = image.toString().toLowerCase();
    }

  // chinese, japanese and korean characters
| <SIGRAM: <CJK> >

   // irregular words
| <#IRREGULAR_WORD: (<C_PLUS_PLUS>|<C_SHARP>)>
| <#C_PLUS_PLUS: ("C"|"c") "++" >
| <#C_SHARP: ("C"|"c") "#" >

  // query syntax characters
| <PLUS: "+" >
| <MINUS: "-" >
| <QUOTE: "\"" >
| <COLON: ":" >
| <SLASH: "/" >
| <DOT: "." >
| <ATSIGN: "@" >
| <APOSTROPHE: "'" >

| <WHITE: ~[] >                                   // treat unrecognized chars
                                                  // as whitespace
// primitive, non-token patterns

| <#WORD_PUNCT: ("_"|"&")>                        // allowed anywhere in words

| < #LETTER:					  // alphabets
    [
        "\u0041"-"\u005a",
        "\u0061"-"\u007a",
        "\u00c0"-"\u00d6",
        "\u00d8"-"\u00f6",
        "\u00f8"-"\u00ff",
        "\u0100"-"\u1fff"
    ]
    >

|  <#CJK:                                        // non-alphabets
      [
       "\u3040"-"\u318f",
       "\u3300"-"\u337f",
       "\u3400"-"\u3d2d",
       "\u4e00"-"\u9fff",
       "\uf900"-"\ufaff"
      ]
    >    

| < #DIGIT:					  // unicode digits
      [
       "\u0030"-"\u0039",
       "\u0660"-"\u0669",
       "\u06f0"-"\u06f9",
       "\u0966"-"\u096f",
       "\u09e6"-"\u09ef",
       "\u0a66"-"\u0a6f",
       "\u0ae6"-"\u0aef",
       "\u0b66"-"\u0b6f",
       "\u0be7"-"\u0bef",
       "\u0c66"-"\u0c6f",
       "\u0ce6"-"\u0cef",
       "\u0d66"-"\u0d6f",
       "\u0e50"-"\u0e59",
       "\u0ed0"-"\u0ed9",
       "\u1040"-"\u1049"
      ]
  >

}


/** Parse a query. */
Query parse() :
{
  Query query = new Query();
  ArrayList terms;
  Token token;
  String field;
  boolean stop;
  boolean prohibited;

}
{
  nonOpOrTerm()                                   // skip noise
  (
    { stop=true; prohibited=false; field = Clause.DEFAULT_FIELD; }

                                                  // optional + or - operator
    ( <PLUS> {stop=false;} | (<MINUS> { stop=false;prohibited=true; } ))?

                                                  // optional field spec.
    ( LOOKAHEAD(<WORD><COLON>(phrase(field)|compound(field)))
      token=<WORD> <COLON> { field = token.image; } )?

    ( terms=phrase(field) {stop=false;} |         // quoted terms or
      terms=compound(field))                      // single or compound term

    nonOpOrTerm()                                 // skip noise

    {
      String[] array = (String[])terms.toArray(new String[terms.size()]);

      if (stop && terms.size()==1 && isStopWord(array[0])) {
        // ignore stop words only when single, unadorned terms
      } else {
        if (prohibited)
          query.addProhibitedPhrase(array, field);
        else
          query.addRequiredPhrase(array, field);
      }
    }
  )*
  
  { return query; }

}

/** Parse an explcitly quoted phrase query.  Note that this may return a single
 * term, a trivial phrase.*/
ArrayList phrase(String field) :
{
  int start;
  int end;
  ArrayList result = new ArrayList();
  String term;
}
{
  <QUOTE>

  { start = token.endColumn; }
  
  (nonTerm())*                                    // skip noise
  ( term = term() { result.add(term); }           // parse a term
    (nonTerm())*)*                                // skip noise

  { end = token.endColumn; }

  <QUOTE>
    
  {
    if (QueryFilters.isRawField(field)) {
      result.clear();
      result.add(queryString.substring(start, end));
    }
    return result;
  }

}

/** Parse a compound term that is interpreted as an implicit phrase query.
 * Compounds are a sequence of terms separated by infix characters.  Note that
 * htis may return a single term, a trivial compound. */
ArrayList compound(String field) :
{
  int start;
  ArrayList result = new ArrayList();
  String term;
}
{
  { start = token.endColumn; }

  term = term() { result.add(term); }
  ( LOOKAHEAD( (infix())+ term() )
    (infix())+
    term = term() { result.add(term); })*

  {
    if (QueryFilters.isRawField(field)) {
      result.clear();
      result.add(queryString.substring(start, token.endColumn));
    }
    return result;
  }

}

/** Parse a single term. */
String term() :
{
  Token token;
}
{
  ( token=<WORD> | token=<ACRONYM> | token=<SIGRAM>)

  { return token.image; }
}


/** Parse anything but a term or a quote. */
void nonTerm() :
{}
{
  <WHITE> | infix() | <EOF>
}


/** Parse anything but a term or an operator (plur or minus or quote). */
void nonOpOrTerm() :
{}
{
  (LOOKAHEAD(2) (<WHITE> | nonOpInfix() | ((<PLUS>|<MINUS>) nonTerm())))*
}

/** Characters which can be used to form compound terms. */
void infix() :
{}
{
  <PLUS> | <MINUS> | nonOpInfix()
}

/** Parse infix characters except plus and minus. */
void nonOpInfix() :
{}
{
  <COLON>|<SLASH>|<DOT>|<ATSIGN>|<APOSTROPHE>
}

?? 快捷鍵說(shuō)明

復(fù)制代碼 Ctrl + C
搜索代碼 Ctrl + F
全屏模式 F11
切換主題 Ctrl + Shift + D
顯示快捷鍵 ?
增大字號(hào) Ctrl + =
減小字號(hào) Ctrl + -
亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频
视频在线观看91| 91丝袜呻吟高潮美腿白嫩在线观看| 热久久免费视频| 日本午夜精品视频在线观看| 久久国产剧场电影| 成人精品国产免费网站| 97se狠狠狠综合亚洲狠狠| 欧洲另类一二三四区| 日韩欧美中文字幕公布| 国产人妖乱国产精品人妖| 国产精品不卡在线| 极品销魂美女一区二区三区| 欧美日韩一区二区三区免费看 | 亚洲成人综合视频| 亚洲自拍偷拍综合| 日本在线不卡一区| 国产美女娇喘av呻吟久久| 成人高清视频免费观看| 欧美乱熟臀69xxxxxx| 精品嫩草影院久久| 中文字幕亚洲精品在线观看 | 欧美亚洲一区二区三区四区| 日韩欧美色综合网站| 亚洲免费av网站| 麻豆精品国产91久久久久久| 成人污污视频在线观看| 精品一区二区三区在线观看| 91在线小视频| 337p亚洲精品色噜噜噜| 亚洲国产精品成人综合色在线婷婷| 亚洲一区二区视频在线观看| 美女性感视频久久| av在线一区二区| 日韩一区二区视频在线观看| 亚洲精品中文在线| 久久se这里有精品| 99精品视频在线免费观看| 欧美大片国产精品| 日韩三级在线观看| 69p69国产精品| 中文字幕第一区第二区| 精品一区二区三区在线观看 | 欧美精品乱码久久久久久| 日本一二三四高清不卡| 青青草国产精品97视觉盛宴 | 亚洲免费观看高清完整版在线| 免费在线看成人av| 欧美日韩在线精品一区二区三区激情 | 69p69国产精品| 国产日韩欧美精品在线| 久久成人精品无人区| 在线精品视频一区二区三四| 久久久.com| 国产在线播放一区三区四| 在线综合+亚洲+欧美中文字幕| 99精品欧美一区二区三区小说| 欧美色爱综合网| 久久久综合视频| 久久国产精品一区二区| 欧美三级电影一区| 中文字幕一区三区| av一区二区三区四区| 久久久久久99精品| 男人操女人的视频在线观看欧美| 欧美日韩一区二区三区四区| 亚洲色图.com| 国产91精品一区二区麻豆网站| 欧美一区二区成人| 日日夜夜精品视频免费| 99精品黄色片免费大全| 国产精品免费免费| 国产一区二区三区精品视频| 26uuu久久天堂性欧美| 石原莉奈在线亚洲二区| 欧美日韩在线三级| 调教+趴+乳夹+国产+精品| 欧美亚洲综合另类| 亚洲一区二区四区蜜桃| 在线成人小视频| 亚洲综合无码一区二区| 在线一区二区三区四区五区| 亚洲午夜私人影院| 欧美色视频在线| 亚洲6080在线| 欧美日韩成人一区| 天堂精品中文字幕在线| 6080亚洲精品一区二区| 精品写真视频在线观看| 欧美大白屁股肥臀xxxxxx| 另类中文字幕网| 国产人伦精品一区二区| eeuss鲁片一区二区三区| 国产精品网站一区| 色婷婷国产精品| 亚洲一区中文在线| 精品视频色一区| 韩日av一区二区| 日本一区免费视频| 成人免费观看av| 亚洲一区二区欧美日韩| 欧美另类高清zo欧美| 麻豆免费精品视频| 欧美大胆一级视频| 国产成人在线色| 亚洲色图19p| 欧美日韩视频一区二区| 日本不卡高清视频| 久久亚洲捆绑美女| 色婷婷综合视频在线观看| 亚洲二区在线视频| 日韩一区二区麻豆国产| 国产成人亚洲综合a∨猫咪| 亚洲视频一区二区免费在线观看| 91国在线观看| 亚洲精品免费在线观看| 欧美一卡2卡三卡4卡5免费| 狠狠色丁香久久婷婷综合_中| 精品国产一区二区在线观看| www.av亚洲| 五月激情综合网| 久久精品一区蜜桃臀影院| 91九色最新地址| 久久精工是国产品牌吗| 国产精品嫩草99a| 7777精品伊人久久久大香线蕉最新版| 久久99久久久久久久久久久| 国产精品三级在线观看| 欧美高清视频在线高清观看mv色露露十八| 秋霞午夜av一区二区三区| 国产欧美日韩不卡免费| 欧美精品亚洲一区二区在线播放| 韩国v欧美v亚洲v日本v| 亚洲精品视频一区| 欧亚洲嫩模精品一区三区| 国产一区不卡视频| 亚洲精品成人少妇| 欧美女孩性生活视频| www.日韩在线| 久久精品国产精品青草| 亚洲欧美偷拍卡通变态| 久久久久久久综合狠狠综合| 91成人网在线| 国产成人在线影院| 美女精品一区二区| 自拍偷拍欧美精品| 欧美成人女星排行榜| 精品视频999| 99久久精品免费观看| 久久99精品久久久久久动态图| 亚洲精品乱码久久久久久日本蜜臀| 日韩精品资源二区在线| 91色乱码一区二区三区| 国产一区91精品张津瑜| 日日夜夜一区二区| 久久午夜国产精品| 69堂成人精品免费视频| 色综合天天做天天爱| 天天av天天翘天天综合网色鬼国产| 综合分类小说区另类春色亚洲小说欧美| 日韩女优av电影在线观看| 91麻豆精品一区二区三区| 成人一区在线观看| 激情综合网最新| 五月天中文字幕一区二区| 伊人色综合久久天天| 亚洲欧美在线另类| 国产精品久久久久精k8| 国产精品三级久久久久三级| 久久久国际精品| 久久免费看少妇高潮| 久久久久免费观看| 久久综合狠狠综合久久综合88 | 久久国产免费看| 日韩黄色小视频| 爽好多水快深点欧美视频| 亚洲一区二区精品视频| 一区二区三区毛片| 一区二区三区欧美日韩| 一区二区三区电影在线播| 亚洲精品中文在线| 亚洲一区二区视频在线观看| 亚洲大片一区二区三区| 亚洲大片在线观看| 日本中文在线一区| 美女一区二区在线观看| 九色综合国产一区二区三区| 精品一二三四在线| 国产一区日韩二区欧美三区| 国产精品一二三在| 大胆亚洲人体视频| 99在线热播精品免费| 在线精品视频免费播放| 欧美精品成人一区二区三区四区| 日韩亚洲欧美一区| 精品福利视频一区二区三区| 国产欧美日韩亚州综合| 国产精品久久久久久久久晋中| 亚洲欧美色图小说| 亚洲综合免费观看高清完整版| 亚洲国产一二三|