亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

? 歡迎來到蟲蟲下載站! | ?? 資源下載 ?? 資源專輯 ?? 關于我們
? 蟲蟲下載站

?? code4.txt

?? 我做了幾個英文分詞的程序
?? TXT
字號:
 英文分詞+提取詞干的修正版 
很久以前寫過一個分詞程序,也一直在用,不過之前的若干版本都有一些bug,今天趁著有空修改了一下,實現的功能包括:
1、抽取字符串中的英文單詞,如:"I love you, too."可以分為i, love, you, too四個單詞
2、對于連寫的單詞也可以根據首字母大寫分詞,如:wordStemming可以分為word和stemming
3、提取詞干,仍然采用的是Snowball

import java.lang.reflect.Method;
import java.util.ArrayList;
import java.util.Iterator;

import org.tartarus.snowball.SnowballProgram;

/** *//**
 * Tokenizer
 * 
 * @author Peter Cheng
 * 
 */
public class Tokenizer ...{
    /** *//**
     * Language
     */
    public static String language = "english";

    /**//* Stemmer */
    private static SnowballProgram stemmer = null;

    /**//* Stem method */
    private static Method stemMethod = null;

    /** *//**
     * Tokenize and stem
     * 
     * @param source
     *            The string to be processed
     * @return All the word stems
     */
    public static Iterator tokenize(String source) ...{
        if (Tokenizer.stemmer == null) ...{
            try ...{
                Class stemClass = Class.forName("org.tartarus.snowball.ext."
                        + Tokenizer.language + "Stemmer");
                Tokenizer.stemmer = (SnowballProgram) stemClass.newInstance();
                Tokenizer.stemMethod = stemClass
                        .getMethod("stem", new Class[0]);
            } catch (Exception e) ...{
                System.out.println("Error when initializing Stemmer!");
                System.exit(1);
            }
        }

        /**//* Tokenizer */
        ArrayList tokens = new ArrayList();
        StringBuffer buffer = new StringBuffer();
        for (int i = 0; i < source.length(); i++) ...{
            char character = source.charAt(i);
            if (Character.isLetter(character)) ...{
                buffer.append(character);
            } else ...{
                if (buffer.length() > 0) ...{
                    tokens.add(buffer.toString());
                    buffer = new StringBuffer();
                }
            }
        }
        if (buffer.length() > 0) ...{
            tokens.add(buffer.toString());
        }

        /**//* All the words */
        ArrayList words = new ArrayList();

        /**//* All the words consisting of capitals */
        ArrayList allTheCapitalWords = new ArrayList();

        /**//* Tokenize according to the capitals */
        nextToken: for (Iterator allTokens = tokens.iterator(); allTokens
                .hasNext();) ...{
            String token = (String) allTokens.next();

            /**//* The words consisting of capitals */
            boolean allUpperCase = true;
            for (int i = 0; i < token.length(); i++) ...{
                if (!Character.isUpperCase(token.charAt(i))) ...{
                    allUpperCase = false;
                }
            }
            if (allUpperCase) ...{
                allTheCapitalWords.add(token);
                continue nextToken;
            }

            /**//* Other cases */
            int index = 0;
            nextWord: while (index < token.length()) ...{
                nextCharacter: while (true) ...{
                    index++;
                    if ((index == token.length())
                            || !Character.isLowerCase(token.charAt(index))) ...{
                        break nextCharacter;
                    }
                }
                words.add(token.substring(0, index).toLowerCase());
                token = token.substring(index);
                index = 0;
                continue nextWord;
            }
        }

        /**//* Stemming */
        try ...{
            for (int i = 0; i < words.size(); i++) ...{
                Tokenizer.stemmer.setCurrent((String) words.get(i));
                Tokenizer.stemMethod.invoke(Tokenizer.stemmer, new Object[0]);
                words.set(i, Tokenizer.stemmer.getCurrent());
            }
        } catch (Exception e) ...{
            e.printStackTrace();
        }

        words.addAll(allTheCapitalWords);

        return words.iterator();
    }
}


Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=1543297

?? 快捷鍵說明

復制代碼 Ctrl + C
搜索代碼 Ctrl + F
全屏模式 F11
切換主題 Ctrl + Shift + D
顯示快捷鍵 ?
增大字號 Ctrl + =
減小字號 Ctrl + -
亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频
一区二区三区在线视频免费| 一区二区高清免费观看影视大全| 欧美揉bbbbb揉bbbbb| 国产乱淫av一区二区三区| 秋霞电影网一区二区| 日韩精品一级中文字幕精品视频免费观看 | 成人久久久精品乱码一区二区三区| 精品一区二区日韩| 韩国av一区二区三区四区| 国产一区日韩二区欧美三区| 国产99久久久国产精品免费看| 国产成人在线电影| 99热国产精品| 欧美亚洲丝袜传媒另类| 在线不卡一区二区| 久久新电视剧免费观看| 中文幕一区二区三区久久蜜桃| 成人欧美一区二区三区视频网页| 亚洲婷婷综合色高清在线| 亚洲一区日韩精品中文字幕| 日韩精品电影一区亚洲| 国产在线播放一区二区三区| 国产不卡高清在线观看视频| 91网站黄www| 91麻豆精品国产综合久久久久久| 久久午夜电影网| 1区2区3区国产精品| 亚洲va韩国va欧美va| 国产伦精品一区二区三区免费| 97精品电影院| 日韩精品一区二区在线观看| 中文子幕无线码一区tr| 天堂va蜜桃一区二区三区漫画版| 国产精品综合视频| 欧美亚一区二区| 久久只精品国产| 午夜免费欧美电影| 粗大黑人巨茎大战欧美成人| 欧美日韩午夜在线| 国产精品成人一区二区三区夜夜夜| 天天影视色香欲综合网老头| 风间由美中文字幕在线看视频国产欧美| 欧美日韩亚洲综合一区二区三区| 国产日韩欧美激情| 秋霞影院一区二区| 欧美在线不卡视频| 欧美高清一级片在线观看| 日韩精品免费视频人成| 91欧美一区二区| 欧美韩国日本一区| 久久黄色级2电影| 色欧美乱欧美15图片| 国产欧美日韩视频在线观看| 国产视频一区在线播放| 亚洲h在线观看| 99国产欧美另类久久久精品 | 五月天丁香久久| 99热这里都是精品| 国产欧美日产一区| 国产在线视频一区二区| 欧美一区二区视频在线观看| 亚洲大片一区二区三区| 在线亚洲精品福利网址导航| 中文字幕乱码亚洲精品一区| 国产乱色国产精品免费视频| 精品少妇一区二区三区免费观看| 五月天中文字幕一区二区| 欧洲精品一区二区| 亚洲品质自拍视频网站| 9色porny自拍视频一区二区| 中文字幕乱码一区二区免费| 粉嫩av一区二区三区粉嫩| 日韩一二三区视频| 日韩av不卡在线观看| 欧美一区二区三区爱爱| 免费成人av资源网| 日韩精品中午字幕| 麻豆成人av在线| 久久亚洲综合av| 国产成人三级在线观看| 国产欧美日韩另类视频免费观看| 国产精品综合av一区二区国产馆| 国产拍揄自揄精品视频麻豆 | 一二三四区精品视频| 色妹子一区二区| 亚洲一卡二卡三卡四卡无卡久久| 欧美日韩中文字幕一区| 婷婷一区二区三区| 欧美成人a在线| 成人妖精视频yjsp地址| 亚洲激情校园春色| 在线不卡的av| 国产乱码字幕精品高清av | 色综合久久88色综合天天| 一区二区三区四区精品在线视频| 91国偷自产一区二区开放时间 | 亚洲18影院在线观看| 精品少妇一区二区三区日产乱码| 国产精品1区2区3区在线观看| 国产精品国产三级国产三级人妇 | 国产精品萝li| 欧美日韩一区在线观看| 麻豆精品在线视频| 国产精品久久看| 91精品国产一区二区三区| 国模少妇一区二区三区| 日韩伦理电影网| 欧美电影免费观看高清完整版在 | 久久综合精品国产一区二区三区| 粉嫩av一区二区三区| 午夜电影网亚洲视频| 国产欧美视频在线观看| 欧美日韩激情一区二区三区| 国产精品一区二区无线| 一区二区免费在线播放| 精品国产免费视频| 欧美视频一区在线观看| 风间由美性色一区二区三区| 婷婷综合在线观看| 亚洲卡通动漫在线| 国产亚洲一区二区在线观看| 欧美中文字幕久久| 丰满少妇在线播放bd日韩电影| 日本伊人午夜精品| 亚洲女子a中天字幕| 久久久久久久综合日本| 欧美三区免费完整视频在线观看| 国产成人超碰人人澡人人澡| 日韩不卡一二三区| 亚洲激情第一区| 中文字幕av一区 二区| 精品国产123| 欧美一区午夜视频在线观看| 91久久线看在观草草青青| 成人一区二区三区视频在线观看 | 日韩精品在线一区| 91精品国产综合久久婷婷香蕉| 在线观看日韩国产| 色综合色综合色综合色综合色综合| 国产一区二区在线免费观看| 日韩福利电影在线观看| 亚洲午夜视频在线| 亚洲国产综合91精品麻豆| 国产精品久久三| 亚洲欧洲日韩在线| 国产精品成人在线观看| 国产精品视频一二三| 欧美国产一区二区在线观看| 亚洲国产成人一区二区三区| 久久先锋影音av| 国产亲近乱来精品视频| 国产女主播视频一区二区| 国产亚洲欧洲997久久综合| 欧美电影免费观看高清完整版在| 日韩精品最新网址| 久久色.com| 中文成人综合网| 亚洲品质自拍视频| 亚洲一级不卡视频| 日韩和欧美一区二区| 美女高潮久久久| 韩国精品久久久| 波多野结衣中文字幕一区二区三区 | 国产精品影视在线| 成人免费高清在线观看| 91色九色蝌蚪| 精品视频资源站| 日韩午夜av一区| 久久综合色综合88| 中文字幕一区二区三| 亚洲一区二区三区四区在线观看 | xf在线a精品一区二区视频网站| 久久久国产精品麻豆| 日韩毛片高清在线播放| 婷婷开心激情综合| 国产精品一线二线三线精华| 成人av电影在线观看| 欧美专区日韩专区| 91精品国产综合久久婷婷香蕉| 欧美精品一区二| 亚洲美女视频在线观看| 婷婷国产在线综合| 国产盗摄一区二区| 欧美日韩免费一区二区三区视频| 精品日韩成人av| ㊣最新国产の精品bt伙计久久| 性久久久久久久久| 成人综合在线视频| 欧美一区二区视频观看视频| 国产精品你懂的在线欣赏| 亚洲va韩国va欧美va精品 | 天天爽夜夜爽夜夜爽精品视频| 九一久久久久久| 色欧美片视频在线观看| 精品国产亚洲一区二区三区在线观看| 日韩一区欧美小说| 国产精品69久久久久水密桃| 欧美精品一二三四| 亚洲精品成人精品456| 国产成人综合自拍|