?? splitword.java
字號:
package com.xjt.nlp.word;
/**
* <p>Title: Java中文分詞組件</p>
* <p>Description: 本組件以中科院ICTCLAS系統為基礎,在其基礎之上改編,本組件僅供學習和研究用途,任何商業用途將自行承擔法律后果,與組件編寫人無關。</p>
* <p>Copyright: Copyright (c) 2004</p>
* <p>Company: 北京師范大學</p>
* @author 陳天
* @version 1.0
*/
import java.util.LinkedList;
import java.util.List;
public class SplitWord {
public SplitWord() {
}
/**
* 在ICTCLAS的基礎上做進一步的分詞。
* @param sentence 輸入句子
* @return 一個LinkedList鏈表,每一個項是一個Word對象
*/
public static Sentence splitWord(String sSentence) {
Sentence sentence = new Sentence();
ICTCLAS ict = ICTCLAS.getInstance();
String str = ict.paragraphProcess(sSentence.trim());
String[] allWords = str.split(" ");
for (int i = 0; i < allWords.length; i++) {
int pos = allWords[i].lastIndexOf("/");
if (pos > 0) {
Word word = new Word(allWords[i].substring(0, pos),allWords[i].substring(pos + 1));
sentence.addWord(word);
}
}
return sentence;
}
public static void main(String[] args) {
Sentence all = SplitWord.splitWord("巴拿馬和美國都是國家地區,漢族是一個民族。/");
for (int i=0;i<all.totalWords();i++){
Word word = (Word) all.getWord(i);
System.out.print(word.toString());
}
}
}
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -