?? postag.java
字號:
package org.ictclas4j.utility;
public interface POSTag {
int SEN_BEGIN=1;//句子的開始標記“始##始”
int SEN_END=4;//句子的結束標記“末##末”
int ADJ_GEN=('A'<<8)+'g';//Ag 形語素 形容詞性語素。形容詞代碼為 a,語素代碼g前面置以A。
int ADJ='a'<<8;//a 形容詞 取英語形容詞 adjective 的第1 個字母。
int ADJ_AD=('a'<<8)+'d';//ad 副形詞 直接作狀語的形容詞。形容詞代碼 a 和副詞代碼d 并在一起。
int ADJ_NOUN=('a'<<8)+'n';//an 名形詞 具有名詞功能的形容詞。形容詞代碼 a 和名詞代碼n 并在一起。
int BIE='b'<<8;//b 區別詞 取漢字“別”的聲母。
int CONJ='c'<<8;//c 連詞 取英語連詞 conjunction 的第1 個字母。
int ADV_GEN=('d'<<8)+'g';//dg 副語素 副詞性語素。副詞代碼為 d,語素代碼g前面置以D。
int ADV='d'<<8;//d 副詞 取 adverb 的第2 個字母,因其第1 個字母已用于形容詞。
int EXC='e'<<8;//e 嘆詞 取英語嘆詞 exclamation 的第1 個字母。
int FANG='f'<<8;//f 方位詞 取漢字“方”
int GEN='g'<<8;//g 語素 絕大多數語素都能作為合成詞的“詞根”,取漢字“根”的聲母。
int HEAD='h'<<8;//h 前接成分 取英語 head 的第1 個字母。
int IDIOM='i'<<8;//i 成語 取英語成語 idiom 的第1 個字母。
int JIAN='j'<<8;//j 簡稱略語 取漢字“簡”的聲母。
int SUFFIX='k'<<8;//k 后接成分
int TEMP='l'<<8;//l 習用語 習用語尚未成為成語,有點“臨時性”,取“臨”的聲母。
int NUM='m'<<8;//m 數詞 取英語 numeral 的第3 個字母,n,u 已有他用。
int NOUN_GEN=('N'<<8)+'g';//Ng 名語素 名詞性語素。名詞代碼為 n,語素代碼g前面置以N。
int NOUN='n'<<8;//n 名詞 取英語名詞 noun 的第1 個字母。
int NOUN_PERSON=('n'<<8)+'r';//nr 人名 名詞代碼 n 和“人(ren)”的聲母并在一起。
int NOUN_SPACE=('n'<<8)+'s';//ns 地名 名詞代碼 n 和處所詞代碼s 并在一起。
int NOUN_ORG=('n'<<8)+'t';//nt 機構團體 “團”的聲母為 t,名詞代碼n 和t 并在一起。
int NOUN_LETTER=('n'<<8)+'x';//英文或英文數字字符串
int NOUN_ZHUAN=('n'<<8)+'z';//nz 其他專名 “專”的聲母的第 1 個字母為z,名詞代碼n 和z 并在一起。
int ONOM='o'<<8;//o 擬聲詞 取英語擬聲詞 onomatopoeia 的第1 個字母。
int PREP='p'<<8;//p 介詞 取英語介詞 prepositional 的第1 個字母。
int QUAN='q'<<8;//q 量詞 取英語 quantity 的第1 個字母。
int PRONOUN='r'<<8;//r 代詞 取英語代詞 pronoun 的第2 個字母,因p 已用于介詞。
int SPACE='s'<<8;//s 處所詞 取英語 space 的第1 個字母。
int TIME_GEN=('T'<<8)+'g';//g 時語素 時間詞性語素。時間詞代碼為 t,在語素的代碼g 前面置以T。
int TIME='t'<<8;//t 時間詞 取英語 time 的第1 個字母。
int AUXI='u'<<8;//u 助詞 取英語助詞 auxiliary
int VERB_GEN=('V'<<8)+'g';//vg 動語素 動詞性語素。動詞代碼為 v。在語素的代碼g 前面置以V。
int VERB='v'<<8;//v 動詞 取英語動詞 verb 的第一個字母。
int VERB_AD=('v'<<8)+'d';//vd 副動詞 直接作狀語的動詞。動詞和副詞的代碼并在一起。
int VERB_NOUN=('v'<<8)+'n';//vn 名動詞 指具有名詞功能的動詞。動詞和名詞的代碼并在一起。
int PUNC='w'<<8;//w 標點符號
int NO_GEN='x'<<8;//x 非語素字 非語素字只是一個符號,字母 x 通常用于代表未知數、符 號。
int YUNQI='y'<<8;//y 語氣詞 取漢字“語”的聲母。
int STATUS='z'<<8;//z 狀態詞 取漢字“狀”的聲母的前一個字母。
int UNKNOWN=('u'<<8)+'n';//un 未知詞 不可識別詞及用戶自定義詞組。取英文Unkonwn 首兩個字母。(非北大標準,CSW 分詞中定義)
}
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -