?? nouns-in-wordnet.htm
字號:
<td width="219">
<p></p>
</td>
</tr>
<tr>
<td width="219">
<p>{substance}</p>
</td>
<td width="198">
<p>{event,happening}</p>
</td>
<td width="212">
<p>{plant,flora}</p>
</td>
<td width="210">
<p>{time}</p>
</td>
</tr>
<tr>
<td width="219">
<p>物質</p>
</td>
<td width="198">
<p>事件</p>
</td>
<td width="212">
<p>植物</p>
</td>
<td width="210">
<p>時間</p>
</td>
</tr>
<tr>
<td width="219">
<p></p>
</td>
</tr>
<tr>
<td width="219">
<p>{feeling,emotion}</p>
</td>
</tr>
<tr>
<td width="219">
<p>情感</p>
</td>
</tr>
</table>
<p><br>
<br>
* 這25類也可進一步概括為11個基本類<br>
<br>
<br>
<img border="0" src="nounclass.jpg" width="424" height="527"><br>
<br>
* 由25個語義類形成的有關名詞的25個元文件在語義層次上一般都是比較淺的。盡管對語義層次沒有嚴格限制,但很少有超過10到12層的語義樹,通常層次比較深的情況是由于專業詞匯造成的,而不是日常語言中的用詞。比如:</p>
<p>shetland pony @-> pony @-> horse @-> equid @-> odd-toed ungulate
@-> placental mammal @-> mammal @-> vertebrate @-> chordate @->
animal @-> organism @-> entity<br>
(共12層,其中6個層次是專業詞匯,而非日常用詞)</p>
<p>
</p>
<p>
<br>
3 一些心理學假設(some psycholinguistic assumptions)</p>
<p></p>
<p>* 盡管名詞層級的一般結構是由上下位關系(hyponymy/hypernymy)產生的,但這些知識在人腦的詞庫中如何表示并不清楚。我們不妨假設概念的細節是由區別特征來刻畫的。例如,知更鳥(robin)是一種鳥,有顏色,會唱歌,等等;顯然,我們不僅要在robin和bird之間建立起上下位關系,還需要將“顏色”(color),歌唱(singing),飛(flying)等特征跟robin關聯起來。此外,robin還需要從bird那里繼承一些特征,比如恒溫脊椎動物(warm-blooded
vertebrate),有喙(beak),翅膀(wings),羽毛(feathers),孵蛋(lay
eggs),等等。為了達到上述目的,至少要考慮以下三方面的特征:</p>
<p>(1)屬性(attributes): 是知更鳥屬(redbreasted),恒溫脊椎動物,</p>
<p>(2)部件(Parts):beak, feathers, wings</p>
<p>(3)功能(functions): sings, flies, lays eggs</p>
<p>盡管不同的區別特征應該被分別對待(比如attribute是形容詞,部件是名詞,功能是動詞等),但大多數認知理論以同樣的方式處理上述特征。給每個同義詞集合(synset)配上諸如此類的特征集,就可以得到下面這樣一種簡單的對下位關系進行定義的方式:</p>
<p>如果同義詞集合{ A }的所有特征被包含在同義詞集合 { B }的特征集中,而不是相反,那么,{
B } 是 { A } 的下位概念(hyponym)。</p>
<p>*
如果上下位關系依靠特征來定義,那么特征就成為非常重要的概念。對任何給定的同義詞集合,用來定義它的特征必須是特定的,同時又必須是足夠的。許多認知學家懷疑所有的詞是否能如此容易地依靠定義性的特征來加以刻畫。</p>
<p>*
盡管大多數詞匯學家和計算機科學家認為詞匯層級是表示名詞意義(nominal
meaning)的一種自然的方式,但許多認知科學家對此表示懷疑。當然認知學者們并不是懷疑概念之間客觀存在的上下位關系,而是對人腦詞庫中如何識別這些關系的認知過程表示疑惑。當人們去尋找不同的特征集合(list
of feature)之間存在包含關系(inclusion relation)的經驗證據時,上述問題就出現了。</p>
<p>* 1969年,Collins 和 Quillian 報告說,人們證實 句子 “ A robin
is a bird ”所需要的時間,比證實句子 “ A robin is an animal ”
所需要的時間 短。
于是他們主張,上述觀察提供了心理學證據,證明詞匯層級的距離的確對認知有影響
:
在詞匯層級上距離越遠,就需要更多的時間來思考。這一可能性刺激出數量上相當可觀的研究工作,不過一系列的問題最終導致人們對詞匯層級的認知現實性的嚴重質疑。</p>
<p>* 1981年,Smith 和 Medin非常謹慎地提出了反面意見。他們發現,感知“
a chicken is a bird ”所需的時間比感知 “ a robin is a bird
”所需的時間長,盡管 chicken 和 robin 跟bird的分類關系是一樣的。這個差異不是
robin 出現的頻率比 chicken 高造成的。而是 作為鳥類的成員,robin比chicken更典型。在傳統的經典分類理論中,典型性是沒有地位的。</p>
<p>* 在1980年代中期,對詞匯層級的經典解釋的攻擊如此有誘惑力,以至于當時WordNet一出現,就被設想為有可能從根本上揭示為何詞匯層級系統不是一個好的揭示詞語意義的框架。事實上,WordNet的作者們很快就使自己確信,動詞,形容詞,副詞都是以不同的方式組織的。不過,名詞的層級結構似乎可以適應語言事實,盡管缺少好的解釋。</p>
<p>* 例如,句子“ A pistol is more dangerous than a rifle
”(手槍比步槍更危險)顯示的意義是可以理解的。而“ A
pistol is more dangerous than a gun ” (手槍比槍更危險)和“ A gun
is more dangerous than a pistol ”就都不好理解(Bever and Rosenbaum 1970)。很顯然,語言學上,比較句中兩個比較項不能是上下位關系的兩個詞。而這條句法規則要發揮作用,必須基于給定的名詞上下位關系知識基礎上。</p>
<p>* 再看一個例子,“ I gave him a good novel, but the book bored him
”容易理解,但“ I gave him a good novel, but the catsup bored him
”就讓人費解。 因為詞匯知識告訴我們,novel是book(有上下位關系),但不是catsup(番茄醬)。顯然,要得出上述判斷,也必須依賴名詞之間的上下位關系。</p>
<p>*
再一個例子,一些動詞的搭配選擇限制也表明名詞上下位關系的重要性。比如動詞“drink”的直接賓語可以是
beverage
(飲料)的任何一個下位詞。這也暗示有關名詞的上下位關系的知識應該以一種人們能夠快速訪問和搜索到的方式存貯。</p>
<p>*
由此,名物概念的層級組織方式似乎是大腦中的心智詞典的一個必然特征。盡管它遭到認知理論的強烈攻擊,但層級原則對名詞詞典來說確實重要。那么又如何看待典型性(typicality)呢?也許,典型性跟層級型二者可以并存。這就說,在名詞的層級系統上,應該存貯更多的信息。除了一個名詞在詞匯層級系統上的位置,我們還需要知道更多有關這個名詞的信息,但這并不意味著層級系統本身就不重要了。</p>
<p>* WordNet的組織方式是提供語義關系的指針,而不是羅列特征。WordNet中的名詞由同義詞集合(synset)組成,synset之間有指針指示它們的語義關系(上下位關系)。在WordNet中,特征信息并不是以明確的顯性形式來定義上下位關系或名詞的層級關系。</p>
<p> </p>
<p>4 WordNet中不包含的東西(some things not in WordNet)</p>
<p>
</p>
<p>
* WordNet中不包含這樣的描述 :企鵝不是會飛的鳥。蜘蛛不是昆蟲?!?。<br>
即 不包含“is not a (kind of)”這樣的關系。<br>
<br>
* @->實際代表了不止一種語義關系,至少包括“is a kind of”和“is used as a kind of”兩種關系。{chicken} @-> {bird} 是前者;{chicken} @-> {food}是后者。遺憾的是,WordNet中沒有對上述區別加以描述。<br>
</p>
<p>
<br>
5 整體部分關系(meronymy)包括三種情況:(WordNet中包含了這三種關系)<br>
</p>
<p>
A是B的組成部分; beak / wing -> bird<br>
A是B的成員; tree -> forest<br>
A是B的構成材料。 aluminum -> plane<br>
</p>
<p>* 在WordNet中,整體部分關系主要是在noun.body(身體部件名詞),
noun.artifact(人工物),noun.quantity(數量名詞)三個文件中。</p>
<p>*
有時候,整體部分關系跟上下位關系會出現一些糾纏的現象。比如,{beak,bill,neb,nib}不僅是{bird}的部件,同時也是{jaw}的下位概念。而{jaw}又是{skull}的部件,是{skeletal_structure}的下位概念。在下位關系和整體部分關系之間建立適合關系常常會產生的問題是,會有將部件名詞放在名詞層級系統中過高位置的傾向。比如,如果{wheel}是{vehicle}的部件,那么{sled}(雪橇)就不是vehicle了。在WordNet中,為此創建了一個中間概念,{wheeled_vehicle}(帶輪子的交通工具)。</p>
<p>* 另一個重要的值得說明的問題是,“is a part
of”通常用來測試整體部分關系,但這種測試方式并不總是可靠。比如,在許多例子中,傳遞性(transitivity)是受到限制的。Lyons(1977)注意到,“handle”是“door”的部件,“door”是“house”的部件,但如果我們說,“handle”是“house”的部件,就比較奇怪。Winston,
Chaffin, Hermann(1987)舉的例子更極端,我們可以說,“the branch is
a part of the tree” 以及 “ the tree is a part of the forest
”,但不能因此導出,“the branch is a part of the forest ”,因為
“branch / tree ”之間的關系跟 “ tree / forest
”之間的關系不同。</p>
<p>
<br>
6 Antonymy(反義關系)<br>
</p>
<p>*
兩個詞構成反義關系的最強烈的心理學指示是,當給出其中一個詞時,它的反義詞(另一個詞)通常就是那個最容易聯想到的詞。比如,當人們聽到“victory”(勝利)時,最容易想到的就是“defeat”(失?。?,反之亦然。</p>
<p>* 上述反義關系通常出現在所謂的降格形容詞性名詞(deadjectival
noun)之間。比如名詞“happiness”和“unhappiness”之間的反義關系來自反義形容詞“happy”和“unhappy”之間的反義關系。這些
deadjectival noun都是{attribute}(屬性)的下位概念。</p>
<p>*
語義相反不是名詞之間的基本組織關系,但這種關系確實存在,在WordNet中也有所反映。例如
[ { man } !-> { woman } ] 和 [ { woman } ! -> { man } ]都在源文件中存在。但這種反義關系不能被
{ man } 和 { woman }
的下位概念繼承。也許關于名詞之間反義關系最有趣的是,兩個反義名詞一般總是有共同的直接上位概念。</p>
<p>7 屬性和修飾語(attribute and modification)<br>
</p>
<p>* 屬性的值由形容詞表達。例如,“size”和“color”是
“robin”(知更鳥)的兩個屬性。而知更鳥的size則由形容詞“small”(?。﹣砻枋觯籧olor則由形容詞“red”來描述。名詞由此可以看作是屬性詞的論元。例如
SIZE (robin) = small, COLOR (robin) = red</p>
<p>* 在WordNet中,{robin}和{red}之間不直接發生關聯,而是通過{color}跟{red}之間發生關聯。</p>
<p>* friendliness(友好性)是dog的一個屬性,因此我們可以說“
a dog can be friendly or unfriendly ”,但 “ stingy dog ”或“ shallow
dog ”就只能解釋為比喻用法。因為 generosity 和 depth 都不是
dog 的正常屬性。</p>
<p>* 形容詞修飾成分在WordNet中扮演的主要角色可能是在搭配詞或合成詞中。比如
easy chair , electric chair, straight chair, high chair等,都比基本概念層級的名詞
chair 更詳細地刻畫了 chair。</p>
<p>
<br>
8 多義名詞的相似意義/近義 similar meanings of polysemous nouns</p>
<p>* Philip N. Johnson-Larid提出,如果一個詞的兩個意義是相似的,那么它們的下位詞的意義也應該以同樣的方式相似。例如:fish的兩個意義,一個是動物(fish1),一個是食物(fish2)。fish的下位詞perch,sole,bass等也都是如此。</p>
<p>* 不過也有不同于上面情況的例外,比如 coral
(珊瑚蟲)是 animal 的下位概念之一。coral最后會形成 ocean
reef (珊瑚); 同時, coral 還有一個意思也是 food
的下位概念,是指 lobster roe (龍蝦卵)。顯然,這里的animal
和 food的下位概念之間的關系不是 動物 和
它的可食的肉之間的關系。因此,需要對這種例外情況加以特別說明。</p>
<p>* 近義是最近才加入到WordNet中的關系。而且只在名詞中得到了實施,這方面的工作仍在繼續。</p>
<p>* WordNet中區分了三種不同的近義情況:</p>
<p>(1) cousins (堂兄弟節點) 比如上面 例子 fish
的兩個意思(概念)之間就是。<br>
(2) sisters (姊妹節點) 比如 flounder
可以指不同的扁平魚(比目魚),在兩種不同的指稱意義下,它們的直接上位詞是一樣的(都是
flatfish )。這種情況下,flounder的兩個意義就是 sisters 近義。<br>
(3) twins (孿生節點) 這是指兩個同義詞集合(synset)共享同樣的詞形式(word
form),這兩個同義詞集合中的詞形式應該有3個以上是共同的。比如,duo的一個意思是
musical group (二人音樂小組,或二重唱組合),另一個意思是
musical composition
(音樂作品,二重唱音樂作品)。跟這兩個意思相關的同義詞集合中都包含{
duo, duet, duette }。</p>
<p> </p>
<p>9 小 結</p>
<p>* 在有關WordNet的更早期描述(Beckwith et al. 1991; Miller et.al,
1990)中,研究人員曾經主張WordNet是基于心理語言學原則的,就如同牛津英語詞典基于歷史原則一樣。不過這個主張并沒有結出一如當初人們期望的那樣的果實。事實上,WordNet在很大程度上被心理語言學家忽視了。相反,計算語言學家則對它表示出更大的興趣。</p>
<p>* 不過,WordNet中有關名詞概念的層級描述,以及關于名詞間同義,反義,上下位關系,整體部分關系等的描述,確實在解釋語言行為方面發揮著作用。但心理語言學家并不把WordNet中的這些描寫看作是可以用來揭示人類語言心理基礎的基本原則。也許他們認為更為重要的是解釋更為基本的認知過程。</p>
<p>*
計算語言學家當然不這么看,只要有助于處理自然語言,甚至在某種程度上達到理解的水平,一棵關于詞義概念的層級樹就是有用的(心理語言學家關心的恰恰是詞匯層級樹上不那么明顯的那些關系)。</p>
<p>* WordNet中的名詞庫的開發因此更多的是受到計算語言學方面的潛在應用的推動,勝過來自認知心理學理論的推動。也許,這個結果是應該能夠預見到的。正如一個基于歷史原則編纂的詞典,實際上對歷史研究的貢獻微乎其微一樣。</p>
<p>附:一個名詞語義網絡的示例</p>
<p><img border="0" src="noun-net.jpg" width="643" height="376"></p>
</body>
</html>
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -