?? 0403-0300.htm
字號:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<!-- saved from url=(0071)http://162.105.170.55/ASPs/GetLearningArticleTemp.asp?section=0403-0300 -->
<HTML><HEAD><TITLE>XML中國論壇 - 初學進階 - 4.3.3 節點匹配路徑XPath</TITLE>
<META http-equiv=Content-Type content="text/html; charset=gb2312">
<STYLE type=text/css>TABLE {
FONT-SIZE: 9pt; COLOR: black; LINE-HEIGHT: 15pt; FONT-FAMILY: "宋體"
}
.pt9 {
FONT-SIZE: 9pt; COLOR: black; LINE-HEIGHT: 15pt; FONT-FAMILY: "宋體"
}
.pt10 {
FONT-WEIGHT: 700; FONT-SIZE: 10pt; LINE-HEIGHT: 18pt; FONT-FAMILY: "宋體"
}
.TempOutline {
FONT-SIZE: 9pt; MARGIN-LEFT: 15pt; COLOR: #666666; TEXT-INDENT: -28pt; LINE-HEIGHT: 15pt; FONT-FAMILY: "宋體"; TEXT-DECORATION: none
}
.TempOutline1 {
FONT-SIZE: 9pt; MARGIN-LEFT: 24pt; COLOR: #666666; TEXT-INDENT: -36pt; LINE-HEIGHT: 15pt; FONT-FAMILY: "宋體"; TEXT-DECORATION: none
}
.Outline {
FONT-SIZE: 9pt; MARGIN-LEFT: 15pt; TEXT-INDENT: -28pt; LINE-HEIGHT: 15pt; FONT-FAMILY: "宋體"; TEXT-DECORATION: none
}
.Outline1 {
FONT-SIZE: 9pt; MARGIN-LEFT: 24pt; TEXT-INDENT: -36pt; LINE-HEIGHT: 15pt; FONT-FAMILY: "宋體"; TEXT-DECORATION: none
}
.Outline11 {
FONT-SIZE: 9pt; MARGIN-LEFT: 38pt; TEXT-INDENT: -50pt; LINE-HEIGHT: 15pt; FONT-FAMILY: "宋體"; TEXT-DECORATION: none
}
.passage0 {
FONT-SIZE: 9pt; MARGIN-LEFT: 15pt; TEXT-INDENT: -28pt; LINE-HEIGHT: 15pt; FONT-FAMILY: "宋體"; TEXT-DECORATION: none
}
.passage1 {
FONT-SIZE: 9pt; MARGIN-LEFT: 24pt; TEXT-INDENT: -36pt; LINE-HEIGHT: 15pt; FONT-FAMILY: "宋體"; TEXT-DECORATION: none
}
.passage11 {
FONT-SIZE: 9pt; MARGIN-LEFT: 38pt; TEXT-INDENT: -50pt; LINE-HEIGHT: 15pt; FONT-FAMILY: "宋體"; TEXT-DECORATION: none
}
.passage111 {
FONT-SIZE: 9pt; MARGIN-LEFT: 51pt; TEXT-INDENT: -64pt; LINE-HEIGHT: 15pt; FONT-FAMILY: "宋體"; TEXT-DECORATION: none
}
</STYLE>
<META content="Microsoft FrontPage 5.0" name=GENERATOR></HEAD>
<BODY vLink=#000000 aLink=#000000 link=#000000 leftMargin=0 topMargin=0
onload=""><!-- 以下為主體內容 -->
<div align="center">
<center>
<TABLE width="100%" border=0 style="border-collapse: collapse" bordercolor="#111111" cellpadding="0" cellspacing="0">
<TBODY>
<TR vAlign=top>
<TD width=32 rowSpan=2></TD>
<TD vAlign=center width=515>
<p align="center"><IMG height=33
src="image/title_learner.gif" width=226></TD>
<TD width=39 rowSpan=2></TD>
</TR>
<TR vAlign=top>
<TD width="515" ><!-- 正文內容 -->
<DIV class=pt10><B>4.3.3 節點匹配路徑XPath</B></DIV>
<DIV></DIV><BR>
<DIV class=pt9>
<P>從上面的例子可以看出,在利用XSL進行轉換的過程中,匹配的概念非常重要。在模板聲明語句xsl:template match =
""和模板應用語句xsl:apply-templates select =
""中,用引號括起來的部分必須能夠精確地定位節點。具體的定位方法則在XPath中給出。</P>
<P>之所以要在XSL中引入XPath的概念,目的就是為了在匹配XML文檔結構樹時能夠準確地找到某一個節點元素。可以把XPath比作文件管理路徑:通過文件管理路徑,可以按照一定的規則查找到所需要的文件;同樣,依據XPath所制定的規則,也可以很方便地找到XML結構文檔樹中的任何一個節點,顯然這對XSLT來說是一個最最基本的功能。</P>
<P>不過,由于XPath可應用于不止一個的標準,因此W3C將其獨立出來作為XSLT的配套標準頒布,它是XSLT以及我們后面要講到的XPointer的重要組成部分。</P>
<P>在介紹XPath的匹配規則之前,我們先來看一些有關XPath的基本概念。</P>
<P>首先要說的是XPath數據類型。XPath可分為四種數據類型:
<OL>
<LI><STRONG>節點集(node-set)<BR></STRONG>節點集是通過路徑匹配返回的符合條件的一組節點的集合。其它類型的數據不能轉換為節點集。
<LI><STRONG>布爾值(boolean)<BR></STRONG>由函數或布爾表達式返回的條件匹配值,與一般語言中的布爾值相同,有true和false兩個值。布爾值可以和數值類型、字符串類型相互轉換。
<LI><STRONG>字符串(string)<BR></STRONG>字符串即包含一系列字符的集合,XPath中提供了一系列的字符串函數。字符串可與數值類型、布爾值類型的數據相互轉換。
<LI><STRONG>數值(number)<BR></STRONG>在XPath中數值為浮點數,可以是雙精度64位浮點數。另外包括一些數值的特殊描述,如非數值NaN(Not-a-Number)、正無窮大infinity、負無窮大-infinity、正負0等等。number的整數值可以通過函數取得,另外,數值也可以和布爾類型、字符串類型相互轉換。
</LI></OL>
<P>其中后三種數據類型與其它編程語言中相應的數據類型差不多,只是第一種數據類型是XML文檔樹的特有產物。</P>
<P>另外,由于XPath包含的是對文檔結構樹的一系列操作,因此搞清楚XPath節點類型也是很必要的。回憶一下第二章中講到的XML文檔的邏輯結構,一個XML文件可以包含元素、CDATA、注釋、處理指令等邏輯要素,其中元素還可以包含屬性,并可以利用屬性來定義命名空間。相應地,在XPath中,將節點劃分為七種節點類型:
<OL>
<LI><STRONG>根節點(Root
Node)<BR></STRONG>根節點是一棵樹的最上層,根節點是唯一的。樹上其它所有元素節點都是它的子節點或后代節點。對根節點的處理機制與其它節點相同。在XSLT中對樹的匹配總是先從根節點開始。
<LI><STRONG>元素節點(Element
Nodes)<BR></STRONG>元素節點對應于文檔中的每一個元素,一個元素節點的子節點可以是元素節點、注釋節點、處理指令節點和文本節點。可以為元素節點定義一個唯一的標識id。<BR>元素節點都可以有擴展名,它是由兩部分組成的:一部分是命名空間URI,另一部分是本地的命名。
<LI><STRONG>文本節點(Text
Nodes)<BR></STRONG>文本節點包含了一組字符數據,即CDATA中包含的字符。任何一個文本節點都不會有緊鄰的兄弟文本節點,而且文本節點沒有擴展名。
<LI><STRONG>屬性節點(Attribute
Nodes)<BR></STRONG>每一個元素節點有一個相關聯的屬性節點集合,元素是每個屬性節點的父節點,但屬性節點卻不是其父元素的子節點。這就是說,通過查找元素的子節點可以匹配出元素的屬性節點,但反過來不成立,只是單向的。再有,元素的屬性節點沒有共享性,也就是說不同的元素節點不共有同一個屬性節點。<BR>對缺省屬性的處理等同于定義了的屬性。如果一個屬性是在DTD聲明的,但聲明為#IMPLIED,而該屬性沒有在元素中定義,則該元素的屬性節點集中不包含該屬性。<BR>此外,與屬性相對應的屬性節點都沒有命名空間的聲明。命名空間屬性對應著另一種類型的節點。
<LI><STRONG>命名空間節點(Namespace
Nodes)<BR></STRONG>每一個元素節點都有一個相關的命名空間節點集。在XML文檔中,命名空間是通過保留屬性聲明的,因此,在XPath中,該類節點與屬性節點極為相似,它們與父元素之間的關系是單向的,并且不具有共享性。
<LI><STRONG>處理指令節點(Processing Instruction
Nodes)<BR></STRONG>處理指令節點對應于XML文檔中的每一條處理指令。它也有擴展名,擴展名的本地命名指向處理對象,而命名空間部分為空。
<LI><STRONG>注釋節點(Comment Nodes)<BR></STRONG>注釋節點對應于文檔中的注釋。<BR></LI></OL>
<P>下面,我們來構造一棵XML文檔樹,作為后面舉例的依托:</P>
<DIV align=center>
<CENTER>
<TABLE width="80%" border=1>
<TBODY>
<TR>
<TD width="100%"><A id="a1"><BR> <B
id="b1"><BR> <C
id="c1"><BR> <B
name="b"/><BR> <D
id="d1"/><BR> <E
id="e1"/><BR> <E
id="e2"/><BR> </C><BR>
</B><BR> <B id="b2"/><BR> <C
id="c2"><BR> <B/><BR>
<D id="d2"/><BR> <F/><BR>
</C><BR>
<E/><BR></A></TD></TR></TBODY></TABLE></CENTER></DIV>
<P>現在,我們就來介紹一些XPath中節點匹配的基本方法。
<OL>
<LI><STRONG>路徑匹配</STRONG><BR>路徑匹配與文件路徑的表示相仿,比較好理解。有以下幾個符號:<BR>
<TABLE width="90%" border=1>
<TBODY>
<TR>
<TD align=middle width="10%"><STRONG>符 號</STRONG></TD>
<TD align=middle width="30%"><STRONG>含 義</STRONG></TD>
<TD align=middle width="15%"><STRONG>舉 例</STRONG></TD>
<TD align=middle width="55%"><STRONG>匹配結果</STRONG></TD></TR>
<TR>
<TD align=middle width="10%" rowSpan=2>/</TD>
<TD width="30%" rowSpan=2>指示節點路徑</TD>
<TD width="15%">/A/C/D</TD>
<TD width="55%">節點"A"的子節點"C"的子節點"D",即id值為d2的D節點</TD></TR>
<TR>
<TD width="15%">/</TD>
<TD width="55%">根節點</TD></TR>
<TR>
<TD align=middle width="10%" rowSpan=2>//</TD>
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -