?? 4-2-1.cfm.htm
字號:
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<title>Microsoft Index Server</title>
<meta name="GENERATOR" content="Microsoft FrontPage 3.0">
</head>
<body>
<font FACE="宋體" SIZE="5"><b>
<p ALIGN="JUSTIFY">Microsoft Index Server</p>
</b></font><font FACE="宋體" SIZE="3">
<p ALIGN="JUSTIFY">在你訪問一個站點時,Microsoft Index Server能給你提供一些常用的功能,例如:“Search
The Web Site”。 Microsoft Index Server能為運行Internet Information Server(IIS)的服務器提供綜合的內容索引。你可以生成這個一個查詢,例如:“在網頁中查找包含關鍵字Index和Internet的內容。”
這個索引服務器還可以索引不同語言的文檔。</p>
<p ALIGN="JUSTIFY">如果你的服務器的文檔是Word或Execl格式,那會出現什么情況呢?
這些文檔也可以被索引服務器索引,-這個功能對那些雇員查詢不必要在Inernet上發布的文檔是很有標準的。</p>
<p ALIGN="JUSTIFY">傳統的索引工具都是一些昂貴的軟件,同時也很難安裝。但是,Microsoft
Index Server是免費的,是WINDOWS NT 4。0的一個可以下載的組件。這就意味著,如果你的組織有NT
4.0的服務器,你就可以在你的局域網Internat上以它原來的格式直接訪問這臺服務器上任何文檔了,而不需要把所有的東西都轉換成HTML代碼。</p>
<b>
<p ALIGN="JUSTIFY">注意</p>
</b>
<p ALIGN="JUSTIFY">要得到Microsoft Index Server的附加信息,參看微軟的站點:
</font><a HREF="javascript:if(confirm('http://www.microsoft.com/windows/common/contentNTSI \n\n文件并未按 Teleport Pro 取回, 因為 它的域或路徑超過啟始網址中設定的范圍。 \n\n你要從服務器上打開它嗎? '))window.location='http://www.microsoft.com/windows/common/contentNTSI'" tppabs="http://www.microsoft.com/windows/common/contentNTSI"><font FACE="宋體"
SIZE="3" COLOR="#0000ff"><u>www.microsoft.com/windows/common/contentNTSI</u></font></a><font
FACE="宋體" SIZE="3">。</p>
<p ALIGN="JUSTIFY">Microsoft Index Server的一個關鍵的特征就是自動維護。一旦他被安裝好以后,Microsoft
Index Server就能提供24小時的服務。他在后臺運行,能優化資源,當文件更新時,索引也會更新,當發生錯誤時,他還能自動恢復。</p>
<p ALIGN="JUSTIFY">使用Microsoft Index Server可以進行一次查詢。用戶輸入一個查詢命令行,告訴他你要檢索的東西,就可以在一個目錄下進行檢索。</p>
<p ALIGN="JUSTIFY">這些就是Microsoft Index Server的包括的查詢特征:</p>
<blockquote>
<blockquote>
<p ALIGN="JUSTIFY">.全文本索引。搜索整個句子或段落。</p>
<p ALIGN="JUSTIFY">按照屬性查詢。
搜索在某一個特定的時間內產生有一定的文件大小的HTML文件,
等等。</p>
<p ALIGN="JUSTIFY">“Fuzzy”查詢。 使用類似LIKE的操作,符來查找和你只知道大概的名字的東西。</p>
<p ALIGN="JUSTIFY">高級查詢。在你的查詢語句中,使用NEAR(指示在其他單詞旁邊的近似的單詞),數字操作符(<,=,>),邏輯操作符(AND,OR,NOT)。</p>
<p ALIGN="JUSTIFY">遵守安全規則。用戶只可以訪問那些他們有權限訪問的文檔。</p>
<p ALIGN="JUSTIFY">管理員工具。NT服務器的管理員工具和Microsoft Index
Server是集成在一起的,這樣你就可以監視運行了多少的查詢,服務器的性能,等等。</p>
</blockquote>
</blockquote>
</font><font FACE="宋體"><b>
<p ALIGN="JUSTIFY">Index Server是如何工作的</p>
</b></font><font FACE="宋體" SIZE="3">
<p ALIGN="JUSTIFY">Index Server是如何工作的?
管理員功能可以配置那些可以被搜索的文檔的范圍。這些文件可以在一個子目錄下,也可以分布在很多的網絡目錄下。這樣的文件主體被成為一個全集。Index
Server可以在這個全集下搜索文檔,然后把文本內容從其中取出。例如,一個
Microsoft PowerPoint格式的內容會從其中過濾掉。這些被過濾的輸出被送到一個被稱為word
breaker的軟件。這是很多WEB搜索引擎的通用功能。這個輸出也可以對noise
words進行過濾,也就是那些沒有什么意義的單詞,例如:a, an, the, is
,等等。</p>
</font><font FACE="宋體"><b>
<p ALIGN="JUSTIFY">基本查詢特征</p>
</b></font><font FACE="宋體" SIZE="3">
<p ALIGN="JUSTIFY">每一個查詢包括三個要素:在哪里搜索,要搜索什么,和你要搜索那種信息。</p>
<p ALIGN="JUSTIFY">一個query scope說明要搜索的文本的范圍。一個IIS WEB站點和一個虛擬的根目錄是相對應的,他也會一個物理存儲空間對應,例如:一個目錄或一個目錄和驅動器的列表。
/Spreadsheets和/Documents是在服務器上的兩個虛擬根目錄的例子。</p>
<p ALIGN="JUSTIFY">Index Server查詢會他所查到的信息傳輸給客戶端。例如,
一個200條的查詢結果,你可以在用10個網頁來顯示,每一個網頁顯示20條記錄。這個表格也可以允許客戶說明每個屏幕要顯示的記錄的條數。</p>
<p ALIGN="JUSTIFY">Index Server也可以建立文檔的摘要,他也可以返回一個記錄集。這個摘要是一個文檔的簡單總結,它可以告訴客戶某一個文檔的大概內容。你經常可以在Yahoo或其他的Internet搜索引擎的搜索結果上看到!
</p>
<b>
<p ALIGN="JUSTIFY">圖4.6 查詢結果的例子</p>
</b>
<p ALIGN="JUSTIFY"> </p>
<p ALIGN="JUSTIFY"> </p>
<p ALIGN="JUSTIFY"> </p>
</font><font FACE="宋體"><b>
<p ALIGN="JUSTIFY">索引過程</p>
</b></font><font FACE="宋體" SIZE="3">
<p ALIGN="JUSTIFY">索引過程包括三個主要的步驟:過濾,單詞分隔,和數據格式化。</p>
<p ALIGN="JUSTIFY">當這個系統開始操作一個文檔,他會在處理的過程中,確認這個文檔的類型,
使用合適的過濾器。一個內容過濾器是一個能只知道讀自己認識的內容的應用程序。他會把文本內容從文檔中取出,然后把它們以系統能認識的格式傳送給Index
Server。</p>
<p ALIGN="JUSTIFY">除了能取出文本塊以外,內容過濾器的另一個很重要的功能就是認出在文檔中的語言轉換。有文檔格式就指出了它所使用的特殊的文本塊的格式。如果存在這些標識,內容過濾器會根據這些標識來正除了這些文本。例如,例如過濾器遇到了一個用法語寫的段落,這一段文本會被用French來標識出來。Index
Server會根據這些語言標識來調用合適的單詞檢查器,和格式化成正常的語言。</p>
<p ALIGN="JUSTIFY">Index Server不但可以索引在Word中的文檔,也可以處理那些嵌在Word文檔中的Microsoft
Execl頁面。</p>
<p ALIGN="JUSTIFY">因為有好幾千種應用程序和它的數據格式,而且文檔的格式改變得很頻繁,但是,在開放的IFilter
Interface標準中,微軟已經把這些文件過濾器的編程接口標準化了。這些在Index
Server和其他部分之間的標準接口說明了要如何使用內容過濾器。
微軟也允許其他的公司編寫他們的數據的內容過濾器。這也意味著,那些最熟悉這些數據格式的人來編寫這種格式的內容過濾器。</p>
<p ALIGN="JUSTIFY">在完成過濾操作以后,下一個重要的任務就是進行單詞分隔。Index
Server是對單詞進行索引,而不是對字符進行索引,所以他必須能在一個字符串中認出這個單詞。人們很容易在一個字符系列中查出這個單詞,但是在這個任務對計算機來說是一種很難的工作。不同的語言處理單詞和單詞間的間隔的方式都不同。許多語言使用空格或點號來指示單詞的分隔符。其他的語言,例如,日語不使用空格來作為單詞的分隔。</p>
<p ALIGN="JUSTIFY">Index Server提供了與一種語言有關的,能從一個字符流中取出有效的單詞的單詞分隔符。這些模塊懂得一種特別的語言的結構和符號,他們可以把這些文本分析成獨立的單詞。Index
Server提供了下列語言的單詞分析器:英語,法語,德語,西班牙語,意大利語,和瑞典語。</p>
<p ALIGN="JUSTIFY">內容過濾器和單詞分析器都是標準的組件。獨立軟件商都使用開放的標準,建立他們自己的單詞分析器,然后插入他們的系統。這使其他的軟件商提供那些現在不被Index
Server所支持的語言工具。</p>
<p ALIGN="JUSTIFY">索引的最后一部分是文本格式化。文本格式化會把單詞分析中出現的多于的部分刪除。文本格式化也能為Index
Server提供光滑的文本。</p>
</font><font FACE="宋體"><b>
<p ALIGN="JUSTIFY">容錯處理</p>
</b></font><font FACE="宋體" SIZE="3">
<p ALIGN="JUSTIFY">容錯對一個WEB站點來說是很重要的。如果系統在同時處理好幾百個文檔時,一個硬件出現了錯誤,他不需要被迫重新索引全部的文檔。Index
Server的設計中也包括了可恢復性。當系統在發生錯誤和進行過磁盤整理之后,重新啟動時,Index
Server會對所有的索引進行全面的檢查,他和NT文件系統具有一樣的可恢復性和日志特征。</p>
</font>
</body>
</html>
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -