?? 633.txt
字號:
發信人: zrs (tita), 信區: DataMining
標 題: XML與面向Web的數據挖掘技術3
發信站: 南京大學小百合站 (Thu May 9 09:14:47 2002)
XML與面向Web的數據挖掘技術
2001-12-21· ·徐振航、劉莉芹··Yesky
(4)國際化。標準國際化,且支持世界上大多數文字。這源于依靠它的統一代碼的新
的編碼標準,這種編碼標準支持世界上所有以主要語言編寫的混合文本。在HTML中,就大
多數字處理而言,一個文檔一般是用一種特殊語言寫成的,不管是英語,還是日語或阿拉
伯語,如果用戶的軟件不能閱讀特殊語言的字符,那么他就不能使用該文檔。但是能閱讀
XML語言的軟件就能順利處理這些不同語言字符的任意組合。因此,XML不僅能在不同的計
算機系統之間交換信息,而且能跨國界和超越不同文化疆界交換信息。
3.XML在Web數據挖掘中的應用
XML已經成為正式的規范,開發人員能夠用XML的格式標記和交換數據。XML在三層架構
上為數據處理提供了很好的方法。使用可升級的三層模型,XML可以從存在的數據中產生出
來,使用XML結構化的數據可以從商業規范和表現形式中分離出來。數據的集成、發送、處
理和顯示是下面過程中的每一個步驟:
促進XML應用的是那些用標準的HTML無法完成的Web應用。這些應用從大的方面講可以
被分成以下四類:需要Web客戶端在兩個或更多異質數據庫之間進行通信的應用;試圖將大
部分處理負載從Web服務器轉到Web客戶端的應用;需要Web客戶端將同樣的數據以不同的瀏
覽形式提供給不同的用戶的應用;需要智能Web代理根據個人用戶的需要裁減信息內容的應
用。顯而易見,這些應用和Web的數據挖掘技術有著重要的聯系,基于Web的數據挖掘必須
依靠它們來實現。
XML給基于Web的應用軟件賦予了強大的功能和靈活性,因此它給開發者和用戶帶來了
許多好處。比如進行更有意義的搜索,并且Web數據可被XML唯一地標識。沒有XML,搜索軟
件必須了解每個數據庫是如何構建的,但這實際上是不可能的,因為每個數據庫描述數據
的格式幾乎都是不同的。由于不同來源數據的集成問題的存在,現在搜索多樣的不兼容的
數據庫實際上是不可能的。XML能夠使不同來源的結構化的數據很容易地結合在一起。軟件
代理商可以在中間層的服務器上對從后端數據庫和其它應用處來的數據進行集成。然后,
數據就能被發送到客戶或其他服務器做進一步的集合、處理和分發。XML的擴展性和靈活性
允許它描述不同種類應用軟件中的數據,從描述搜集的Web頁到數據記錄,從而通過多種應
用得到數據。同時,由于基于XML的數據是自我描述的,數據不需要有內部描述就能被交換
和處理。利用XML,用戶可以方便地進行本地計算和處理,XML格式的數據發送給客戶后,
客戶可以用應用軟件解析數據并對數據進行編輯和處理。使用者可以用不同的方法處理數
據,而不僅僅是顯示它。XML文檔對象模式(DOM)允許用腳本或其他編程語言處理數據,數
據計算不需要回到服務器就能進行。XML可以被利用來分離使用者觀看數據的界面,使用簡單靈活開放的格式,可以給Web創建功能強大的應用軟件,而原來
這些軟件只能建立在高端數據庫上。另外,數據發到桌面后,能夠用多種方式顯示。
--
※ 來源:.南京大學小百合站 http://bbs.nju.edu.cn [FROM: 218.0.249.231]
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -