?? 中文—[2]基于web的數(shù)據(jù)倉庫技術(shù)及其在圖書館中的應(yīng)用.txt
字號:
2004 年4 月第4 期
現(xiàn)代情報
April12004 No. 4
基于Web 的數(shù)據(jù)倉庫技術(shù)及其在圖書館中的應(yīng)用
黃 鶯
(四川大學(xué)公共管理學(xué)院, 成都610064)
〔摘 要〕 本文在分析傳統(tǒng)C/ S 結(jié)構(gòu)數(shù)據(jù)倉庫技術(shù)不足之處的基礎(chǔ)上介紹了基于Web 數(shù)據(jù)倉庫技術(shù)的體系結(jié)構(gòu)、
〔Key words 〕 Web ; data warehouse ; libraries
〔中圖分類號〕G250174 〔文獻標(biāo)識碼〕B 〔文章編號〕1008 -0821 (2004) 04 -0131 -02
優(yōu)勢; 分析了基于Web 數(shù)據(jù)倉庫技術(shù)在圖書館中應(yīng)用的可行性, 以及該技術(shù)的應(yīng)用對圖書館的積極作用
。
〔關(guān)鍵詞〕 Web; 數(shù)據(jù)倉庫; 圖書
館
〔Abstract 〕 The article , based on an analysis of the disadvantages of the traditional
introduces the system structure and advantages of the data warehouse based on Web ;
C/ S structural data wareanalyses the feasibility of
2
house ,
the data warehouse based on Web used in the libraries , and the meaning that the application of the technique produces
■
in the libraries.
儲存海量信息, 以在線分析處理(OLAP) 支持組織機構(gòu)管
理決策的優(yōu)秀功能。隨著對數(shù)據(jù)倉庫技術(shù)的深入研究以及
對實際應(yīng)用中出現(xiàn)的各種問題的分析, 研究者們總結(jié)出了
傳統(tǒng)數(shù)據(jù)倉庫技術(shù)在應(yīng)用中存在的弊端, 繼而針對這些弊
端、應(yīng)數(shù)據(jù)倉庫技術(shù)進一步發(fā)展的要求, 提出了基于Web
的數(shù)據(jù)倉庫的概念。
1 基于Web 的數(shù)據(jù)倉庫技術(shù)
基于Web 的數(shù)據(jù)倉庫技術(shù)繼承傳統(tǒng)數(shù)據(jù)倉庫技術(shù)組織
數(shù)據(jù)的原理和利用OLAP 對組織機構(gòu)的決策支持功能; 它
將數(shù)據(jù)倉庫構(gòu)建在Web 之上, 以充分利用Web 技術(shù)所提供
的信息獲取方便、容易的優(yōu)勢。
111 傳統(tǒng)數(shù)據(jù)倉庫技術(shù)的優(yōu)勢和弊端
傳統(tǒng)的數(shù)據(jù)倉庫能夠建立一種體系化的數(shù)據(jù)存儲環(huán)境,
將分析決策所需的大量數(shù)據(jù)從傳統(tǒng)的操作環(huán)境中分離出來,
使分散的異構(gòu)數(shù)據(jù)轉(zhuǎn)換成集成的、統(tǒng)一的信息, 利用OLAP
和數(shù)據(jù)挖掘(DM) 等工具支持組織機構(gòu)決策。它可以使組
織機構(gòu)各個部門的成員在統(tǒng)一的信息環(huán)境中查詢、利用其
中的數(shù)據(jù)與信息, 可以使高層管理者利用它所提供的決策
支持工具從整體上把握決策所需的全部數(shù)據(jù)和信息。
目前, 很多組織機構(gòu)都把數(shù)據(jù)倉庫構(gòu)建在客戶/ 服務(wù)器
(C/ S) 結(jié)構(gòu)之上。這種結(jié)構(gòu)對于那些對系統(tǒng)安全性、數(shù)據(jù)
保密性要求很高的機構(gòu)而言是很合適的。但是C/ S 結(jié)構(gòu)自
身的特點決定了這種結(jié)構(gòu)下數(shù)據(jù)倉庫技術(shù)在應(yīng)用中存在的
弊端:
11111 客戶端需要安裝專門的客戶端應(yīng)用程序以支持對數(shù)
據(jù)倉庫中數(shù)據(jù)的利用;
11112 建立和維護C/ S 結(jié)構(gòu)的費用高, 而且系統(tǒng)的協(xié)調(diào)性
和兼容性不好;
11113 如果數(shù)據(jù)獲取工具是以信息用戶為中心, 在處理復(fù)
收稿日期: 2003 —11 —14
數(shù)據(jù)倉庫技術(shù)是上個世紀(jì)90 年代發(fā)展起來的一種新興
數(shù)據(jù)庫技術(shù)。今天這一技術(shù)已經(jīng)廣泛地應(yīng)用到電信、制造、
金融以及信息服務(wù)等領(lǐng)域, 并充分顯示了它面向主題組織、
雜記錄、用戶數(shù)量很大或用戶數(shù)量的彈性很大時, 數(shù)據(jù)倉
庫規(guī)模的伸縮性又成為一個突出的問題;
11114 單一的用戶界面不足以支持用戶的多樣化需求和使
1
用
11;
15 由于最近幾年人們在商業(yè)和娛樂方面使用Internet
的經(jīng)驗越來越豐富, 越來越多的信息用戶希望借助Inter2
net/ Intranet 訪問數(shù)據(jù)倉庫, 獲取必要的信息, 傳統(tǒng)的C/ S 結(jié)
構(gòu)是無法滿足這一要求的。
另外在企業(yè)中, 供應(yīng)鏈管理(SCM) 的應(yīng)用使企業(yè)間
的信息流通變得非常重要, 僅僅由企業(yè)內(nèi)部的專業(yè)人士掌
握信息已經(jīng)不能滿足需要, 可存取信息的人員還必須包括
企業(yè)的供應(yīng)商、合作伙伴、地區(qū)代理商、產(chǎn)品使用者。
112 基于Web 的數(shù)據(jù)倉庫技術(shù)工
基于Web 的數(shù)據(jù)倉庫技術(shù)正好彌補上述不足。數(shù)據(jù)倉作
庫提供了整合來源于不同數(shù)據(jù)庫中數(shù)據(jù)的方法, 提供利用研
數(shù)據(jù)來支持管理決策的一系列工具; 利用Web 技術(shù)可以方
究
便、經(jīng)濟地獲取互聯(lián)網(wǎng)上的任何信息, 二者的結(jié)合就產(chǎn)生
了使信息發(fā)布和利用更經(jīng)濟、高效的基于Web 的數(shù)據(jù)倉庫
技術(shù)。
11211 基于Web 的數(shù)據(jù)倉庫技術(shù)的體系結(jié)構(gòu)
筆者認為基于Web 數(shù)據(jù)倉庫技術(shù)的體系結(jié)構(gòu)可以分為
三層: 客戶端、Web 服務(wù)器和應(yīng)用程序服務(wù)器。客戶端只
要求用戶連入Internet 或Intranet 、Extranet , 并使用Web 瀏覽
器, 客戶端的計算機可以建立在任何平臺之上, 客戶端與
服務(wù)器之間通過Internet 、Intranet 、Extranet 連接; 在服務(wù)器
端, Web 服務(wù)器管理客戶端與服務(wù)器之間信息流的輸入、
輸出, 它依靠應(yīng)用程序服務(wù)器端數(shù)據(jù)和數(shù)據(jù)處理工具的支
持。應(yīng)用程序服務(wù)器包括一系列數(shù)據(jù)開發(fā)工具(OLAP 工
具、DM 工具、DSS 工具等) 和數(shù)據(jù)倉庫兩部分, 應(yīng)用程序
服務(wù)器端的OLAP 工具、DM 工具、DSS 工具等通過調(diào)用數(shù)
據(jù)倉庫內(nèi)的數(shù)據(jù)響應(yīng)由Web 瀏覽器傳來的客戶端的查詢、
報表生成等請求。見圖1。
作者簡介: 黃 鶯(1981 —), 女, 現(xiàn)就讀于四川大學(xué)公共管理學(xué)院圖書館學(xué)2002 級研究生班, 研究方向: 現(xiàn)代圖書情報技術(shù)。
—
131
—
. 1994-2006 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
2004 年4 月第4 期
現(xiàn)代情報
April12004 No. 4
圖1 基于Web 的數(shù)據(jù)倉庫的體系結(jié)構(gòu)
11212 基于Web 的數(shù)據(jù)倉庫技術(shù)的優(yōu)勢數(shù)據(jù)倉庫技術(shù)誕生不久, 就有不少人提出把它應(yīng)用到
由圖1 可以看到, 基于Web 的數(shù)據(jù)倉庫技術(shù)采用“瘦”圖書館中。目前國內(nèi)已有許多的圖書館建成了數(shù)據(jù)倉庫系
客戶端的方式實現(xiàn)零客戶端管理, 客戶端無需安裝專門的統(tǒng), 在這些數(shù)據(jù)倉庫系統(tǒng)建立和運行過程中積累下來的經(jīng)
■
應(yīng)用程序, 為用戶提供了最便捷的信息獲取途徑。具體來
的最大障礙就是數(shù)據(jù)的安全性問題,
驗, 對問題的總結(jié)是應(yīng)用基于Web 數(shù)據(jù)倉庫技術(shù)的基礎(chǔ)。
說, 基于Web 的數(shù)據(jù)倉庫技術(shù)的優(yōu)勢體現(xiàn)在以下幾個方21113 數(shù)據(jù)和系統(tǒng)的安全性問題
面: 基于Web 的數(shù)據(jù)倉庫技術(shù)在企業(yè)等贏利性機構(gòu)中應(yīng)用
1121211 信息的獲取更簡單、方便
而圖書館在這方面有
任何連入Internet 、Intranet 、Extranet
而無需與數(shù)
的計算機都可以獲它獨到的優(yōu)勢。因為它所收集的信息資源幾乎不涉及機密
利用Web 瀏覽器, 用戶通過互聯(lián)網(wǎng)訪問數(shù)據(jù)倉庫中的
信息而不必關(guān)心自己所使用的平臺。
1121213 建設(shè)和維護成本低
據(jù)倉庫的服務(wù)器相連
。
取基于Web 的數(shù)據(jù)倉庫中的數(shù)據(jù)或應(yīng)用程序,
與平臺無關(guān)1121212
基于Web 的數(shù)據(jù)倉庫采用“瘦”客戶端的方式將許多
應(yīng)用處理移植到應(yīng)用程序服務(wù)器端, 降低對客戶端軟、硬
件的要求, 從而減少了建立系統(tǒng)的成本。而且系統(tǒng)的升級
和維護都在服務(wù)器端進行, 也相應(yīng)地節(jié)省了人力、物力。
當(dāng)然, 組織機構(gòu)在具體實現(xiàn)基于Web 的數(shù)據(jù)倉庫系統(tǒng)
時也面對一些問題和挑戰(zhàn): 服務(wù)器規(guī)模的可伸展性、訪問
工的速度問題、安全性問題等等; 前兩個問題處理不好就會
作
研
影響系統(tǒng)的性能; 而處理不好安全性問題, 就有可能泄露
究組織機構(gòu)的機密數(shù)據(jù)和應(yīng)用程序, 給機構(gòu)帶來很大經(jīng)濟損
失。這是因為: 數(shù)據(jù)倉庫中的數(shù)據(jù)在流過Internet 的時候要
經(jīng)過許多不安全的系統(tǒng); 在Internet 上一些人蓄意攻擊系統(tǒng)
內(nèi)、外部通信網(wǎng)絡(luò)以獲取機密數(shù)據(jù)達到個人的非法目的;
而且Internet 上的病毒也嚴(yán)重威脅數(shù)據(jù)的安全。所以基于
Web 數(shù)據(jù)倉庫技術(shù)在那些對系統(tǒng)安全性要求高的組織機構(gòu)
里應(yīng)用的可行性較低。
2 基于Web 的數(shù)據(jù)倉庫技術(shù)在圖書館中的應(yīng)用
211 圖書館采用基于Web 的數(shù)據(jù)倉庫技術(shù)的可行
性
21111 圖書館的機構(gòu)性質(zhì)和最終目標(biāo)
作為收集、組織、存儲、傳遞信息資源的機構(gòu), 圖書
館采用大量信息技術(shù)的最終目標(biāo)是充分發(fā)揮所收集的海量
?? 快捷鍵說明
復(fù)制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -