?? 中文—[3]高校圖書館管理的數據倉庫技術研究.txt
字號:
2004 年3 月西安石油大學學報(自然科學版) M ar. 2004
第19 卷第2 期
Journal of Xi′an ShiyouUniversity (NaturalScience Edition)
Vol. 19No. 2
文章編號: 100125361 (2004)0220071203
高校圖書館管理的數據倉庫技術研
究
Studyof data warehousefor librarymanagementof collegesanduniversities
張旭波1, 屈展2, 李小剛1
(11 西安石油大學計算機學院, 陜西西安 710065; 21 西安石油大學校長辦公室, 陜西西安 710065)
摘要: 高校圖書館管理過程中產生了大量的數據, 應用數據倉庫技術可以從中獲取許多重要的決策
信息. 結合數據倉庫技術的最新研究成果, 論述了高校圖書管理數據倉庫的系統功能、體系結構和
相應的星型數據模型, 給出了典型的MDX 查詢
傳統數據庫系統比較, 它是面向主題的、集成的、非
, 并闡述了它的開發和設計過程.
關鍵詞: 圖書館管理; 數據倉庫; 星型模型
中圖分類號:TP391, G250. 7 文獻標識碼:A
我國高校的圖書館管理普遍從手工操作轉變到
聯機事務處理, 這給師生員工的圖書借閱和圖書館
工作人員的日常工作帶來了極大的方便. 隨著圖書
管理系統功能的不斷改進, 管理人員已經可以利用
它們進行一些初步的統計和分析
易逝的, 是隨時間變化的數據集合, 數據倉庫更注重
準確、安全、可靠的數據抽取和有用、規律性信息的
加工生成.
. 然而, 要進行更高
層次的挖掘和分析, 更充分地利用圖書管理過程中
1 高校圖書管理數據倉庫的系統功能和體系結構
產生的海量數據, 在原來圖書管理系統的基礎上建111 數據倉庫的系統功能
立數據倉庫, 無疑是解決這一問題的有效途徑. (1) 數據倉庫對圖書采購起決策支持作用. 圖書
數據倉庫(DW ,Data W arehouse) 是計算機和采購是圖書館各項業務中最重要的一項, 是各種知
數據庫的應用, 特別是數據庫應用發展到一定階段識資源的主要來源, 只有獲得準確的需求信息, 才能
的必然產物. 在數據庫應用的早期, 計算機系統處理采購到適合讀者需求的書籍[2] . 圖書包括傳統意義
的是從無到有的問題, 是傳統手工業自動化的問題, 上的紙張類圖書和電子類圖書, 合理的圖書采購一
適應這種需要, 當時建成了許多聯機事務處理系統方面能避免重復購置和財力浪費; 另一方面可以使
(OL TP ) , 取得了巨大的經濟效益和社會效益, 館藏緊跟現代科學的發展. 傳統方法獲得的需求信
OL TP 也成為20 世紀80 年代到20 世紀90 年代數息往往缺乏科學論證, 帶有一定的主觀性和盲目性,
據庫應用的主流. 然而, 人們逐漸發現僅依賴聯機事而從出版社、期刊社、書店的新書書目來獲取的信息
務處理系統不足以獲得充足的有用信息, 必須對這并不一定符合本校的實際需求. 通過建立數據倉庫,
些大量的數據進行再加工, 使它們可以用于分析和利用聯機分析處理(OLA P) 和數據挖掘(DM ) 等技
統計, 才能滿足企業和用戶尤其是決策者的需求. 數術可以為文獻采購, 特別是電子類圖書的采購提供
據倉庫是一個以大型數據管理信息系統為基礎, 附科學、合理的各種分析及預測信息.
加在這個數據庫系統之上并存儲了從企業所有業務(2) 數據倉庫可以為圖書館優化服務措施, 改進
數據庫中獲取的綜合數據并能利用這些綜合數據為服務質量提供決策支持. 首先, 通過對大量圖書借閱
用戶提供經過處理后的有用信息的應用系統[1] . 與數據的統計分析, 總結出圖書借閱的規律, 可以動態、
收稿日期: 2003209207
作者簡介: 張旭波(19702), 男, 陜西興平人, 在讀碩士, 主要從事管理信息系統和計算機網絡的研究
.
. 1994-2006 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
—
72
—
西安石油大學學報(自然科學版)
科學地決定各類圖書的最佳編排位置, 既利于讀者幫助用戶或開發人員更好地了解DW 中存放的數
借閱, 也方便圖書館工作人員. 其次, 分析業務量與據, 便于他們更方便地使用和管理.
時間的關系, 可以合理地安排人員和作息時間. (5) 數據應用: 可以進行較復雜的查詢應用, 同
(3) 數據倉庫為高校、院系和班級了解、掌握學時, 可借助一些數據分析工具, 如報表生成工具、
生的學習動態提供信息支持. 采用數據倉庫的多維OLA P 和數據挖掘完成常用的數據表示和分析.
數據庫存儲方式, 能夠包容決策分析所需的大量數
據, 并保證數據的一致性、完整性和安全性, 其分析2 關鍵技術
查詢的高效率和交互式圖形接口的高質量能滿足用211 數據倉庫的概念模型
戶特定信息需求. 通過對學生一學期、一學年甚至兩高校圖書管理數據倉庫在設計時采用星型模型
學年乃至整個大學期間所借圖書的種類和時間
分
來表示多維概念模型, 該模型包括一個“事實表”, 而
析, 有助于了解學生的學習方向、態度及波動情況, “事實表”中的每一維都有一個“維表”. 事實表中的
對于制定和改進教育教學方法和措施很有幫助. 每個元組都包含有指向各個維表的外鍵和一些相應
(4) 數據倉庫為圖書館的數字化提供技術支持. 的測量數據, 維表中的記錄是這一維的屬性.
信息化和數字化是時代發展的趨勢, 作為信息重要(1) 維表的建立. 高校管理人員往往按系別、班
和發展中存在著巨大的技術困難和障礙, 主要原因問題的角度就是所謂的維, 不同的決策人員會從不
是知識更新加快, 各種圖書雜志層出不窮, 如此海量
的信息資源
重重, 而利用數據倉庫則可以對它們進行有效的存
儲、管理, 給用戶提供高效、可靠的特殊查詢和服務
112 高校圖書管理數據倉庫的體系結構
, 運用傳統的數據庫模式進行管理困難的決策要求, 可以通過選取不同的維度來導航到相
載體的圖書館更不例外. 但是, 在數字圖書館的研
究
同的角度看待數據, 圖書借閱數據是多維的, 對不同
級、學生、圖書種類、日期等查詢有關信息, 這種分析
應的目的. 對維度的描述構成了數據倉庫中的維表
. 及維層次表, 不同主題的維度可能共用相同的維表.
由于維的變化將會引起數據倉庫結構的變化, 因此
高校的圖書借閱系統是以單一的數據資源(數在需求分析時應該考慮周全.
據庫) 為中心, 進行聯機事務處理. 而數據倉庫技術(2) 事實表的建立. 對圖書借閱事實的描述構成
則具有分析處理的特點, 是一種結構和哲理性的方了數據倉庫的事實表, 往往是用戶查詢活動的中心
法, 也是一種技術, 而且是存儲數據的一種形式. 高所在. 它包括的數據是從聯機事務處理系統中獲得
校圖書管理數據倉庫作為一個系統, 包括以下4
個
的真實信息, 是對業務行為進行定量衡量的數據, 比
主要部分, 其結構圖如圖1 所示
.
如借閱圖書的數量、種類、日期, 借閱人的姓名、系
別、班級, 庫存圖書的數量、種類, 預約圖書的數量、
種類. 面向不同的主題需建立不同的事實表, 在事實
表中, 除詳細數據外還可進行聚合.匯總數據存儲.
(3)“維表—事實表”構成的星型模型. 維表和事
實表關聯起來可使數據倉庫的復雜查詢直接通過各
圖1 圖書管理數據倉庫的體系結構維的層次比較、上鉆及下鉆等操作完成[3] . 維表和事
(1) 數據定義: 完成數據倉庫的結構和環境的定實表的關聯是通過維度的鍵值來實現的, 事實表是
義, 主要包括定義DW 中數據庫的模式、DW 的數星的中心, 維度則是星的角, 星型圖建模技術可以為數
據源和從數據源提取數據時的規則和模型. 據倉庫建立完善的模型. 圖2 描述了以讀者編號、圖書
(2) 數據提取: 從圖書管理數據庫中提取數據, 編號、日期標識為借閱事實表的列的星型模型.
包括圖書借閱數據、網上圖書預約信息、電子圖書的212 典型MDX 查詢
訪問信息等, 并對獲得的源數據(source data) 進行數據倉庫中的數據有多個維度, 對它們的訪問
加工處理, 使其成為DW 可以管理的數據格式
.
采用多維表達式(MDX),MDX 是一種語法, 支持多
(3) 數據管理: 負責數據的分配和維護, 完成數維對象與數據的定義與操作. 基本MDX 查詢模式
據的轉儲和恢復、安全性定義和檢測等, 并支持數據如下:
應用
.
SELECT [< axis specification>
(4) 數據目錄: 描述DW 中數據的定義和組織
,
[, < axis specification> .
.
]]
. 1994-2006 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
張旭波等: 高校圖書管理的數據倉庫技術研究
—
73
—
圖2 星型模型
FROM [< cube specification> ]
[WHERE [< slicer specification> ]]
在MDX 中, SEL ECT 子句用來選擇要返回的
維度和成員; FROM 子句為查詢指定數據源, 僅被
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -