?? -
字號:
作者:一面湖水
日期:2000-1-17 5:02:01
*** 數(shù)據(jù)倉庫解決方案指南
作者:Sybase軟件(北京)有限公司 市場部副總監(jiān) 夏紅
內(nèi)容:數(shù)據(jù)倉庫概念,Sybase的數(shù)據(jù)倉庫解決方案
--------------------------------------------------------------------------------
數(shù)據(jù)倉庫的概念
任何一個公司和企業(yè),在訂貨、存貨清單、票據(jù)清單、帳目清算、客戶服務(wù)以及
財務(wù)報告等方面都存在大量的業(yè)務(wù)應(yīng)用和技術(shù)環(huán)節(jié)。數(shù)據(jù)倉庫的作用在于:從這
些應(yīng)用系統(tǒng)中獲取信息并轉(zhuǎn)換到一個新的數(shù)據(jù)庫,通過對新庫中的歷史信息和面
向主題的信息進行分析,為決策提供支持。以往的產(chǎn)品系統(tǒng),如訂貨或購置系統(tǒng),
則很難從中獲得有關(guān)商業(yè)發(fā)展?fàn)顩r的信息。
數(shù)據(jù)倉庫是企業(yè)決策支持的一部分。在做出下一個決定前,每個商業(yè)機構(gòu)中的行
政人員和分析人員都需要將許多關(guān)鍵商業(yè)問題搞清楚,例如:哪些產(chǎn)品最有利可
圖?哪些客戶會為我們帶來最大利益?哪些環(huán)節(jié)需要花費很高的費用?哪些市場活動
運行得最好,為什么?我們有可能會失去哪些客戶,為什么? 這些都是數(shù)據(jù)倉庫要
回答的“百萬利潤”問題,也同時是一個最大的市場。據(jù) Gartner估計,60% 的關(guān)
系數(shù)據(jù)庫管理系統(tǒng)被用作決策支持系統(tǒng)的應(yīng)用開發(fā)。
數(shù)據(jù)倉庫與數(shù)據(jù)集市的比較
在二十世紀(jì)八十年代中期,Bill Inmon首次提出“數(shù)據(jù)倉庫”這一名詞。它最初被
設(shè)計為一個商業(yè)數(shù)據(jù)庫, 具有穩(wěn)定性(主要成分不變)、歷史性(包含歷史信息)和面
向主題(信息由客戶、產(chǎn)品和市場等組成)等特點。這些最初的“數(shù)據(jù)倉庫”根據(jù)
對客戶、產(chǎn)品、銷售情況和財務(wù)狀況等信息的分析,得到對企業(yè)活動的整體認識。
要建立一個數(shù)據(jù)倉庫,一般分為四個步驟:
第一步:數(shù)據(jù)庫設(shè)計,即設(shè)計出一個包含商業(yè)數(shù)據(jù)和信息的數(shù)據(jù)庫,為商業(yè)實體
所用;
第二步:開發(fā)數(shù)據(jù)抽取和轉(zhuǎn)換程序,從產(chǎn)品系統(tǒng)中將數(shù)據(jù)取出后放入數(shù)據(jù)倉庫中;
第三步:開發(fā)數(shù)據(jù)加載和更新技術(shù),使得在產(chǎn)品數(shù)據(jù)發(fā)生變化時,數(shù)據(jù)倉庫得到
動態(tài)實時的更新;
第四步:購置查詢和報表生成工具,令使用者通過企業(yè)內(nèi)部網(wǎng)和個人計算機很方
便地獲取信息。
多年以來客戶發(fā)現(xiàn):盡管企業(yè)級數(shù)據(jù)倉庫很有吸引力,但是具體操作起來有些難
度。1996年“IDC研究”調(diào)查結(jié)果表明:盡管為建立數(shù)據(jù)倉庫平均投入了三年多
時間和近320萬美元,50%沒有達到應(yīng)有的效果。從項目開始算起,三年后,大多
數(shù)商人發(fā)現(xiàn)所面臨的商業(yè)問題已經(jīng)不再是開始建立時的樣子,發(fā)生了很大變化。
另外,盡管開發(fā)進度被延長了一年又一年,仍然做不到讓所有感興趣的客戶對想
看到什么信息給出明確的需求定義。因而“企業(yè)數(shù)據(jù)模型”的確立如同練習(xí)一樣
進行了一年又一年。
在最近的18-24個月的時間里,出現(xiàn)了一種新的解決辦法,那就是數(shù)據(jù)集市。數(shù)據(jù)
集市也是一種數(shù)據(jù)倉庫,只是它更精練,更面向主題。Sybase公司自創(chuàng)立以來,
便確立了在數(shù)據(jù)集市技術(shù)上的領(lǐng)導(dǎo)地位。目前,使用Sybase產(chǎn)品的2萬多家客戶中
的大多數(shù)已經(jīng)建立了運行在SQL Server上的數(shù)據(jù)集市,盡管通常也稱為數(shù)據(jù)倉庫,
卻幾乎沒有一個是企業(yè)級的。
數(shù)據(jù)集市的優(yōu)勢在于建設(shè)周期的縮短和費用上的大大降低。其中周期以月代替了年,
費用從幾百萬下降到一百萬。由于整個企業(yè)的數(shù)據(jù)很龐大,真正將它們集中到一個
數(shù)據(jù)庫中幾乎是不可能的。有人便對很多大數(shù)據(jù)倉庫實質(zhì)上是不是數(shù)據(jù)集市產(chǎn)生了
懷疑。使用數(shù)據(jù)集市后。設(shè)計、抽取、轉(zhuǎn)換、加載和查詢等環(huán)節(jié)變得更加簡單,因
為客戶中的一部分人能夠更精確地知道他們自己所需要的信息是什么。
然而,如果有很多的數(shù)據(jù)集市卻不能使它們保持同步,數(shù)據(jù)集市解決方案就會遇到
困難。一旦一個單位創(chuàng)建了兩個或兩個以上的數(shù)據(jù)集市,最大的問題就是如何使它
們之間協(xié)調(diào)一致,如何使它們實時操作,以及如何維護所有的數(shù)據(jù)抽取和轉(zhuǎn)換。另
外,當(dāng)一個單位要創(chuàng)建兩個或兩個以上的數(shù)據(jù)集市時,會發(fā)現(xiàn)每一個都要經(jīng)過一個
重新的設(shè)計、抽取、加載和查詢步驟。于是,在面對多個數(shù)據(jù)集市的開發(fā)時,如何
共享設(shè)計和結(jié)構(gòu)成為一個有現(xiàn)實意義和挑戰(zhàn)性的問題。
運作型數(shù)據(jù)存儲與合并式數(shù)據(jù)倉庫
針對上述問題,一種解決方案是采用一種全新的數(shù)據(jù)倉庫概念 ---“運作型數(shù)據(jù)存
儲 (Operational Data Store,ODS)”。在ODS方式下,數(shù)據(jù)被從業(yè)務(wù)數(shù)據(jù)庫中復(fù)制到
一個中心位置,再從這里被抽取到多個數(shù)據(jù)集市中。ODS是從客戶、產(chǎn)品和其他商
業(yè)角度來組織的,被稱為商業(yè)狀況的“實時快照”。它不包含歷史信息,但可以很
容易地滿足一個歷史數(shù)據(jù)庫或一組面向主題的數(shù)據(jù)集市的需要。
我們一般稱之為“合并式數(shù)據(jù)倉庫”,因為它在進入決策支持?jǐn)?shù)據(jù)庫以前是一個信
息的結(jié)合點。ODS雖小,卻能被經(jīng)常地修改,因而非常適合于建立在Adaptive Server
Enterprise 和 Replication Server上。
多維或OLAP(聯(lián)機分析處理)市場
作為數(shù)據(jù)倉庫應(yīng)用環(huán)節(jié)中的一部分,在市場份額上得到快速增長,變得越來越大。
簡單來說,OLAP是從商業(yè)角度進行信息組織,而不象通常的由行、列和表構(gòu)成。
例如,在一個類似 Arbor 或 Oracle Express 的 OLAP數(shù)據(jù)中,信息是通過客戶、產(chǎn)
品、日期、銷售部門和地域等屬性來存取的,這對于數(shù)據(jù)理解和信息獲取來說都
顯得非常直觀。
OLAP產(chǎn)品取得關(guān)系數(shù)據(jù)后,將它放入一個非常簡單的表格中,使之很容易分析。
數(shù)據(jù)庫和一個OLAP產(chǎn)品可被看做一個多維表格。這個市場相當(dāng)熱門,Arbor、
Oracle的 Express 和 Microstrategy 在此領(lǐng)域中各占一席之地,而 Sybase的 Power
Dimentions (原名whitelight),Cognos的 Impromptu 和 Powerplay,Brio Technology 的
BrioQuery處于優(yōu)勢地位。
競爭對手與合作伙伴一覽
RDBMS公司:Sybase,Oracle,IBM,Teradata/NCR,Informix,Microsoft
硬件公司:IBM,Teradata,Sun,Digital/Compaq,HP
轉(zhuǎn)換工具:VMARK,Infomatica,Carleton/Apertus,ETZ,Prism Solutions
OLAP:Sybase/PowerDimentions,Arbor,Oracle/Express,Microstrategy,
Infomation Advantage。
Sybase 的解決方案及其組成
Sybase擁有一個獨特而強有力的點對點方案,用來設(shè)計、建立和管理數(shù)據(jù)倉庫和數(shù)
據(jù)集市。各個部門之間通過集中的元數(shù)據(jù)進行交互,這便具有了完整性、集中性和
靈活性等特點。我們的工具也具有很多優(yōu)越性能。
下表列出了各個組成部分:
(1)PowerDesigner Warehouse Architect
PowerDesigner不但是業(yè)界知名的數(shù)據(jù)庫設(shè)計工具,也是數(shù)據(jù)倉庫模型設(shè)計工具。其
中的 Warehouse Architect模塊支持多種數(shù)據(jù)倉庫模型,包括星型模式、雪花模式、以
及雪暴模式。這是同行業(yè)中最優(yōu)秀、最靈活的開發(fā)工具,可用來設(shè)計一個關(guān)系的或
OLAP的軟件倉庫。PowerDesigner在數(shù)據(jù)倉庫設(shè)計工具市場中占有最大份額。它能從
已有的數(shù)據(jù)庫進行反向工程,從運行系統(tǒng)中將現(xiàn)存的數(shù)據(jù)結(jié)構(gòu)抽取出來形成數(shù)據(jù)模
型,使設(shè)計變得簡單。
(2) PowerStage
強大的數(shù)據(jù)抽取和數(shù)據(jù)轉(zhuǎn)換產(chǎn)品。它是領(lǐng)導(dǎo)市場的客戶/服務(wù)器轉(zhuǎn)換方法,使數(shù)據(jù)倉
庫模型用PowerDesigner實現(xiàn)起來更加容易,更加直觀。PowerStage真正是安全并基于
引擎的。它有一個簡單的面向處理的圖形用戶接口,使得用戶可以快速啟動,重復(fù)
利用以往的工作,從任何源中獲得數(shù)據(jù)。
(3)適用于數(shù)據(jù)倉庫的Adaptive Server for the Warehouse
Adaptive Server for the Warehouse (ASW),是一個包含Adaptive Server Enterprise (ASE)
和Adaptive Server IQ (ASIQ)的新關(guān)系數(shù)據(jù)庫管理系統(tǒng)。它具有一項新的數(shù)據(jù)庫查詢
技術(shù)——直接英文查詢。該產(chǎn)品使得高性能的OLAP和高性能的DSS在同一服務(wù)器
上得到集成。
Adaptive Server IQ,是服務(wù)于數(shù)據(jù)倉庫的最優(yōu)秀關(guān)系數(shù)據(jù)庫管理系統(tǒng),可以對數(shù)據(jù)庫
進行壓縮,也可以以傳統(tǒng)關(guān)系數(shù)據(jù)庫管理系統(tǒng)的10至100倍的速度執(zhí)行快速查詢,使
得數(shù)據(jù)規(guī)模可以達到并超過十億行數(shù)據(jù)。
(4)PowerDimensions
快速、可擴展的聯(lián)機分析工具。 這是業(yè)界中最新的OLAP解決方案,對建立于ASIQ
和ASW數(shù)據(jù)庫的數(shù)據(jù)可以提供快速靈活的多維模型建立和分析。區(qū)別于多維數(shù)據(jù)庫,
Powerdimensions能支持幾百千兆以至萬億字節(jié)的原始數(shù)據(jù)和多個角度。
(5)Intellidex Control Center
對元數(shù)據(jù)和分布式數(shù)據(jù)集市提供點對點集中管理的產(chǎn)品。它是業(yè)界中管理分布式數(shù)據(jù)集
市的唯一的完全點對點的解決方案。作為一個新產(chǎn)品,它提供了建立分布式數(shù)據(jù)集市的
點對點方案,并且從一個中心位置上管理它們,它同時解決了業(yè)界中在元數(shù)據(jù)管理方面
的問題。
(6)SAFE/DW
建立數(shù)據(jù)倉庫的一套完整的測試方法,在世界上得到廣泛應(yīng)用。
(7)Sybase專業(yè)服務(wù)
是一個全球范圍的數(shù)據(jù)倉庫協(xié)作組織,可快速、可靠地設(shè)計和提供數(shù)據(jù)倉庫解決方案。
?? 快捷鍵說明
復(fù)制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -