?? 11.txt
字號(hào):
發(fā)信人: rlp (阿茲貓), 信區(qū): DataMining
標(biāo) 題: 基于數(shù)據(jù)倉庫的銀行決策支持系統(tǒng)初步分析
發(fā)信站: 南京大學(xué)小百合站 (Sat May 3 06:01:49 2003)
基于數(shù)據(jù)倉庫的銀行決策支持系統(tǒng)初步分析
1 數(shù)據(jù)倉庫技術(shù)的發(fā)展
隨著計(jì)算機(jī)信息系統(tǒng)在全球范圍內(nèi)的廣泛應(yīng)用,許多機(jī)構(gòu)和公司都積累了大量的歷史數(shù)
據(jù).從這些數(shù)據(jù)中,可以研究過去的經(jīng)營狀況、管理狀況,發(fā)現(xiàn)和挖掘可以改進(jìn)的地方,可
使決策者很快地對(duì)自己的經(jīng)營情況做出準(zhǔn)確的評(píng)估,并為制訂計(jì)劃、確定發(fā)展規(guī)劃提供依據(jù)
.然而準(zhǔn)確地從這成堆的歷史數(shù)據(jù)中挖掘、整理出有用的數(shù)據(jù),需要使用新的方法。1990年
Prism Solutions公司W(wǎng). H. Inmon在"Building the Data Warehouse"一書中提出數(shù)據(jù)倉庫
(Data Warehouse)的概念.這一概念和引入聯(lián)機(jī)分析處理(OLAP)方法解決了在信息技術(shù)
發(fā)展中存在的擁有大量數(shù)據(jù)及如何利用其中有價(jià)值信息的問題,為構(gòu)筑合理可行的DSS/EIS
系統(tǒng)提出了解決方案。數(shù)據(jù)倉庫的設(shè)計(jì)是一個(gè)非常重要的基礎(chǔ),國內(nèi)外諸多研究者對(duì)此也提
出了許多建模的規(guī)劃及實(shí)現(xiàn)方法。
近年來,微電子、計(jì)算機(jī)技術(shù)快速發(fā)展,網(wǎng)絡(luò)通訊、操作平臺(tái)與工具、數(shù)據(jù)庫、多媒體(超
媒體)等新興技術(shù)領(lǐng)域,連連取得重大突破與實(shí)用化進(jìn)展;企業(yè)競(jìng)爭(zhēng)的日益激烈為DSS的需
求不斷注入活力,新興技術(shù)的發(fā)展尤其數(shù)據(jù)庫技術(shù)的發(fā)展,以數(shù)據(jù)倉庫(Data Warehouse,
DW)技術(shù)為基礎(chǔ),以在線分析處理(On Line Analytical Processing,OLAP)技術(shù)和數(shù)據(jù)挖
掘(Data Mining,DM)技術(shù)工具為手段的決策支持系統(tǒng)解決方案逐漸成熟。這是一種對(duì)于
DSS問題的更為完整統(tǒng)一的解決途徑,它具有技術(shù)起點(diǎn)高、支持工具強(qiáng)、有廣闊實(shí)用前景等
優(yōu)勢(shì)。
早期的決策支持系統(tǒng)(DSS)在應(yīng)用需求推動(dòng)和人工智能技術(shù)支持下,經(jīng)過長期探索,建立
了一套理想化的框架體系,這就是以數(shù)據(jù)庫(DB)、模型庫(MB)和知識(shí)庫(KB)等"三庫
"為核心的理論體系結(jié)構(gòu)和系統(tǒng)建設(shè)方法。有些系統(tǒng)取得了令人矚目的成績,然而就其總體
而言,以往的系統(tǒng)多數(shù)只能停留在演示階段,錄活性、可用性差,因而不夠?qū)嵱?,未能邁入
大規(guī)模的工業(yè)工程實(shí)踐。多年來,DSS仍然處在設(shè)計(jì)方案與系統(tǒng)規(guī)劃階段,缺乏可操作、可
實(shí)施的技術(shù)、方法和工具。究其原因,概因?yàn)槿狈ωS富的數(shù)據(jù)資源所致,不論是內(nèi)部數(shù)據(jù)還
是外部數(shù)據(jù),操作數(shù)據(jù)還是管理數(shù)據(jù),綜合數(shù)據(jù)還是歷史數(shù)據(jù)統(tǒng)統(tǒng)不足;DSS是面向分析的
,然而分析模型和算法設(shè)計(jì)均缺少堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ);所得少量信息,其關(guān)聯(lián)性又差(如"三
庫"無法有機(jī)結(jié)合),結(jié)果形成信息弧島;最后,缺乏有力的分析工具,無法從外部市場(chǎng)得
到成熟的分析工具產(chǎn)品,多數(shù)為自行開發(fā),力不從心只能就事論事。
數(shù)據(jù)倉庫技術(shù)高性能的數(shù)據(jù)庫服務(wù)器,可處理數(shù)據(jù)量巨大、查詢要求復(fù)雜,且具查詢優(yōu)化機(jī)
制的難題,并行數(shù)據(jù)庫技術(shù),可并行存貯管理超大規(guī)模數(shù)據(jù)庫(VLDB),提供高速度復(fù)雜查
詢的能力;網(wǎng)絡(luò)與數(shù)據(jù)庫的互操作技術(shù),使大量數(shù)據(jù)通過網(wǎng)絡(luò)的傳輸、轉(zhuǎn)化高得簡(jiǎn)易可靠,
這些都為新興的數(shù)據(jù)倉庫技術(shù)的發(fā)展開辟了道路。
數(shù)據(jù)倉庫是面向主題的集成化的穩(wěn)定的、隨時(shí)間變化的數(shù)據(jù)集合,用以支持決策管理的一個(gè)
過程。它是從數(shù)據(jù)庫技術(shù)發(fā)展而來,為決策服務(wù)的數(shù)據(jù)組織、數(shù)據(jù)存貯技術(shù)。數(shù)據(jù)倉庫把數(shù)
據(jù)使用者(企業(yè)的生產(chǎn)經(jīng)營決策者)所關(guān)心的帶有統(tǒng)計(jì)性趨勢(shì)性的數(shù)據(jù),從大量業(yè)已存在的
數(shù)據(jù)庫或業(yè)務(wù)處理過程中集中起來,經(jīng)過加工、提煉和重組,形成新的存貯管理體系-數(shù)據(jù)
倉庫,作為向決策者提供查詢和分析用的集成化信息庫。
數(shù)據(jù)倉庫的信息源具有分布和異構(gòu)的特點(diǎn),主要信息可視為定義在各信息源上的實(shí)體化視圖
集合。數(shù)據(jù)倉庫管理系統(tǒng)把實(shí)體化視圖所對(duì)應(yīng)的數(shù)據(jù)從信息源中提取出來,物理地存貯到
DW中,使之成為物理存貯的數(shù)據(jù)實(shí)體。因此,數(shù)據(jù)倉庫應(yīng)具有兩方面功能,一是從信息源提
取數(shù)據(jù)并加工轉(zhuǎn)化存入DW中;二是在DW上處理用戶查詢與決策分析請(qǐng)求,要盡量避免直接訪
問數(shù)據(jù)源。數(shù)據(jù)倉庫要由不同信息源的數(shù)據(jù)(微數(shù)據(jù))產(chǎn)生綜合數(shù)據(jù),這可由各種聚集操作
(如分類、求和、計(jì)數(shù)等)得到。如何從綜合數(shù)據(jù)恢復(fù)微數(shù)據(jù),以及如何在保持DW及時(shí)增加
新數(shù)據(jù)的同時(shí),又支持對(duì)其數(shù)據(jù)實(shí)施有效存取,都是重要的技術(shù)。
數(shù)據(jù)倉庫是面向主題的,因而適合于決策支持的應(yīng)用。數(shù)據(jù)倉庫中的數(shù)據(jù)是多維的,構(gòu)成多
維數(shù)據(jù)庫,以便于從不同角度觀察分析問題。數(shù)據(jù)倉庫中的數(shù)據(jù)包括:近期基本數(shù)據(jù)(
Current detail data)遠(yuǎn)期基本數(shù)據(jù)(Older detail data)、輕度綜合數(shù)據(jù)(Lightly
summarized data)、高度綜合數(shù)據(jù)(Highly summarized data)和元數(shù)據(jù)(Meta data)。
元數(shù)據(jù)是定義數(shù)據(jù)的數(shù)據(jù),在數(shù)據(jù)倉庫中地位十分重要。建立數(shù)據(jù)倉庫的步驟是:(1)分
析決策需求,確定數(shù)據(jù)來源;(2)定義數(shù)據(jù)結(jié)合轉(zhuǎn)化過程;(3)建立數(shù)據(jù)倉庫;(4)建
立供用戶使用的DW工具。數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)構(gòu),以及DW數(shù)據(jù)服務(wù)器結(jié)構(gòu)已有多種實(shí)現(xiàn)途
徑,主要有:(1)專用的RDBMS,即在索引、掃描、復(fù)雜查詢諸方面,加以特殊處理的
RDBMS;(2)關(guān)系型OLAP用DBMS,即擴(kuò)棄型RDBMS,將多維數(shù)據(jù)的操作映射到標(biāo)準(zhǔn)的關(guān)系型
操作上;(3)多維OLAP用DBMS,可直接實(shí)現(xiàn)對(duì)多維數(shù)據(jù)的管理與操作。
2 銀行決策支持系統(tǒng)建立的必要性
在當(dāng)今信息社會(huì)里,信息正以爆炸的速度增長,面對(duì)來勢(shì)兇猛的信息,人們往往感到無所適
從。事實(shí)上,在這信息海洋里有用的信息比率很低。據(jù)IBM公司的測(cè)算,目前許多企業(yè)花費(fèi)
昂貴代價(jià)建立起來的數(shù)據(jù)庫,真正有用的只有7%,問題就在于怎樣發(fā)現(xiàn)那些真正有用的信息
。就我國的銀行業(yè)而言,每家銀行都有自己龐大的客戶信息庫,可管理人員往往視這個(gè)信息
庫而不見,只注重其量的總和,如存款余額等,而不去研究開發(fā)這個(gè)信息庫的具體內(nèi)容,無
法把數(shù)據(jù)轉(zhuǎn)化為對(duì)企業(yè)有用的信息,導(dǎo)致信息黃金的流失和資源的浪費(fèi),同時(shí)另一方面在其
新開發(fā)的業(yè)務(wù)中又不得不面對(duì)高風(fēng)險(xiǎn)威脅。在信息中搜尋黃金又不被信息表面的假象所迷惑
,不被信息海洋所淹沒,就要采用科學(xué)的方法和工具。
目前我國銀行業(yè)所做的各種信息系統(tǒng)一般都是OLTP系統(tǒng),用于完成各種各樣的柜面業(yè)務(wù),如
儲(chǔ)蓄系統(tǒng)、會(huì)計(jì)系統(tǒng)、信用卡系統(tǒng)等。有些銀行正在開發(fā)集各種柜面業(yè)務(wù)為一體的綜合柜面
業(yè)務(wù)系統(tǒng),這些系統(tǒng)都是OLTP系統(tǒng),重在提高業(yè)務(wù)運(yùn)行管理效率。只要我們對(duì)各家銀行的系
統(tǒng)進(jìn)行分析觀察,就會(huì)發(fā)現(xiàn)各系統(tǒng)的內(nèi)容、模式及所提供的功能基本都是相同的,最多只是
所選軟硬件平臺(tái)的不同,這樣看來各家銀行耗費(fèi)巨資進(jìn)行的都是重復(fù)的開發(fā),沒有把事務(wù)處
理系統(tǒng)外包出去,從事務(wù)處理中擺脫出來,不注重或從沒有查詢和分析已有的各種客戶信息
資料,從中找出潛在有用的信息。
我國各商業(yè)銀行比較長的一段時(shí)間來處在依靠擴(kuò)大規(guī)模、搶占地盤來提高效益的規(guī)模效益階
段。經(jīng)過盲目的機(jī)構(gòu)設(shè)置、地盤搶占、人員投入之后,才發(fā)現(xiàn)實(shí)際產(chǎn)出的效益并沒有達(dá)到期
望的效果。目前國內(nèi)金融機(jī)構(gòu)日益增多,一些外資銀行也已搶灘,競(jìng)爭(zhēng)日趨激烈,擴(kuò)大規(guī)模
已不再是行之有效的經(jīng)營手段。
隨著競(jìng)爭(zhēng)的日益深入,美國商業(yè)銀行中的"深度效益"觀念必將融入我國商業(yè)銀行的管理
策略之中:把客戶細(xì)化為不同的個(gè)體,細(xì)化客戶信息的組織和分析,由分析工具和經(jīng)驗(yàn)選擇
特定的客戶群來劃定戰(zhàn)場(chǎng),跟蹤每位消費(fèi)者個(gè)體以及個(gè)性化的需求,在營銷方面實(shí)施關(guān)系營
銷,由傳統(tǒng)的注重交易轉(zhuǎn)變?yōu)樽⒅乜蛻絷P(guān)系和客戶價(jià)值,從而產(chǎn)生了"關(guān)系銀行"這個(gè)概念。
美國Bank One銀行對(duì)自己的客戶進(jìn)行調(diào)查發(fā)現(xiàn),百分之二十的客戶創(chuàng)造銀行利潤,其它百分
之八十的客戶并沒有給銀行創(chuàng)造利潤。如果我國的銀行對(duì)自己的客戶進(jìn)行調(diào)查,也會(huì)發(fā)現(xiàn)同
樣的結(jié)果,只是百分比不同而已。我們就是要把零散的、無序的、歷史的、當(dāng)前的各種數(shù)據(jù)
集中起來建立數(shù)據(jù)倉庫,從所建立的數(shù)據(jù)倉庫中挖掘出為銀行創(chuàng)造利潤的這部分客戶,從復(fù)
雜的客戶信息中建立模型,對(duì)客戶記錄信息進(jìn)行動(dòng)態(tài)跟蹤和監(jiān)測(cè),計(jì)算客戶價(jià)值,鎖定特定
客戶群,分析潛在客戶群,制定不同市場(chǎng)需求、不同客戶群的市場(chǎng)戰(zhàn)略,根據(jù)客戶的價(jià)值選
定服務(wù)產(chǎn)品配置,從而與創(chuàng)造利潤的優(yōu)良客戶建立長期關(guān)系。美國西部一家銀行測(cè)算以"深
度效益"為指導(dǎo)的促銷為1美元帶來10美元的回報(bào)。
建立數(shù)據(jù)倉庫,進(jìn)行數(shù)據(jù)挖掘是金融監(jiān)管的需要。我國的金融監(jiān)管實(shí)時(shí)性差,嚴(yán)重滯后,東
南亞金融危機(jī)的發(fā)生迫使我國加強(qiáng)和改善金融監(jiān)管,降低我國金融市場(chǎng)的風(fēng)險(xiǎn)。建立數(shù)據(jù)倉
庫,進(jìn)行數(shù)據(jù)挖掘也是商業(yè)銀行生存發(fā)展、提高競(jìng)爭(zhēng)力的需要。我國各商業(yè)銀行提供的服務(wù)
內(nèi)容基本相同,市場(chǎng)競(jìng)爭(zhēng)日益激烈,風(fēng)險(xiǎn)越來越大,僅靠傳統(tǒng)的服務(wù)已不能創(chuàng)造更多的利潤
,為了提高投資的有效性,降低風(fēng)險(xiǎn),就要廣泛收集各方面信息,充分利用已有的各種數(shù)據(jù)
來爭(zhēng)取更多的優(yōu)良客戶,支持決策的科學(xué)性、可靠性。
3建立銀行決策支持系統(tǒng)的原則方案
銀行決策支持系統(tǒng)主要是面對(duì)金融市場(chǎng)上資金的運(yùn)作以及與此相關(guān)的金融和經(jīng)濟(jì)行為。銀行
決策是為了實(shí)現(xiàn)銀行經(jīng)營管理貨幣信用的方向、目標(biāo)、規(guī)劃、政策策略和重大措施所做的考
慮和選擇。為了實(shí)現(xiàn)銀行決策的科學(xué)化,決策必須有明確的目標(biāo),可靠的高質(zhì)量的信息基礎(chǔ)
,優(yōu)選的科學(xué)理論和方法及進(jìn)行反饋和調(diào)整的有效機(jī)制。
管理部門需要及時(shí)地了解銀行的關(guān)鍵數(shù)據(jù),如借貸金額、大宗交易的頻繁程度,以便控制風(fēng)
險(xiǎn),掌握各分行、支行的數(shù)據(jù)匯總,來促進(jìn)管理、提高效率,了解客戶分布狀況和帶來的收
益,并為進(jìn)一步拓展業(yè)務(wù)提供依據(jù)。
3.1需求的確定
數(shù)據(jù)倉庫系統(tǒng)的使用者是銀行各級(jí)的決策和業(yè)務(wù)人員,他們關(guān)心的問題和一般的操作人員不
同。具體說,銀行需要及時(shí)掌握的數(shù)據(jù)包括:儲(chǔ)蓄帳戶余額、含金量、應(yīng)付利息、現(xiàn)金流入
量、現(xiàn)金流出量、現(xiàn)金轉(zhuǎn)入量、現(xiàn)金轉(zhuǎn)出量等等。對(duì)這些數(shù)據(jù)又需要從不同的類別和層次進(jìn)
行統(tǒng)計(jì)與分析:
(1) 事實(shí)(Facts):如儲(chǔ)蓄帳戶余額、含金量、應(yīng)付利息、現(xiàn)金流入量、現(xiàn)金流出量
、現(xiàn)金轉(zhuǎn)入量、現(xiàn)金轉(zhuǎn)出量等。這些數(shù)據(jù)是實(shí)際分析的基礎(chǔ)數(shù)據(jù),它們?nèi)辗e月累,數(shù)量龐大
。
(2) 維(Dimensions):它是事實(shí)信息的屬性,如銀行組織結(jié)構(gòu)營業(yè)網(wǎng)點(diǎn)、業(yè)務(wù)類別、
交易方式、客戶類型、時(shí)間。它們一般變化不大,數(shù)量也相對(duì)較小。
(3) 粒度(Units):它是維劃分的單位,如營業(yè)網(wǎng)點(diǎn)維(分行、支行甚至基層儲(chǔ)蓄所)
、業(yè)務(wù)類別維(活期、整存整取、大額定期、存本取息、定活兩便、POS)、交易方式維(柜員
、ATM、POS、銀聯(lián)、電話、Internet等)、客戶類型維(個(gè)人、全民企業(yè)、集體企業(yè)、外資企
業(yè)、合資企業(yè)、個(gè)體業(yè)主等等)、時(shí)間維(年、季、月、甚至旬、日)。每個(gè)交點(diǎn)就是事實(shí),
即實(shí)際的情況,即×日××網(wǎng)點(diǎn)××資金的運(yùn)作數(shù)據(jù)。如果是兩維的數(shù)據(jù),就是平面;如果
超三維,則構(gòu)成多維超立方體。決策者的查詢無非就是對(duì)事實(shí)立方體按一定的粒度切塊或組
合的過程。事實(shí)和維也不是一成不變的,有時(shí)也會(huì)根據(jù)決策者不同的思考角度而發(fā)生變化。
3.2模型與環(huán)境設(shè)計(jì)
設(shè)計(jì)數(shù)據(jù)倉庫的數(shù)據(jù)模型時(shí),常用的邏輯建模工具是以維數(shù)據(jù)建模來表示事實(shí)、維、粒度的
關(guān)系,結(jié)構(gòu)型式是星形模型和雪花模型.
3.2.1星形模型
模型中間表示資金運(yùn)作情況(事實(shí)),四周表示的是與之相關(guān)維的信息(時(shí)間、客戶、方向
和地域等),每個(gè)維表有自己的屬性,維表和事實(shí)通過維關(guān)鍵字相關(guān)聯(lián).星形模型的核心是
事實(shí)表(FactTable).它是按維進(jìn)行查詢的中心--存儲(chǔ)真實(shí)數(shù)據(jù)即事實(shí)的地方.事實(shí)為數(shù)
字型的屬性,如計(jì)算和數(shù)量,可以求和、求平均、求最大及最小,并且按照各種統(tǒng)計(jì)運(yùn)算進(jìn)
行合計(jì)計(jì)算.事實(shí)屬性包含了適度的、關(guān)于事實(shí)表所管理的內(nèi)容的數(shù)字型值.
使用星形模型的主要原因可提高查詢的性能和便于用戶安排不同的查詢.由于主要數(shù)據(jù)都在
?? 快捷鍵說明
復(fù)制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號(hào)
Ctrl + =
減小字號(hào)
Ctrl + -