?? 28.txt
字號:
反饋及信息收集Reaction
(4) 傳統的決策制定中心是主觀制定決策(JUDGEMENT),主觀決策存在一些不
足,數據挖掘給決策技術帶來了突破。數據挖掘是從廣義的角度講的,包括統計、機器學
習、神經網絡等等。
(5) 預測解析(Predictive Analytics):信用評分技術(Credit Scoring)。
n 內在理解分析(Exploratory Analysis/KDD):模塊識別和相關性分析。
n 決策建模(Decision Modeling):通過圖論方法建立模型,對于給定的一個或
多個決策建立數學關系。
n 策略優化(Strategy Optimization):在給定的一些限制條件下,尋找改進利
潤的最優策略解。
n 策略精調(Strategy Refinement):精調最優策略解,使其穩定可靠,易理解
、易執行。
外部
內部
數據管理
Data MGMT
執行系統Strategy Execution
顧客或潛在顧客
作用于Action
反饋及信息收集Reaction
數據挖掘
預測解析
內在理解
決策建模
策略優化
策略精調
(6) 預測解析:針對不同的信用周期階段和不同的商業目標,建立模型
n 招商:依據風險的招商模型,申請模型,價值模型和響應模型。
n 立戶:風險(壞帳,破產等),離走和利潤定量等。
n 用戶管理:分檔系統,風險預測系統,壞帳、破產預警系統,債量預測模型,
利潤預測模型,欺詐預測模型等。
n 收帳:前期收帳,后期收帳等。
n 總體:損失預測,營利預測,最優組合建立,階梯變壞率預測,等等。
(7) 內在理解分析
n 一般理解分析:變量的相互關系。工具——因子分析、主成分分析、聚類分析
、關聯規則等。
n 特殊理解分析:對給定目標,尋找貢獻或影響的變量。工具——FISHER顯著性
檢驗、參數估計、線性/非線性/LOGISTIC回歸、神經網絡、決策樹等。
(8) 決策建模:對于1個或幾個決策建立圖論模型。從而建立起他們之間的數學關
系。
如下圖所示:假設,β、Φ、μ分別記作 利率、信用量、債務,則
R(收入)= F(X1,…,Xn,β,Φ,μ)
L(損失)= F’(X1,…,Xn,β,Φ,μ)
C(費用)= F’’(X1,…,Xn,β,Φ,μ)
最大利潤 = R(收入)max(β,Φ,μ) - L(損失)min(β,Φ,μ) - C(費用)min(β,Φ
,μ)
壞帳模型
離走模型
當前債務
利率調整
信用量調整
債務轉移
收入
利潤
損失和費用
(9) 優化決策和決策精調:
高
中
低
高
中
低
高
中
-2%
$1000.00
$2000.00
-2%
$2500.00
$3000.00
0%
$0.00
$0.00
2%
$-2000.00
$0.00
壞帳分數
離走分數
當前債務
利率調整
信用量調整
債務轉移
優化決策和決策精調
(10) 信用評數技術:例子——對偶模型
(11) 信用決策技術利益:減少壞帳;增加利潤;效率提升,開銷縮小;策略的公平
性和一貫性得以保障。
(12) 中國的可行方案
n 逐步建立完整的數據庫
n 人員培訓(預測建模技術,決策建模技術,策略設計技術)
n 逐步建立決策系統
這篇演講是非常有價值的,所以我將其詳細的整理出來。無論對于研究數據挖掘或金融模
型的學者/學生,還是從事實際項目設計的工程人員,都有非常高的參考價值。
三、 結語
在短短的三個半小時內,能夠組織這樣一個規模大、內容豐富、偏重應用的論壇,賽迪是
功不可沒的。
一些可以探討的概念和思路:
1. 數據挖掘的定義
在提到數據挖掘的時候,一些書或者文獻都要強調它與統計和OLAP的區別。我覺得應該從
更廣義的概念上來理解數據挖掘,它是一門跨越多個學科的技術,只要能夠從數據發現有
意義的模式,都可以稱為數據挖掘。
2. 數據倉庫和數據挖掘的關系
很多人一講數據挖掘,首先必須講數據倉庫。數據挖掘是從大量的數據中發現有意義的模
式。大量的數據并不一定是來源于數據倉庫。因為,這樣會造成一種誤解,進行數據挖掘
項目,一定要先建立數據倉庫。
另一方面,數據倉庫的結構,其實并適合進行數據挖掘分析,因為我們都看到,大部分數
據倉庫的結構采用星型或雪花型數據模型,這些數據倉庫其實是為OLAP建立的,更適合進
行OLAP的多維分析,而要從事數據挖掘項目還需要將數據轉換成數據挖掘算法能夠識別的
數據結構。
數據倉庫為數據挖掘所做的,應該從數據整合和清洗的角度來理解。也就是說,數據倉庫
將不同操作源的數據存放到一個集中的環境中,并且進行適當的清洗和轉換。這點上面李
峻博士所舉的廚房的例子是一個貼切的比喻。數據挖掘所需要的數據,能夠直接從數據倉
庫獲得,但是獲得后還是需要進行轉換,如果沒有數據倉庫,就需要直接從操作型數據源
中獲取,并且要進行ECTL(抽取、清洗、轉換、裝載)的操作。
因此,沒有數據倉庫也是能夠進行數據挖掘項目,數據倉庫的結構不是為數據挖掘設計的
,它更適合OLAP操作。
3. 國內的數據挖掘項目現狀
國內的金融行業真正從事數據挖掘項目的不多,這從論壇的國內報告能夠看出。報告的內
容主要還是“看——想——說”的步驟。也就是說,看一些資料/文獻/書,再從目前的情
況中展開聯想,最后將這些整理的想法形成方案,并報告(說)出來。
我們非常希望,在以后的應用論壇上,能夠象林博士舉國外的信用決策的例子一樣,來講
國內的數據挖掘案例。從而作到“看——想——做——說”。
4. 金融行業如何從事數據挖掘項目
林博士的“中國信用決策的可行方案”是比較貼切的,除了信用決策,對于其他已經積累
了很多業務數據的系統,都可以參考。利用數據挖掘技術,構建決策系統,使得決策來源
于數據,而不僅僅是主觀判斷(JUDGEMENT)。
金融行業的數據挖掘研究,需要多方面的人員的共同參與,包括領域專家、數據管理員、
數據分析人員、業務分析人員、數據挖掘專家,形成一個團隊,從某一個實際的問題出發
,摸索適合自己企業的一套研究和開發方法,逐步建立起企業的模型庫。因此,這些需要
得到最高決策管理層的認可和參與,因為模型的結果需要報告給決策管理層,并且使得他
們能夠理解,從而作出相應的決策。
Gartner的調查報告預計到2010年,數據挖掘在相關市場的使用將從目前的少于5%增加到超
過80%(來源:Gartner)。這在國內能否實現姑且不論,但是也從一個側面說明了這項技
術的前景,和對它寄予的厚望。而技術的應用,需要金融行業的認可和支持。
讓我們共同努力,挖掘數據價值,推進知識管理。
朱建秋
2002年11月29日
--
※ 來源:.南京大學小百合站 http://bbs.nju.edu.cn [FROM: 211.138.108.171]
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -