?? 21.txt
字號:
發信人: ashun (阿順), 信區: DataMining
標 題: 數據挖掘入門(十五)(完)
發信站: 南京大學小百合站 (Mon Aug 20 10:30:15 2001)
7.實施。
模型建立并經驗證之后,可以有兩種主要的使用方法。第一種是提供給分析人員做參考,
由他通過察看和分析這個模型之后提出行動方案建議。比如可以把模型檢測到的聚集、模
型中蘊含的規則、或表明模型效果的ROI圖表拿給分析人員看。
另一種是把此模型應用到不同的數據集上。模型可以用來標示一個事例的類別,給一項申
請打分等。還可以用模型在數據庫中選擇符合特定要求的記錄,以用OLAP工具做進一步的
分析。
通常情況下,模型是某個商業過程的組成部分,如風險分析,信用授權,或欺詐檢測。在
這些情況下,模型一般都合并到應用程序的內部。例如,在抵押貸款應用程序內部可能集
成了一個預測模型,來向貸款官員提供一項貸款申請風險大小的建議。或在定購系統中,
當預測到庫存有可能降低到一個最低限度時自動發出購買訂單。
數據挖掘模型通常一次只能處理一個事件或一個事務。每個事務的處理時間和事務到達的
速度,決定了模型運行所需的計算能力,和是否要用并行技術來加快速度。比如,貸款申
請程序可能PC機上就運行的很好,而用于信用卡欺詐的模型則需要在服務器上用并行算法
才能應付每天的大量事務。
當提交一個復雜的應用時,數據挖掘可能只是整個產品的一小部分,雖然可能是最關鍵的
一部分。例如,常常把數據挖掘得到的知識與領域專家的知識結合起來,然后應用到數據
庫中的數據。在欺詐檢測系統中可能既包含了數據挖掘發現的規律,也有人們在實踐中早
已總結出的規律。
模型監控。在應用了模型之后,當然還要不斷監控他的效果。即使你在開始使用這個模型
之后覺得他非常成功,也不能放棄監控,因為事物在不斷發展變化,很可能過一段時間之
后,模型就不再起作用。銷售人員都知道,人們的購買方式隨著社會的發展而變化。因此
隨著使用時間的增加,要不斷的對模型做重新測試,有時甚者需要重新建立模型。
--
業精于勤荒于嬉,行成于思毀于隨。 —— 韓愈
臨淵羨魚不如退而結網。 —— 班固
勿以惡小而為之,勿以善小而不為。 —— 劉備
※ 來源:.南京大學小百合站 http://bbs.nju.edu.cn [FROM: 202.119.80.20]
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -