?? 845.txt
字號:
發信人: edog (過海仙人), 信區: DataMining
標 題: Re: 當數據缺值時怎么辦?
發信站: 南京大學小百合站 (Sat May 25 18:30:14 2002)
對于空缺的屬性值,最簡單的辦法是忽略該元組,也可以采用全局常量或屬性的平均值填
充。此處推薦采用聚類和統計分析中的回歸預測相結合的方法。首先使用聚類技術根據不
缺值的屬性進行聚類,使類中元組保持最大的共性,類間元組保持最大的異性。然后利用
所在類其他元組在空缺值屬性上的值構造一個回歸模型來預測該屬性的空缺值。根據問題
的復雜度,可選擇采用線性回歸或多元回歸。相對于使用全局常量或屬性的平均值而言,
采用這種技術預測出來的屬性值能夠更接近真實值。
//其余方法參見han的書。
【 在 jhdai 的大作中提到: 】
: 希望各位講解一下
: 或推薦資料
: 謝謝!
--
仙人也有煩惱的時候……
※ 來源:.南京大學小百合站 http://bbs.nju.edu.cn [FROM: 202.113.0.211]
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -