?? 270.txt
字號:
發信人: GzLi (笑梨), 信區: DataMining
標 題: [合集]怎么那么多學科里都有講到聚類?
發信站: 南京大學小百合站 (Mon Jul 8 22:29:14 2002), 站內信件
geangel (geangel) 于Sun Jul 7 10:17:24 2002)
提到:
老板讓偶研究聚類,偶連門檻都摸不到。
偶一查資料,老天,
統計學、模式識別、數據挖掘……怎么那么多學科里都有講到聚類?
這些學科里的聚類有什么區別?
又分別有那么多的方法,
什么傳遞閉包的東東、編網法、最大樹法是統計里的吧,
K-MEANS、C-MEANS,
BIRCH、CURE、DBSCAN、OPTICS、CLIQUE是數據挖掘里的吧。
它們之間有什么區別?怎么有這么多方法?
偶都搞糊涂了。
能給俺指點一下嗎?
chdq135 (阿權) 于Sun Jul 7 10:20:45 2002提到:
you shoud read the book DATAMING: concepts and technologied by Han jiawei
this book will give u some basic ideas.
chdq135 (阿權) 于Sun Jul 7 10:21:58 2002提到:
其實,他們的原理都是一樣的。只是應用在不同的領域。醫學、心里學、等等
不僅僅是計算機、數學。
armen (安靜地做一個俗人) 于Sun Jul 7 10:55:36 2002提到:
都是對數據進行處理
有什么不一樣呢?呵呵
geangel (geangel) 于Sun Jul 7 15:00:38 2002)
提到:
偶已經read了,看了個大概,
可是那么多方法,應該研究哪個呢?
什么傳遞閉包的東東、編網法、最大樹法、 K-MEANS、C-MEANS、 BIRCH、CURE、DBSCAN、
OPTICS、CLIQUE,這些方法有關聯嗎?
郁悶中。
imaniu (井底之蛙) 于Sun Jul 7 20:45:46 2002提到:
自己編程吧,從最簡單的做起,從源頭上去重新思考,
然后再參考一些新進展,也許這樣效果更好。
GzLi (笑梨) 于Mon Jul 8 00:18:03 2002提到:
首先我沒有研究過,但將來可能涉及,很感興趣。
從上面看來,幾個術語
我認為1)研究的角度不同、比如統計角度、神經網絡角度、其它數學角度
2)應用的領域不同、這個領域不是什么醫學的,而是數據類型不同可能方法也不同。
比如二值型、連續型、離散型等
3)方法的體系不同,不如一個人提出一種方法,然后下面的人就在基礎上改進,
就有不同方法
所以你從你最感興趣的,跟課題最相關的方法入手,編幾個程序實現一下,
就逐漸弄清了。
而且有些東西可能很老了,有不可克服的障礙。比如統計學方面的東東。
我認為,作東西還是從機器學習的角度開始然后應用到數據挖掘的對象上去的好。
geangel (天使想飛) 于Mon Jul 8 10:18:11 2002)
提到:
謝謝大家,尤其謝謝斑竹。
雖然偶不喜歡數據挖掘,不過很感謝這個版。
GzLi (笑梨) 于Mon Jul 8 10:20:05 2002提到:
我是作算法的,不過在數據挖掘中可以找到應用和問題。因為DM是一個較新的領域。
所以大家多來看看吧。
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -