聚類算法是基于距離的,但是大多采取單一的歐氏距離,不利于結果的發(fā)現(xiàn)。
標簽: 聚類算法
上傳時間: 2015-03-30
上傳用戶:caozhizhi
實現(xiàn)聚類K均值算法: K均值算法:給定類的個數(shù)K,將n個對象分到K個類中去,使得類內對象之間的相似性最大,而類之間的相似性最小。 缺點:產生類的大小相差不會很大,對于臟數(shù)據(jù)很敏感。 改進的算法:k—medoids 方法。這兒選取一個對象叫做mediod來代替上面的中心 的作用,這樣的一個medoid就標識了這個類。步驟: 1,任意選取K個對象作為medoids(O1,O2,…Oi…Ok)。 以下是循環(huán)的: 2,將余下的對象分到各個類中去(根據(jù)與medoid最相近的原則); 3,對于每個類(Oi)中,順序選取一個Or,計算用Or代替Oi后的消耗—E(Or)。選擇E最小的那個Or來代替Oi。這樣K個medoids就改變了,下面就再轉到2。 4,這樣循環(huán)直到K個medoids固定下來。 這種算法對于臟數(shù)據(jù)和異常數(shù)據(jù)不敏感,但計算量顯然要比K均值要大,一般只適合小數(shù)據(jù)量。
標簽: K均值算法 聚類
上傳時間: 2015-04-03
上傳用戶:sardinescn
變色龍層次聚類算法,利用動態(tài)模型的層次聚類算法
標簽: 層次聚類 算法
上傳用戶:gtf1207
層次聚類算法中的cure算法,它利用代表點來達到聚類目的
標簽: cure 算法 層次聚類
上傳用戶:jjj0202
gmeans-- Clustering with first variation and splitting 文本聚類算法Gmeans ,使用了3種相似度函數(shù),cosine,euclidean ,KL.文本數(shù)據(jù)使用的是稀疏矩陣形式.
標簽: Clustering euclidean variation splitting
上傳時間: 2014-01-05
上傳用戶:cainaifa
用迷宮算法實現(xiàn)聚點的統(tǒng)計,這里只是簡單掃描每個像素的四個方向,當然,可以很容易修改源碼,實現(xiàn)八個方向的掃描,至于聚點嘛,就是被數(shù)碼0包圍的數(shù)碼1組成的塊,這種算法在元件識別方面可以應用。
標簽: 迷宮算法
上傳時間: 2013-12-19
上傳用戶:cursor
一個改進的聚類算法FCMA,可以實現(xiàn)數(shù)據(jù)的自適應有效聚類,對2維數(shù)據(jù)測試效果較好
標簽: FCMA 數(shù)據(jù) 聚類算法 聚類
上傳時間: 2014-09-10
數(shù)據(jù)挖掘中的聚類算法程序演示參考 dbscan for C#
標簽: dbscan for 數(shù)據(jù)挖掘 聚類算法
上傳時間: 2015-04-13
上傳用戶:dongbaobao
一種中文文本聚類的研究__一篇完整的關于文本聚類算法的論文
標簽: 文本聚類 算法 論文
上傳時間: 2015-04-17
上傳用戶:ecooo
Solaris環(huán)境下的數(shù)據(jù)挖掘算法:birch聚類算法。該算法適用于對大量數(shù)據(jù)的挖掘。
標簽: Solaris birch 環(huán)境 數(shù)據(jù)挖掘算法
上傳時間: 2015-04-22
上傳用戶:redmoons
蟲蟲下載站版權所有 京ICP備2021023401號-1