JAVA實現文本聚類,用到TF/IDF權重,用余弦夾角計算文本相似度,用k-means進行數據聚類等數學和統計 知識。
標簽: JAVA 文本聚類
上傳時間: 2017-02-25
上傳用戶:Avoid98
用java語言實現文本聚類,包括聚類前的數據預處理:分詞、降維、建立向量空間模型等
標簽: java 語言 文本聚類
上傳時間: 2014-11-18
上傳用戶:zhoujunzhen
k-means文本聚類算法,用c語言實現的,聚類效果明顯,適于初學者入門~
標簽: k-means 文本聚類 算法
上傳時間: 2014-09-09
上傳用戶:weixiao99
臺灣人對聚類算法的一個介紹。分群法(clustering)是一種最普遍將資料分類成群的方法,其主要的目的乃在於找出資料中較相似的幾個群組。
標簽: clustering 分 聚類算法
上傳時間: 2013-12-16
上傳用戶:lxm
能對從Google中搜索出來的文本進行聚類,提供了Java包,及調用源代碼.
標簽: Google Java 搜索 聚類
上傳時間: 2014-03-02
上傳用戶:tfyt
語義平滑文件模式聚類,代表了文本挖掘的前沿技術,和熱門方向(英語原版)
標簽: 模式 前沿技術 方向 聚類
上傳時間: 2013-12-14
上傳用戶:dreamboy36
關鍵詞抽取技術廣泛應用于信息檢索、文本分類/聚類、信息過濾
標簽: 應用于 信息檢索 信息過濾 文本分類
上傳時間: 2013-12-03
上傳用戶:lz4v4
神經網絡中的K均值聚類算法II: 1.KMIn為輸入數據文本,其中,第一個參數為所要聚類點個數,第二個參數為聚類點的維數,第三個參數為所要求聚類的個數 2.KM2OUT為經過K均值聚類算法II計算后得到的結果
標簽: KMIn 神經網絡 K均值 數據
上傳時間: 2014-01-14
上傳用戶:aa54
這是一篇講述聚類在文本挖掘中的應用的博士論文,個人認為講述的還是比較細的.
標簽: 聚類 中的應用 比較 論文
上傳時間: 2013-12-25
上傳用戶:思琦琦
這是一個提取 Reuter-21578 的程序, 用做自然語言處理, 文本分類聚類,和信息檢索的測試集!
標簽: Reuter 21578 程序 文本分類
上傳時間: 2016-12-11
上傳用戶:maizezhen
蟲蟲下載站版權所有 京ICP備2021023401號-1