?? javacluster.txt

?? JAVA實現文本聚類

?? TXT

字號:

/**//// <summary> 
數據挖掘工具

/// 以空白字符進行簡單分詞，并忽略大小寫，
/// 實際情況中可以用其它中文分詞算法
/// </summary> 
數據挖掘交友


/// <param name="input"></param>
/// <returns></returns>
public IList<string> Partition(string input) 數據挖掘研究院 
{
 Regex r=new Regex("([ \\t{}():;. \n])");   數據挖掘工具 
 input=input.ToLower() ;

 String [] tokens=r.Split(input);           數據挖掘工具 

 List<string> filter=new   List<string>() ; 
數據挖掘研究院


 for (int i=0; i < tokens.Length ; i++) 
數據挖掘工具

 {
   MatchCollection mc=r.Matches(tokens[i]); 
數據挖掘論壇

  if (mc.Count <= 0 && tokens[i].Trim().Length > 0       
   && !StopWordsHandler.IsStopword (tokens[i]) )         數據挖掘論壇 
    filter.Add(tokens[i]) ;
         }
 
 return filter.ToArray(); 
數據挖掘工具


}


以下是kmeans算法的基本代碼 數據挖掘研究院 

略。。 數據挖掘研究院 

數據挖掘論壇 

以下是聚類實體類的定義 

數據挖掘研究院
 

internal class WawaCluster
{ 
數據挖掘論壇


    public WawaCluster(int dataindex,double[] data)
    { 數據挖掘論壇 
         CurrentMembership.Add(dataindex);
         Mean = data;
     } 
數據挖掘研究院


    /**//// <summary> 數據挖掘研究院 
    /// 該聚類的數據成員索引
    /// </summary>
    internal List<int> CurrentMembership = new List<int>(); 
數據挖掘論壇

   /**//// <summary>
    /// 該聚類的中心 數據挖掘研究院 
    /// </summary>
    internal double[] Mean;
    /**//// <summary> 數據挖掘工具 
    /// 該方法計算聚類對象的均值 
    /// </summary>
    /// <param name="coordinates"></param> 
數據挖掘研究院


    public void UpdateMean(double[][] coordinates)
    { 
數據挖掘交友


       // 根據 mCurrentMembership 取得原始資料點對象 coord ，該對象是 coordinates 的一個子集；
        //然后取出該子集的均值；取均值的算法很簡單，可以把 coordinates 想象成一個 m*n 的距陣 ,
        //每個均值就是每個縱向列的取和平均值 , //該值保存在 mCenter 中 數據挖掘交友 

        for (int i = 0; i < CurrentMembership.Count; i++) 
數據挖掘交友

        {
            double[] coord = coordinates[CurrentMembership[i]]; 數據挖掘實驗室 
            for (int j = 0; j < coord.Length; j++)
            { 
數據挖掘工具

                 Mean[j] += coord[j]; // 得到每個縱向列的和；
             } 數據挖掘論壇 
            for (int k = 0; k < Mean.Length; k++)
            { 
數據挖掘研究院


                 Mean[k] /= coord.Length; // 對每個縱向列取平均值
             } 數據挖掘實驗室 
         }
     }
} 
數據挖掘工具

?? 文件大小 2 K

?? 上傳用戶 ivanyeh

?? 所屬分類 Java編程

??? 相關標簽

#JAVA #文本聚類

?? 快捷鍵說明

復制代碼 Ctrl + C

搜索代碼 Ctrl + F

全屏模式 F11

切換主題 Ctrl + Shift + D

顯示快捷鍵 ?

增大字號 Ctrl + =

減小字號 Ctrl + -

亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

?? javacluster.txt

?? 快捷鍵說明