亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

? 歡迎來到蟲蟲下載站! | ?? 資源下載 ?? 資源專輯 ?? 關于我們
? 蟲蟲下載站

?? tfidfmeasure.cs

?? 用java語言實現文本聚類
?? CS
字號:
/*
 * tf/idf implementation 
 * Author: Thanh Dao, thanh.dao@gmx.net
 */
using System;
using System.Collections;
using System.Collections.Generic;
using WawaSoft.Search.Common;


namespace WawaSoft.Search.Common
{
	/// <summary>
	/// Summary description for TF_IDFLib.
	/// </summary>
	public class TFIDFMeasure
	{
		private string[] _docs;
		private string[][] _ngramDoc;
		private int _numDocs=0;
		private int _numTerms=0;
		private ArrayList _terms;
		private int[][] _termFreq;
		private float[][] _termWeight;
		private int[] _maxTermFreq;
		private int[] _docFreq;

        ITokeniser _tokenizer = null;





	    private IDictionary _wordsIndex=new Hashtable() ;

		public TFIDFMeasure(string[] documents,ITokeniser tokeniser)
		{
			_docs=documents;
			_numDocs=documents.Length ;
		    _tokenizer = tokeniser;
			MyInit();
		}

	    public int NumTerms
	    {
	        get { return _numTerms; }
	        set { _numTerms = value; }
	    }

	    private void GeneratNgramText()
		{
			
		}

		private ArrayList GenerateTerms(string[] docs)
		{
			ArrayList uniques=new ArrayList() ;
			_ngramDoc=new string[_numDocs][] ;
			for (int i=0; i < docs.Length ; i++)
			{
				IList<string> words=_tokenizer.Partition(docs[i]);		

				for (int j=0; j < words.Count; j++)
					if (!uniques.Contains(words[j]) )				
						uniques.Add(words[j]) ;
								
			}
			return uniques;
		}
		


		private static object AddElement(IDictionary collection, object key, object newValue)
		{
			object element=collection[key];
			collection[key]=newValue;
			return element;
		}

		private int GetTermIndex(string term)
		{
			object index=_wordsIndex[term];
			if (index == null) return -1;
			return (int) index;
		}

		private void MyInit()
		{
			_terms=GenerateTerms (_docs );
			NumTerms=_terms.Count ;

			_maxTermFreq=new int[_numDocs] ;
			_docFreq=new int[NumTerms] ;
			_termFreq =new int[NumTerms][] ;
			_termWeight=new float[NumTerms][] ;

			for(int i=0; i < _terms.Count ; i++)			
			{
				_termWeight[i]=new float[_numDocs] ;
				_termFreq[i]=new int[_numDocs] ;

				AddElement(_wordsIndex, _terms[i], i);			
			}
			
			GenerateTermFrequency ();
			GenerateTermWeight();			
				
		}
		
		private float Log(float num)
		{
			return (float) Math.Log(num) ;//log2
		}

		private void GenerateTermFrequency()
		{
			for(int i=0; i < _numDocs  ; i++)
			{								
				string curDoc=_docs[i];
				IDictionary freq=GetWordFrequency(curDoc);
				IDictionaryEnumerator enums=freq.GetEnumerator() ;
				_maxTermFreq[i]=int.MinValue ;
				while (enums.MoveNext())
				{
					string word=(string)enums.Key;
					int wordFreq=(int)enums.Value ;
					int termIndex=GetTermIndex(word);
                    if(termIndex == -1)
                        continue;
					_termFreq [termIndex][i]=wordFreq;
					_docFreq[termIndex] ++;

					if (wordFreq > _maxTermFreq[i]) _maxTermFreq[i]=wordFreq;					
				}
			}
		}
		

		private void GenerateTermWeight()
		{			
			for(int i=0; i < NumTerms   ; i++)
			{
				for(int j=0; j < _numDocs ; j++)				
					_termWeight[i][j]=ComputeTermWeight (i, j);				
			}
		}

		private float GetTermFrequency(int term, int doc)
		{			
			int freq=_termFreq [term][doc];
			int maxfreq=_maxTermFreq[doc];			
			
			return ( (float) freq/(float)maxfreq );
		}

		private float GetInverseDocumentFrequency(int term)
		{
			int df=_docFreq[term];
			return Log((float) (_numDocs) / (float) df );
		}

		private float ComputeTermWeight(int term, int doc)
		{
			float tf=GetTermFrequency (term, doc);
			float idf=GetInverseDocumentFrequency(term);
			return tf * idf;
		}
		
		private  float[] GetTermVector(int doc)
		{
			float[] w=new float[NumTerms] ; 
			for (int i=0; i < NumTerms; i++)											
				w[i]=_termWeight[i][doc];
			
				
			return w;
		}
        public double [] GetTermVector2(int doc)
        {
            double [] ret = new double[NumTerms];
            float[] w = GetTermVector(doc);
            for (int i = 0; i < ret.Length; i++ )
            {
                ret[i] = w[i];
            }
            return ret;
        }

		public double GetSimilarity(int doc_i, int doc_j)
		{
			double [] vector1=GetTermVector2 (doc_i);
			double [] vector2=GetTermVector2 (doc_j);

			return TermVector.ComputeCosineSimilarity(vector1, vector2) ;

		}
		
		private IDictionary GetWordFrequency(string input)
		{
			string convertedInput=input.ToLower() ;
					
            List<string> temp = new List<string>(_tokenizer.Partition(convertedInput));
			string[] words= temp.ToArray();		
	        
			Array.Sort(words);
			
			String[] distinctWords=GetDistinctWords(words);
						
			IDictionary result=new Hashtable();
			for (int i=0; i < distinctWords.Length; i++)
			{
				object tmp;
				tmp=CountWords(distinctWords[i], words);
				result[distinctWords[i]]=tmp;
				
			}
			
			return result;
		}				
				
		private static string[] GetDistinctWords(String[] input)
		{				
			if (input == null)			
				return new string[0];			
			else
			{
                List<string> list = new List<string>();
				
				for (int i=0; i < input.Length; i++)
					if (!list.Contains(input[i])) // N-GRAM SIMILARITY?				
						list.Add(input[i]);
				
				return list.ToArray();
			}
		}
		

		
		private int CountWords(string word, string[] words)
		{
			int itemIdx=Array.BinarySearch(words, word);
			
			if (itemIdx > 0)			
				while (itemIdx > 0 && words[itemIdx].Equals(word))				
					itemIdx--;				
						
			int count=0;
			while (itemIdx < words.Length && itemIdx >= 0)
			{
				if (words[itemIdx].Equals(word)) count++;				
				
				itemIdx++;
				if (itemIdx < words.Length)				
					if (!words[itemIdx].Equals(word)) break;					
				
			}
			
			return count;
		}				
	}
}

?? 快捷鍵說明

復制代碼 Ctrl + C
搜索代碼 Ctrl + F
全屏模式 F11
切換主題 Ctrl + Shift + D
顯示快捷鍵 ?
增大字號 Ctrl + =
減小字號 Ctrl + -
亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频
国产一区美女在线| 欧美国产成人精品| 欧美精品一区二区高清在线观看 | 亚洲亚洲精品在线观看| 亚洲va国产天堂va久久en| 美女视频黄a大片欧美| 成人性生交大片免费看视频在线| 91小视频在线免费看| 欧美日韩三级在线| 精品国精品国产尤物美女| 成人免费一区二区三区视频| 青青草97国产精品免费观看 | 欧美国产精品中文字幕| 亚洲一区二区三区在线播放| 激情丁香综合五月| 91精彩视频在线观看| 精品成人免费观看| 一个色妞综合视频在线观看| 黄色精品一二区| 色婷婷久久99综合精品jk白丝 | 国产在线精品国自产拍免费| 在线一区二区视频| 国产日产精品1区| 亚洲国产va精品久久久不卡综合| 国产九色精品成人porny| 91成人看片片| 国产欧美综合在线观看第十页| 亚洲二区视频在线| 成人黄动漫网站免费app| 欧美一级理论性理论a| 18成人在线观看| 久久电影网站中文字幕| 欧美日韩一区成人| 中文字幕一区二区三区视频 | 欧美激情中文字幕一区二区| 日韩中文字幕区一区有砖一区| 岛国精品一区二区| 欧美一区二区三区免费视频| 又紧又大又爽精品一区二区| 国产成人一区在线| 精品国一区二区三区| 天堂午夜影视日韩欧美一区二区| 99久久精品情趣| 久久久久久久久蜜桃| 亚洲电影一级黄| 一本一道久久a久久精品| 国产精品毛片大码女人| 国产一区二区三区久久久| 91精品国产一区二区三区香蕉| 亚洲一区视频在线| 99精品久久99久久久久| 久久综合av免费| 另类成人小视频在线| 51午夜精品国产| 夜夜爽夜夜爽精品视频| 99视频一区二区三区| 日本一区二区三区在线不卡| 激情亚洲综合在线| 日韩免费视频一区| 日韩电影免费在线观看网站| 欧美久久久久中文字幕| 亚洲靠逼com| 一本在线高清不卡dvd| 亚洲另类春色校园小说| 一本久久精品一区二区| 亚洲免费观看在线视频| 91丝袜国产在线播放| 国产精品久久久久久久久果冻传媒 | 97久久精品人人爽人人爽蜜臀| 欧美激情一区二区三区| 国产成人av电影| 欧美国产一区在线| 成人av影视在线观看| 国产精品久久久久影院亚瑟| 99视频在线精品| 亚洲桃色在线一区| 一本一本久久a久久精品综合麻豆 一本一道波多野结衣一区二区 | 亚洲精品va在线观看| 日本韩国欧美三级| 亚洲图片欧美视频| 51精品国自产在线| 美女爽到高潮91| 久久亚洲私人国产精品va媚药| 激情都市一区二区| 国产精品午夜在线观看| 波多野结衣在线aⅴ中文字幕不卡| 午夜精品福利一区二区三区蜜桃| 欧美人伦禁忌dvd放荡欲情| 亚洲午夜视频在线观看| 7777女厕盗摄久久久| 人妖欧美一区二区| 337p粉嫩大胆色噜噜噜噜亚洲 | 欧美国产精品一区二区三区| av激情综合网| 一二三区精品视频| 欧美一区二区久久| 国产中文一区二区三区| 国产喂奶挤奶一区二区三区| 91网页版在线| 午夜电影久久久| 欧美草草影院在线视频| 不卡的av在线| 亚洲成av人**亚洲成av**| 日韩欧美在线一区二区三区| 国产精品影视在线| 亚洲免费在线视频| 日韩亚洲欧美一区二区三区| 国产99精品视频| 一二三区精品视频| 欧美电影免费提供在线观看| eeuss鲁片一区二区三区| 亚洲图片一区二区| 久久丝袜美腿综合| 色屁屁一区二区| 午夜成人免费电影| 国产无一区二区| 欧美日韩综合一区| 国产在线不卡一卡二卡三卡四卡| 综合av第一页| 日韩区在线观看| 99久久精品99国产精品| 免费观看久久久4p| 亚洲色图都市小说| 欧美成人精品福利| 94色蜜桃网一区二区三区| 日本欧美肥老太交大片| 国产精品丝袜91| 91精品在线免费观看| 成人免费不卡视频| 美女性感视频久久| 又紧又大又爽精品一区二区| 久久众筹精品私拍模特| 在线精品国精品国产尤物884a| 韩国女主播成人在线| 亚洲精品国产品国语在线app| 精品国产亚洲在线| 欧美日韩一卡二卡三卡 | 国产精品日韩成人| 欧美精品精品一区| 99久久精品国产麻豆演员表| 久久不见久久见中文字幕免费| 一区二区三区资源| 日本一区二区三区电影| 欧美一区二区三区在线电影| 91美女片黄在线观看| 国产高清无密码一区二区三区| 视频精品一区二区| 伊人色综合久久天天人手人婷| 偷拍一区二区三区| 亚洲婷婷国产精品电影人久久| 精品国产乱码久久久久久久久 | 日本vs亚洲vs韩国一区三区二区| 国产精品狼人久久影院观看方式| 日韩精品在线一区| 欧美日韩一卡二卡三卡| 色综合久久天天| 国产高清不卡二三区| 麻豆精品久久精品色综合| 亚洲成av人片| 亚洲高清视频在线| 洋洋av久久久久久久一区| 国产欧美一区二区三区鸳鸯浴| 精品国产精品网麻豆系列 | 国模套图日韩精品一区二区| 五月天欧美精品| 一二三区精品视频| 中文字幕一区二区三| 国产欧美日韩精品a在线观看| 久久综合狠狠综合久久综合88| 欧美一区二区三区白人| 4438x亚洲最大成人网| 欧美视频一区在线观看| 在线免费观看日韩欧美| 不卡在线观看av| 成人免费av资源| 成人a级免费电影| 成人av先锋影音| 成人动漫av在线| 成人高清视频在线| 99久久国产免费看| 91小视频在线免费看| 不卡免费追剧大全电视剧网站| 粉嫩绯色av一区二区在线观看 | 亚洲欧美激情视频在线观看一区二区三区 | 夜夜夜精品看看| 一区二区成人在线观看| 亚洲激情五月婷婷| 亚洲黄色尤物视频| 亚洲精品国产成人久久av盗摄| 亚洲人成小说网站色在线| 亚洲人成精品久久久久| 中文字幕五月欧美| 亚洲精品中文在线| 亚洲一区二区成人在线观看| 亚洲国产精品麻豆| 蜜桃91丨九色丨蝌蚪91桃色| 精品综合久久久久久8888| 国产在线精品不卡| 成人精品高清在线| 91在线视频免费观看|