亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

? 歡迎來到蟲蟲下載站! | ?? 資源下載 ?? 資源專輯 ?? 關于我們
? 蟲蟲下載站

?? tfidfmeasure.cs

?? 文本相似度計算(tfidf),可用文本分類以及文本信息處理
?? CS
字號:
/*
 * tf/idf implementation 
 * Author: Thanh Dao, thanh.dao@gmx.net
 */
using System;
using System.Collections;


namespace ServiceRanking
{
	/// <summary>
	/// Summary description for TF_IDFLib.
	/// </summary>
	public class TFIDFMeasure
	{
		private string[] _docs;
		private string[][] _ngramDoc;
		private int _numDocs=0;
		private int _numTerms=0;
		private ArrayList _terms;
		private int[][] _termFreq;
		private float[][] _termWeight;
		private int[] _maxTermFreq;
		private int[] _docFreq;


		public class TermVector
		{		
			public static float ComputeCosineSimilarity(float[] vector1, float[] vector2)
			{
				if (vector1.Length != vector2.Length)				
					throw new Exception("DIFER LENGTH");
				

				float denom=(VectorLength(vector1) * VectorLength(vector2));
				if (denom == 0F)				
					return 0F;				
				else				
					return (InnerProduct(vector1, vector2) / denom);
				
			}

			public static float InnerProduct(float[] vector1, float[] vector2)
			{
			
				if (vector1.Length != vector2.Length)
					throw new Exception("DIFFER LENGTH ARE NOT ALLOWED");
				
			
				float result=0F;
				for (int i=0; i < vector1.Length; i++)				
					result += vector1[i] * vector2[i];
				
				return result;
			}
		
			public static float VectorLength(float[] vector)
			{			
				float sum=0.0F;
				for (int i=0; i < vector.Length; i++)				
					sum=sum + (vector[i] * vector[i]);
						
				return (float)Math.Sqrt(sum);
			}

		}

		private IDictionary _wordsIndex=new Hashtable() ;

		public TFIDFMeasure(string[] documents)
		{
			_docs=documents;
			_numDocs=documents.Length ;
			MyInit();
		}

		private void GeneratNgramText()
		{
			
		}

		private ArrayList GenerateTerms(string[] docs)
		{
			ArrayList uniques=new ArrayList() ;
			_ngramDoc=new string[_numDocs][] ;
			for (int i=0; i < docs.Length ; i++)
			{
				Tokeniser tokenizer=new Tokeniser() ;
				string[] words=tokenizer.Partition(docs[i]);			

				for (int j=0; j < words.Length ; j++)
					if (!uniques.Contains(words[j]) )				
						uniques.Add(words[j]) ;
								
			}
			return uniques;
		}
		


		private static object AddElement(IDictionary collection, object key, object newValue)
		{
			object element=collection[key];
			collection[key]=newValue;
			return element;
		}

		private int GetTermIndex(string term)
		{
			object index=_wordsIndex[term];
			if (index == null) return -1;
			return (int) index;
		}

		private void MyInit()
		{
			_terms=GenerateTerms (_docs );
			_numTerms=_terms.Count ;

			_maxTermFreq=new int[_numDocs] ;
			_docFreq=new int[_numTerms] ;
			_termFreq =new int[_numTerms][] ;
			_termWeight=new float[_numTerms][] ;

			for(int i=0; i < _terms.Count ; i++)			
			{
				_termWeight[i]=new float[_numDocs] ;
				_termFreq[i]=new int[_numDocs] ;

				AddElement(_wordsIndex, _terms[i], i);			
			}
			
			GenerateTermFrequency ();
			GenerateTermWeight();			
				
		}
		
		private float Log(float num)
		{
			return (float) Math.Log(num) ;//log2
		}

		private void GenerateTermFrequency()
		{
			for(int i=0; i < _numDocs  ; i++)
			{								
				string curDoc=_docs[i];
				IDictionary freq=GetWordFrequency(curDoc);
				IDictionaryEnumerator enums=freq.GetEnumerator() ;
				_maxTermFreq[i]=int.MinValue ;
				while (enums.MoveNext())
				{
					string word=(string)enums.Key;
					int wordFreq=(int)enums.Value ;
					int termIndex=GetTermIndex(word);

					_termFreq [termIndex][i]=wordFreq;
					_docFreq[termIndex] ++;

					if (wordFreq > _maxTermFreq[i]) _maxTermFreq[i]=wordFreq;					
				}
			}
		}
		

		private void GenerateTermWeight()
		{			
			for(int i=0; i < _numTerms   ; i++)
			{
				for(int j=0; j < _numDocs ; j++)				
					_termWeight[i][j]=ComputeTermWeight (i, j);				
			}
		}

		private float GetTermFrequency(int term, int doc)
		{			
			int freq=_termFreq [term][doc];
			int maxfreq=_maxTermFreq[doc];			
			
			return ( (float) freq/(float)maxfreq );
		}

		private float GetInverseDocumentFrequency(int term)
		{
			int df=_docFreq[term];
			return Log((float) (_numDocs) / (float) df );
		}

		private float ComputeTermWeight(int term, int doc)
		{
			float tf=GetTermFrequency (term, doc);
			float idf=GetInverseDocumentFrequency(term);
			return tf * idf;
		}
		
		private  float[] GetTermVector(int doc)
		{
			float[] w=new float[_numTerms] ;
			for (int i=0; i < _numTerms; i++)											
				w[i]=_termWeight[i][doc];
			
				
			return w;
		}

		public float GetSimilarity(int doc_i, int doc_j)
		{
			float[] vector1=GetTermVector (doc_i);
			float[] vector2=GetTermVector (doc_j);

			return TermVector.ComputeCosineSimilarity(vector1, vector2) ;

		}
		
		private IDictionary GetWordFrequency(string input)
		{
			string convertedInput=input.ToLower() ;
					
			Tokeniser tokenizer=new Tokeniser() ;
			String[] words=tokenizer.Partition(convertedInput);			
			Array.Sort(words);
			
			String[] distinctWords=GetDistinctWords(words);
						
			IDictionary result=new Hashtable();
			for (int i=0; i < distinctWords.Length; i++)
			{
				object tmp;
				tmp=CountWords(distinctWords[i], words);
				result[distinctWords[i]]=tmp;
				
			}
			
			return result;
		}				
				
		private string[] GetDistinctWords(String[] input)
		{				
			if (input == null)			
				return new string[0];			
			else
			{
				ArrayList list=new ArrayList() ;
				
				for (int i=0; i < input.Length; i++)
					if (!list.Contains(input[i])) // N-GRAM SIMILARITY?				
						list.Add(input[i]);
				
				return Tokeniser.ArrayListToArray(list) ;
			}
		}
		

		
		private int CountWords(string word, string[] words)
		{
			int itemIdx=Array.BinarySearch(words, word);
			
			if (itemIdx > 0)			
				while (itemIdx > 0 && words[itemIdx].Equals(word))				
					itemIdx--;				
						
			int count=0;
			while (itemIdx < words.Length && itemIdx >= 0)
			{
				if (words[itemIdx].Equals(word)) count++;				
				
				itemIdx++;
				if (itemIdx < words.Length)				
					if (!words[itemIdx].Equals(word)) break;					
				
			}
			
			return count;
		}				
	}
}

?? 快捷鍵說明

復制代碼 Ctrl + C
搜索代碼 Ctrl + F
全屏模式 F11
切換主題 Ctrl + Shift + D
顯示快捷鍵 ?
增大字號 Ctrl + =
減小字號 Ctrl + -
亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频
色素色在线综合| 337p日本欧洲亚洲大胆精品| 国产老女人精品毛片久久| 日韩高清不卡在线| 午夜精品久久久久影视| 一区二区三区四区视频精品免费| 亚洲欧美自拍偷拍| 一区二区三区在线不卡| 一区二区三区日韩欧美| 亚洲最大成人综合| 日韩中文字幕av电影| 午夜精品久久久| 男女男精品视频| 国产精品一区二区久激情瑜伽| 国产成人午夜视频| 99久精品国产| 欧美日韩免费不卡视频一区二区三区| 欧美日韩高清一区| 欧美mv和日韩mv的网站| 久久久久成人黄色影片| 亚洲蜜臀av乱码久久精品| 悠悠色在线精品| 日本成人在线视频网站| 国产呦精品一区二区三区网站| 国产91在线看| 欧美性极品少妇| 精品国产a毛片| 国产精品美日韩| 午夜精品久久久久久久蜜桃app | 欧美精品久久一区| 欧美电影免费观看高清完整版在线 | 中文字幕一区二区三区在线不卡| 亚洲人成亚洲人成在线观看图片| 亚洲精品国产无套在线观| 蜜臀99久久精品久久久久久软件| 国产成人亚洲综合色影视| 日本不卡视频一二三区| 久久久久久电影| 国产精品不卡一区| 一区二区三区精品| 2欧美一区二区三区在线观看视频 337p粉嫩大胆噜噜噜噜噜91av | 亚洲一区二区三区三| 天天综合日日夜夜精品| 日韩电影网1区2区| 激情图区综合网| 国产一区二区三区四区五区入口 | 久久久久综合网| 中文字幕亚洲综合久久菠萝蜜| 亚洲国产精品高清| 国产精品成人一区二区艾草 | 奇米一区二区三区| 韩国在线一区二区| 成人a免费在线看| av亚洲精华国产精华| 欧美日韩一卡二卡三卡 | 亚洲综合一区在线| 蜜臀av国产精品久久久久| 成人在线视频一区| 久久国产综合精品| 97国产一区二区| 51久久夜色精品国产麻豆| 5566中文字幕一区二区电影| 国产午夜精品一区二区| 亚洲综合一区在线| 国产一区二区三区视频在线播放| av中文字幕不卡| 在线观看www91| 久久精品一区八戒影视| 亚洲制服丝袜一区| 国产福利一区二区三区视频| 91久久精品午夜一区二区| 欧美成人精品二区三区99精品| 精品久久久久久亚洲综合网| 一区二区三区久久| 风流少妇一区二区| 91.com视频| 亚洲视频在线观看一区| 男人操女人的视频在线观看欧美| 亚洲情趣在线观看| 成人小视频在线观看| 婷婷夜色潮精品综合在线| 国产精品99久久不卡二区| 在线电影一区二区三区| 日韩毛片高清在线播放| 亚洲精品ww久久久久久p站 | 激情欧美日韩一区二区| 91麻豆精品久久久久蜜臀| 国产精品色噜噜| 国产一二三精品| 欧美久久久久久久久| 一区二区三区日韩精品视频| 国产剧情av麻豆香蕉精品| 26uuu精品一区二区三区四区在线| 欧美mv日韩mv国产网站app| 亚州成人在线电影| 成av人片一区二区| 精品日韩欧美在线| 日本v片在线高清不卡在线观看| 日本伦理一区二区| 欧美激情一区二区三区全黄 | 欧美日韩精品久久久| 国产精品久久免费看| 国产精品18久久久久久久久 | 91精品久久久久久蜜臀| 国产精品久久久久三级| 亚洲444eee在线观看| 在线综合+亚洲+欧美中文字幕| 亚洲图片欧美一区| 日韩黄色免费电影| 成人性生交大片| 综合分类小说区另类春色亚洲小说欧美 | 精品一区二区三区在线视频| 亚洲精品一区二区精华| 亚洲国产日韩精品| 在线不卡免费av| 毛片av一区二区| 国产精品亚洲午夜一区二区三区 | 欧美午夜免费电影| 色综合一个色综合| 亚洲精品视频在线观看免费| 91美女片黄在线观看91美女| 一区二区三区在线影院| 欧美成人精品高清在线播放| 99在线视频精品| 中文字幕精品一区二区精品绿巨人 | 樱桃国产成人精品视频| 成人性生交大片免费看在线播放| 日韩欧美在线网站| 国产原创一区二区| 亚洲精品欧美在线| 久久久亚洲高清| 欧美日韩国产a| 五月婷婷欧美视频| 欧美日本国产视频| 亚洲第一久久影院| 欧美xxx久久| eeuss鲁片一区二区三区| 亚洲欧美一区二区三区孕妇| 一本到一区二区三区| 天天色 色综合| 亚洲激情一二三区| 1000精品久久久久久久久| 欧美一区二区三区在线观看| 91片在线免费观看| 国产不卡一区视频| 国产精品一二三四五| 老司机精品视频一区二区三区| 91精品在线麻豆| 欧美日韩一区三区四区| 久久只精品国产| 精品在线观看免费| 国产欧美在线观看一区| 97se亚洲国产综合自在线| 亚洲国产综合在线| 日韩美女视频一区二区在线观看| 国产一区激情在线| 国产日韩精品久久久| 紧缚奴在线一区二区三区| 久久综合九色综合97婷婷女人| 99久久伊人精品| 午夜激情一区二区| 亚洲国产成人一区二区三区| 日本韩国精品在线| 九一久久久久久| 亚洲特级片在线| 欧美一区二区三区视频免费播放| 韩国精品久久久| 亚洲成人激情自拍| 国产精品国产三级国产普通话三级| 日韩欧美国产一区在线观看| 欧洲在线/亚洲| 99国产精品国产精品毛片| 国内不卡的二区三区中文字幕 | 亚洲激情一二三区| 国产日韩亚洲欧美综合| 日韩一区二区三区电影在线观看| 色偷偷88欧美精品久久久| 国产一区不卡视频| 日本不卡123| 午夜欧美一区二区三区在线播放| 亚洲天天做日日做天天谢日日欢| 久久综合九色综合97婷婷女人| 日韩一区二区免费电影| 欧美另类一区二区三区| 欧美最新大片在线看| av成人免费在线观看| 国产精品一区二区黑丝| 久久99国产精品尤物| 麻豆国产一区二区| 日韩精品五月天| 亚洲第一福利视频在线| 一区二区三区精密机械公司| 国产精品国产三级国产aⅴ原创| 国产亚洲va综合人人澡精品 | 久色婷婷小香蕉久久| 亚洲一区二区在线免费看| 亚洲码国产岛国毛片在线| 亚洲图片欧美激情| 亚洲手机成人高清视频| 国产精品久久久久久久久免费樱桃 |