亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

? 歡迎來到蟲蟲下載站! | ?? 資源下載 ?? 資源專輯 ?? 關于我們
? 蟲蟲下載站

?? simpledictseg.cs

?? KTDictSeg 簡介: KTDictSeg 是由KaiToo搜索開發的一款基于字典的簡單中英文分詞算法 * 主要功能: 中英文分詞
?? CS
?? 第 1 頁 / 共 4 頁
字號:
                {
                    //按行讀取中文停用詞
                    string strEngStop = swEngFile.ReadLine();

                    //如果哈希表中不包括該停用詞則添加到哈希表中
                    if (!m_EngStopwordTbl.Contains(strEngStop))
                    {
                        m_EngStopwordTbl.Add(strEngStop, numEngStop);
                        numEngStop++;
                    }
                }

                swChrFile.Close();
                swEngFile.Close();
            }
            catch
            {
                throw;
            }

        }

        /// <summary>
        /// 將中文停用詞保存到文件中 
        /// </summary>
        /// <param name="fileName">要保存文件名</param>
        /// <remarks>對文件存取的異常不做異常處理,由調用者進行異常處理</remarks>
        public void SaveChsStopwordDict(String fileName)
        {
            try
            {
                //創建一個新的存儲中文停用詞的文本文件,若該文件存在則覆蓋
                FileStream fs = new FileStream(fileName, FileMode.Create, FileAccess.Write);
                StreamWriter sw = new StreamWriter(fs, Encoding.GetEncoding("UTF-8"));


                //遍歷中文停用詞表,寫入文件
                foreach (DictionaryEntry i in m_ChsStopwordTbl)
                {
                    sw.WriteLine(i.Key.ToString());
                }

                sw.Close();
                fs.Close();
            }
            catch
            {
                throw;
            }

        }

        /// <summary>
        /// 將英文停用詞保存到文件中 
        /// </summary>
        /// <param name="fileName">要保存文件名</param>
        /// <remarks>對文件存取的異常不做異常處理,由調用者進行異常處理</remarks>
        public void SaveEngStopwordDict(String fileName)
        {
            try
            {
                //創建一個新的存儲英文停用詞的文本文件,若該文件存在則覆蓋
                FileStream fs = new FileStream(fileName, FileMode.Create, FileAccess.Write);
                StreamWriter sw = new StreamWriter(fs, Encoding.GetEncoding("UTF-8"));


                //遍歷英文停用詞表,寫入文件
                foreach (DictionaryEntry i in m_EngStopwordTbl)
                {
                    sw.WriteLine(i.Key.ToString());
                }
                sw.Close();
                fs.Close();
            }
            catch
            {
                throw;
            }
        }

        /// <summary>
        /// 增加一個中文停用詞
        /// </summary>
        /// <param name="word"></param>
        public void AddChsStopword(String word)
        {
            //如果原來詞庫中已存在,則不做任何操作
            if (m_ChsStopwordTbl.Contains(word))
            {
                return;
            }
            else
            {
                m_ChsStopwordTbl.Add(word, m_ChsStopwordTbl.Count);

            }

        }


        /// <summary>
        /// 刪除一個中文停用詞
        /// </summary>
        /// <param name="word"></param>
        public void DelChsStopword(String word)
        {
            //如果原來詞庫中不存在,則不做任何操作
            m_ChsStopwordTbl.Remove(word);
        }


        /// <summary>
        /// 增加一個英文停用詞
        /// </summary>
        /// <param name="word"></param>
        public void AddEngStopword(String word)
        {
            //如果原來詞庫中已存在,則不做任何操作
            if (m_EngStopwordTbl.Contains(word))
            {
                return;
            }
            else
            {
                m_EngStopwordTbl.Add(word, m_EngStopwordTbl.Count);
            }
        }


        /// <summary>
        /// 刪除一個英文停用詞
        /// </summary>
        /// <param name="word"></param>
        public void DelEngStopword(String word)
        {
            //如果原來詞庫中不存在,則不做任何操作
            m_EngStopwordTbl.Remove(word);
        }

        #endregion

        #region 加載字典

        public void LoadDict()
        {
            LoadDict(false);
        }


        /// <summary>
        /// 加載字典
        /// </summary>
        /// <param name="clear">是否清除詞頻</param>
        public void LoadDict(bool clear)
        {
            //加載姓名前綴后綴統計表
            m_MatchNameRule.LoadNameTraffic(m_DictPath + "Name.dct");

            //加載字典
            m_Dict = Dict.LoadFromBinFileEx(m_DictPath + "Dict.dct");
            m_DictMgr.Dict = m_Dict;

            foreach (T_DictStruct word in m_Dict.Dicts)
            {
                if (clear)
                {
                    word.Frequency = 0;
                }

                m_ExtractWords.InsertWordToDfa(word.Word, word);
                m_POS.AddWordPos(word.Word, word.Pos);
            }

            //加載未登錄詞統計字典
            if (File.Exists(m_DictPath + "UnknownWords.dct"))
            {
                m_UnknownWordsDict = Dict.LoadFromBinFileEx(m_DictPath + "UnknownWords.dct");
            }
            else
            {
                m_UnknownWordsDict = new T_DictFile();
            }

            m_UnknownWordsDictMgr.Dict = m_UnknownWordsDict;

            if (clear)
            {
                m_MatchNameRule.ClearNameTraffic();
            }

            m_MatchNameRule.TrafficUnknownWordHandle = TrafficUnknownWord;
        }

        public void SaveDict()
        {
            m_MatchNameRule.SaveNameTraffic(m_DictPath + "Name.dct");

            foreach (T_DictStruct word in m_Dict.Dicts)
            {
                T_DictStruct dict = (T_DictStruct)m_ExtractWords.GetTag(word.Word);
                if (dict != null)
                {
                    word.Frequency = dict.Frequency;
                }
            }

            Dict.SaveToBinFileEx(m_DictPath + "Dict.dct", m_Dict);

            Dict.SaveToBinFileEx(m_DictPath + "UnknownWords.dct", m_UnknownWordsDict);

        }

        #endregion

        #region 分詞屬性
        bool m_MatchName;
        
        /// <summary>
        /// 是否匹配漢語人名
        /// </summary>
        public bool MatchName
        {
            get
            {
                return m_MatchName;
            }

            set
            {
                m_MatchName = value;
            }
        }

        T_Direction m_MatchDirection;

        /// <summary>
        /// 匹配方向
        /// 默認為從左至右匹配,即正向匹配
        /// </summary>
        public T_Direction MatchDirection
        {
            get
            {
                return m_MatchDirection;
            }

            set
            {
                m_MatchDirection = value;
            }
        }


        bool m_FilterStopWords;

        /// <summary>
        /// 是否過濾停用詞
        /// </summary>
        public bool FilterStopWords
        {
            get
            {
                return m_FilterStopWords;
            }

            set
            {
                if (value)
                {
                    if (m_ChsStopwordTbl.Count == 0 || m_EngStopwordTbl.Count == 0)
                    {
                        LoadStopwordsDict(m_DictPath + CHS_STOP_WORD_FILENAME, m_DictPath + ENG_STOP_WORD_FILENAME);
                    }
                }

                m_FilterStopWords = value;

            }
        }


        #endregion


        #region 分詞

        private void InsertWordToArray(String word, List<String> arr)
        {
            arr.Add(word);
        }

        /// <summary>
        /// 預分詞
        /// </summary>
        /// <param name="str">要分詞的句子</param>
        /// <returns>預分詞后的字符串輸出</returns>
        private List<String> PreSegment(String str)
        {
            ArrayList initSeg = new ArrayList();


            if (!CRegex.GetSingleMatchStrings(str, PATTERNS, true, ref initSeg))
            {
                return new List<String>();
            }

            List<String> retWords = new List<String>();

            int i = 0;

            m_ExtractWords.MatchDirection = MatchDirection;

            while (i < initSeg.Count)
            {
                String word = (String)initSeg[i];
                if (word == "")
                {
                    word = " ";
                }

                if (i < initSeg.Count - 1)
                {
                    bool mergeOk = false;
                    if (((word[0] >= '0' && word[0] <= '9') ||(word[0] >= '0' && word[0] <= '9')) &&
                        ((word[word.Length - 1] >= '0' && word[word.Length - 1] <= '9') ||
                         (word[word.Length - 1] >= '0' && word[word.Length - 1] <= '9')) 
                        )

                    {
                        //合并浮點數
                        word = MergeFloat(initSeg, i, ref i);
                        mergeOk = true;
                    }
                    else if ((word[0] >= 'a' && word[0] <= 'z') ||
                             (word[0] >= 'A' && word[0] <= 'Z') 
                             )
                    {
                        //合并成英文專業名詞
                        String specialEnglish = MergeEnglishSpecialWord(m_ExtractWords, initSeg, i, ref i);

                        if (specialEnglish != null)
                        {
                            InsertWordToArray(specialEnglish, retWords);
                            continue;
                        }

                        //合并郵件地址
                        if ((String)initSeg[i + 1] != "")
                        {
                            if (((String)initSeg[i + 1])[0] == '@')
                            {
                                word = MergeEmail(initSeg, i, ref i);
                                mergeOk = true;
                            }
                        }
                    }

                    if (mergeOk)
                    {
                        InsertWordToArray(word, retWords);
                        continue;
                    }
                }


                if (word[0] < 0x4e00 || word[0] > 0x9fa5)
                {
                    //英文或符號,直接加入
                    InsertWordToArray(word, retWords);
                }
                else
                {
                    List<T_WordInfo> words = m_ExtractWords.ExtractFullTextMaxMatch(word);
                    int lastPos = 0;
                    bool lstIsName = false; //前一個詞是人名

?? 快捷鍵說明

復制代碼 Ctrl + C
搜索代碼 Ctrl + F
全屏模式 F11
切換主題 Ctrl + Shift + D
顯示快捷鍵 ?
增大字號 Ctrl + =
減小字號 Ctrl + -
亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频
精品国产污污免费网站入口| 91视频com| 亚洲精品一区二区三区在线观看| 99精品视频免费在线观看| 7777女厕盗摄久久久| 另类综合日韩欧美亚洲| 国产日产亚洲精品系列| 成人免费电影视频| 一区二区三区久久| 亚洲一区二三区| 国产精品1区二区.| 精品国产sm最大网站免费看| 五月婷婷综合在线| 欧美优质美女网站| 一区二区视频免费在线观看| 成人精品视频一区二区三区尤物| 亚洲精品一线二线三线无人区| 日韩二区三区四区| 91精品婷婷国产综合久久竹菊| 亚洲最色的网站| 色偷偷88欧美精品久久久| 亚洲同性gay激情无套| 成人一道本在线| 国产三级精品在线| 国产美女主播视频一区| 26uuu精品一区二区三区四区在线| 日韩高清不卡一区二区三区| 欧美日韩高清影院| 日本aⅴ精品一区二区三区| 欧美精品在欧美一区二区少妇| 亚洲制服欧美中文字幕中文字幕| 日本精品免费观看高清观看| 亚洲最大成人网4388xx| 色噜噜狠狠色综合中国| 亚洲自拍欧美精品| 欧美日韩一区二区欧美激情| 亚洲成人精品在线观看| 欧美精品精品一区| 精品制服美女久久| 久久久精品免费免费| 不卡视频一二三| 一区二区三区在线免费观看| 欧美丝袜丝交足nylons图片| 亚洲mv在线观看| 日韩免费高清视频| 国产精品一区久久久久| 最近中文字幕一区二区三区| 在线中文字幕不卡| 五月婷婷激情综合| 欧美xxx久久| 成人激情校园春色| 亚洲高清不卡在线| 日韩免费高清av| 国产91综合网| 一区二区成人在线观看| 欧美成人精品1314www| 国产成都精品91一区二区三| 一级特黄大欧美久久久| 欧美岛国在线观看| 成人激情电影免费在线观看| 亚洲影视在线观看| 久久综合狠狠综合久久激情 | 大尺度一区二区| 亚洲欧美成人一区二区三区| 91麻豆精品91久久久久久清纯| 日本亚洲视频在线| 国产精品电影院| 91精品国产一区二区人妖| 国产精品综合视频| 亚洲va韩国va欧美va精品 | 亚洲欧美日韩国产中文在线| 91精品国产欧美一区二区18| 成人动漫精品一区二区| 偷偷要91色婷婷| 国产精品国产馆在线真实露脸| 欧美日韩中文字幕一区二区| 国产福利一区在线| 日韩精品免费专区| 亚洲三级小视频| 久久久久综合网| 337p亚洲精品色噜噜狠狠| 成人性视频网站| 久久精品国产亚洲a| 亚洲欧美日韩在线| 中文字幕精品一区二区精品绿巨人 | 精品国产精品一区二区夜夜嗨| 色婷婷狠狠综合| 国产精品影视在线| 日韩精品1区2区3区| 一区二区在线观看免费视频播放| 久久久一区二区| 欧美大片在线观看| 欧美精品视频www在线观看| 97久久超碰国产精品| 国产一区二区在线观看视频| 日本不卡一二三| 亚洲图片有声小说| 亚洲免费av高清| 国产精品免费视频一区| 久久久久国色av免费看影院| 精品欧美一区二区在线观看| 欧美www视频| 日韩免费看的电影| 精品少妇一区二区三区在线播放| 91麻豆精品国产91久久久更新时间 | 色偷偷88欧美精品久久久| 国产二区国产一区在线观看| 久久国产尿小便嘘嘘尿| 青青草91视频| 久草中文综合在线| 激情欧美一区二区| 精品一区二区三区视频| 国产在线精品一区二区| 国产自产2019最新不卡| 国产一区美女在线| 国产原创一区二区| 国产米奇在线777精品观看| 精品在线播放午夜| 国产精品69毛片高清亚洲| 粉嫩av亚洲一区二区图片| 成人高清视频免费观看| 92精品国产成人观看免费| 色婷婷久久一区二区三区麻豆| 欧美无砖专区一中文字| 制服丝袜中文字幕一区| 精品国产91乱码一区二区三区 | 欧美性大战久久久久久久蜜臀| 91久久精品一区二区三区| 在线免费不卡视频| 在线播放91灌醉迷j高跟美女| 这里只有精品视频在线观看| 2024国产精品| 亚洲手机成人高清视频| 亚洲综合图片区| 蜜臀av性久久久久蜜臀aⅴ| 国产馆精品极品| 欧美主播一区二区三区| 精品国产伦一区二区三区免费 | 91麻豆精品一区二区三区| 在线精品观看国产| 日韩一区二区不卡| 国产精品福利电影一区二区三区四区| 亚洲精品视频在线观看网站| 日韩黄色小视频| 粉嫩13p一区二区三区| 欧美视频日韩视频在线观看| 精品国产凹凸成av人导航| 亚洲欧美色图小说| 蜜臀av一区二区| 色天天综合久久久久综合片| 精品欧美乱码久久久久久| 中文字幕日韩精品一区| 日韩不卡在线观看日韩不卡视频| 国产成人午夜精品影院观看视频 | 欧美精品一区二区三| 国产精品精品国产色婷婷| 午夜国产不卡在线观看视频| 国产精品99久久久久久久vr| 欧洲精品一区二区三区在线观看| 26uuu另类欧美亚洲曰本| 一区二区三区蜜桃| 国产一区二区伦理| 欧美在线观看一区二区| 国产午夜精品久久久久久久| 一区二区三区小说| 国产成人免费在线| 91精品在线观看入口| 亚洲欧美日韩小说| 激情综合网激情| 欧美精品久久99| 亚洲天堂中文字幕| 成人三级伦理片| 精品第一国产综合精品aⅴ| 亚洲一区二区三区四区五区中文 | 国产成人精品综合在线观看| 在线播放/欧美激情| 亚洲精品精品亚洲| 不卡av电影在线播放| 久久久精品人体av艺术| 免费久久99精品国产| 制服.丝袜.亚洲.另类.中文 | 国产精品成人网| 国产91精品一区二区麻豆网站| 日韩精品一区二区三区视频| 午夜精品福利一区二区三区av| 色综合久久99| 亚洲欧美日韩电影| 99久久久国产精品| 亚洲少妇30p| 91污片在线观看| 国产精品国产三级国产普通话99 | 国产精品久久久久久久久免费桃花 | 国产xxx精品视频大全| 26uuu亚洲| 国产一区 二区| 国产亚洲视频系列| 国产高清一区日本| 国产日韩欧美精品综合| 成人午夜伦理影院| 日韩一区欧美一区|