「我是中國人」,ChineseTokenizer會將之分割為五個中文字:「我、是、中、國、人」,CJKTokenizer則會將之分割為「我是、是中、中國、國人」四個二節的詞。前者的問題是沒有考慮中文詞語的問題,如搜尋「國中」一樣搜尋到「我是中國人」。後者的問題則是制做了大量沒意義的詞如「是中」「國人」,讓索引沒必要地增大、降低搜尋效率。
標簽:
上傳時間: 2015-12-18
上傳用戶:stvnash
《金庸作品全集》僅含其文字作品,其他的如訪談錄(已經有的例外)等就不收錄了。在訪談錄一類中最有名的,當屬自一九九五年十一月十六日起,歷時兩年有餘,由作為資深報人和擁有最多讀者的中國小說家金庸先生,和國際著名宗教思想家和文化和平的“民間大使”,並榮獲世界各地高等學府的名譽稱號及“世界桂冠詩人”雅稱的池田大作先生(曾與世界各國著名科學家、作家、政治家、文化人“對談”。其中,與英國歷史學家湯恩比的對談錄《二十一世紀的對話》最為著名),圍繞香港回歸、言論自由、佛學哲理、文學愛好等問題,以口頭或書信形式進行的世紀性對話。
上傳時間: 2015-09-06
上傳用戶:2467478207
檔案資料:全球IP地址地理位置數據資料庫包包 更新日期:2005年05月12日12:51 資料容量:10.4 MB 附 註: A) IP資料經人手花上五小時整理,保證100%準確,所有論壇程式皆可相容。 B) 已修正「未知地理位置」的“未”和“末”字輸入筆誤。 C) 因IP數據從中國內地取得,故此TAIWAN地區被寫成“臺灣省”,可自行改回“中華民國”或“臺灣”。 D) 範例: 202.101.071.201|202.101.071.201|貴州省貴陽市 藍月網吧|| 202.101.071.202|202.101.071.203|貴州省貴陽市 花溪區貴州民族學院鵬飛網吧|| 202.101.071.204|202.101.071.204|貴州省貴陽市 二戈寨天知網吧||
標簽: 2005 10.4 12 51
上傳時間: 2013-12-25
上傳用戶:ddddddos
我們在做一個單片機系統時,常常會遇到這樣那樣的數據采集,在這些被采集的數據中,大部分可以通過我們的I/O口擴展接口電路直接得到,由于51單片機大部分不帶AD轉換器,所以模擬量的采集就必須靠A/D或V/F實現。下現我們就來了解一下AD0809與51單片機的接口及其程序設計。
標簽: 0809 AD 51單片機 中的應用
上傳時間: 2013-10-19
上傳用戶:gaome
裝箱問題:在裝箱問題中,有若干個容量為c 的箱子和n 個待裝載入箱子中的物品。物品i 需占 用s[i]個單元(0< s[i]≤c)。成功裝載是指能把所有物品都裝入箱子。最優裝載是指使用最 少箱子的成功裝載。 例如某運輸公司要把包裹裝入卡車中,每個包裹都有一定的重量,且每輛卡車也有其載 重限制(假設每輛卡車的載重都一樣)。在卡車裝載問題中,希望用最少的卡車來裝載包裹。 此問題可看作裝箱問題。卡車對應于箱子,包裹對應于物品。 解裝箱問題的Best Fit 算法: 設avail[i]為箱子i 的可用容量。 初始時,所有箱子的可用容量為c 。 選擇物品i放入具有最小avail且容量大于s[i]的箱子中。
上傳時間: 2015-05-22
上傳用戶:yan2267246
畫出蜂窩圖,并實現移動通信中移動臺識別其家區的代碼。
標簽: 蜂窩
上傳時間: 2013-11-26
上傳用戶:清風冷雨
這是一個在匯編語言中如何實現階乘的小程序,可完成N!及另一個字符匹配問題的小程序
標簽: 匯編語言 程序
上傳時間: 2016-06-04
I2C總線對硬件系統中進行器件的連接控制,I/O資料的占用
標簽: I2C 總線 器件 硬件系統
上傳時間: 2014-12-21
上傳用戶:離殤
多邊形中軸算法,時間復雜度在o(n),看看吧,支持下
標簽: 算法
上傳時間: 2014-01-20
上傳用戶:nanfeicui
讀取油藏數值模擬軟件eclipse中的井位所在網格,然后計算某井附近n個網格的有效厚度、滲透率、含水飽和度的平均值。
標簽: eclipse 讀取 數值模擬 網格
上傳時間: 2013-12-31
上傳用戶:yoleeson
蟲蟲下載站版權所有 京ICP備2021023401號-1