亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

蟲蟲首頁(yè)| 資源下載| 資源專輯| 精品軟件
登錄| 注冊(cè)

您現(xiàn)在的位置是:蟲蟲下載站 > 資源下載 > 多國(guó)語(yǔ)言處理 > 「我是中國(guó)人」

「我是中國(guó)人」

  • 資源大小:1634 K
  • 上傳時(shí)間: 2015-12-18
  • 上傳用戶:m472333662
  • 資源積分:2 下載積分
  • 標(biāo)      簽:

資 源 簡(jiǎn) 介

「我是中國(guó)人」,ChineseTokenizer會(huì)將之分割為五個(gè)中文字:「我、是、中、國(guó)、人」,CJKTokenizer則會(huì)將之分割為「我是、是中、中國(guó)、國(guó)人」四個(gè)二節(jié)的詞。前者的問題是沒有考慮中文詞語(yǔ)的問題,如搜尋「國(guó)中」一樣搜尋到「我是中國(guó)人」。後者的問題則是制做了大量沒意義的詞如「是中」「國(guó)人」,讓索引沒必要地增大、降低搜尋效率。

相 關(guān) 資 源

主站蜘蛛池模板: 正安县| 元谋县| 上犹县| 龙海市| 宜宾县| 垫江县| 那坡县| 嘉善县| 伊川县| 沙河市| 永年县| 昭平县| 蛟河市| 怀宁县| 香港 | 崇仁县| 论坛| 鹤岗市| 宁阳县| 封开县| 准格尔旗| 舟山市| 高平市| 安国市| 平凉市| 陇西县| 德化县| 文化| 洞口县| 通河县| 清远市| 顺平县| 翁牛特旗| 鹿邑县| 徐州市| 渝中区| 寿宁县| 高安市| 上栗县| 连山| 双峰县|