亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

蟲(chóng)蟲(chóng)首頁(yè)| 資源下載| 資源專(zhuān)輯| 精品軟件
登錄| 注冊(cè)

信息抽取

信息抽取(InformationExtraction:IE)是把文本里包含的信息進(jìn)行結(jié)構(gòu)化處理,變成表格一樣的組織形式。抽取系統(tǒng)的輸入信息是原始文本,輸出的是固定格式的信息點(diǎn)。信息點(diǎn)從各種各樣的文檔中被抽取出來(lái),然后以統(tǒng)一的形式集成在一起。這就是信息抽取的主要任務(wù)。信息以統(tǒng)一的形式集成在一起的好處是方便檢查和比較。信息抽取技術(shù)并不試圖全面理解整篇文檔,只是對(duì)文檔中包含相關(guān)信息的部分進(jìn)行分析。至于哪些信息是相關(guān)的,那將由系統(tǒng)設(shè)計(jì)時(shí)定下的領(lǐng)域范圍而定。
主站蜘蛛池模板: 谢通门县| 铜陵市| 柯坪县| 梅河口市| 嫩江县| 当涂县| 兴海县| 资阳市| 银川市| 和硕县| 广河县| 临洮县| 从江县| 分宜县| 嫩江县| 广元市| 定州市| 津市市| 萝北县| 虎林市| 铅山县| 澄迈县| 安庆市| 惠安县| 上栗县| 桐柏县| 会宁县| 林周县| 浙江省| 从江县| 疏附县| 海兴县| 海伦市| 西乌珠穆沁旗| 正镶白旗| 上饶市| 天镇县| 衡阳县| 申扎县| 江都市| 新竹市|