?? 770.txt
字號(hào):
發(fā)信人: soullion (river), 信區(qū): DataMining
標(biāo) 題: 智能信息“推-拉”技術(shù)
發(fā)信站: 南京大學(xué)小百合站 (Fri Mar 1 11:30:52 2002)
發(fā)信人: wangxiaoxia (等待是一生最初蒼老,浪漫是自己心靈吟唱), 信區(qū): InfoManage
r
標(biāo) 題: 智能信息“推-拉”技術(shù)
發(fā)信站: 南京大學(xué)小百合站 (Fri Feb 23 20:09:11 2001), 站內(nèi)信件
智能信息“推-拉”技術(shù)
·西網(wǎng)·
----------------------------------------------------------------------------
----
---- 現(xiàn)代信息科學(xué)技術(shù)的發(fā)展,為人們提供了多種多樣的信息獲取和傳送方法及技術(shù),
從“信 源”與“用戶(hù)”的關(guān)系來(lái)看,可分為兩種模式:“信息推送”模式(Information
Push),由“信 源”主動(dòng)將信息推送給“用戶(hù)”,如電臺(tái)廣播;“信息拉取”模式(Info
rmation Pull),由“用 戶(hù)”主動(dòng)從“信源”中拉取信息,如查詢(xún)數(shù)據(jù)庫(kù)。
----上述兩種信息“推送”與“拉取”模式,各有其優(yōu)缺點(diǎn)。 如何取長(zhǎng)補(bǔ)短、相互結(jié)合
是需要研究的一個(gè)問(wèn)題。
----隨著信息高速公路的發(fā)展和普及,人們被包圍在信息的汪 洋大海中。Internet是海
量信源,網(wǎng)上的海量信息,既有有用的知識(shí),也有無(wú)用的“垃圾”。 新的信息不斷地、
迅速地產(chǎn)生,信息量以指數(shù)規(guī)律猛烈地增長(zhǎng)和擴(kuò)展,形成“信息爆炸”。 因此,如何從
海量的數(shù)據(jù)和信息中高效地獲取有用知識(shí),如何從迅速爆炸的信息中及時(shí) 地獲取最新信
息,如何提高信息拉取與推送的智能水平,如何提高Internet、數(shù)據(jù)庫(kù)的主 動(dòng)信息服務(wù)
能力,如何滿(mǎn)足各種用戶(hù)不同的個(gè)性化需求等,都是人們面臨的挑戰(zhàn)性課題。
一、 信息推送技術(shù)
----傳統(tǒng)的、典型的信息推送模式,如電臺(tái)廣播,作為“信 源”的電臺(tái)主動(dòng)向廣大聽(tīng)眾
——用戶(hù),及時(shí)地播送各種信息。
----信息推送模式的主要優(yōu)點(diǎn)是:及時(shí)性好,信源及時(shí)地向用 戶(hù)推送不斷更新的動(dòng)態(tài)信
息;對(duì)用戶(hù)要求低,普遍適用于廣大公眾,不要求用戶(hù)有專(zhuān)門(mén)的 技術(shù)。
----主要缺點(diǎn)是:針對(duì)性差,推送的信息內(nèi)容缺乏針對(duì)性,不 便滿(mǎn)足用戶(hù)的個(gè)性要求;
信源任務(wù)重,信源系統(tǒng)要主動(dòng)地、快速地、不斷地將大量信息 推送給用戶(hù)。
----Internet的信息推送技術(shù),也被稱(chēng)為“網(wǎng)播(Netcast)”, 是1996年由Pointcas
t Network公司首先提出的。它與有關(guān)媒體公司合作,利用其信息推送 軟件,向Intern
et的廣大用戶(hù),主動(dòng)地發(fā)布、推送各種新聞、財(cái)經(jīng)、體育等信息。用戶(hù)在 Internet上瀏
覽,不是盲目地點(diǎn)擊和游蕩,而是像收聽(tīng)電臺(tái)廣播那樣,可選擇自己感興趣 的頻道或節(jié)
目,有目的地獲取信息。因此,網(wǎng)播可認(rèn)為是廣播模式在Internet上的應(yīng)用和 發(fā)展。
----1. “網(wǎng)播”的信息推送方式
----(1) 頻道式推送 頻道式網(wǎng)播技術(shù)是目前普遍采用的一 種模式,它將某些頁(yè)面定義
為瀏覽器中的頻道,用戶(hù)可像選擇電視頻道那樣接收有興趣 的網(wǎng)播信息。目前還沒(méi)有一
個(gè)統(tǒng)一的技術(shù)標(biāo)準(zhǔn)。Microsoft、Netscape、Pointcast都有各 自的頻道定義格式。例如
,Microsoft提出的“頻道定義格式(CDF:Channel Definition Format)”是一種為現(xiàn)有
站點(diǎn)信息內(nèi)容建立的目標(biāo)索引文本文件,它提供了獨(dú)立于信息格 式的基于內(nèi)容的索引結(jié)
構(gòu),允許個(gè)人化定制的信息推送,可優(yōu)化安排推送時(shí)間,以提高 信息推送的效率;Nets
cape提出了一種“元內(nèi)容格式(MCF: Meta Content Format)”是基于 “元內(nèi)容”的網(wǎng)
播方式。
----(2) 郵件式推送 用電子郵件方式主動(dòng)將所推送信息發(fā) 布給各用戶(hù),如國(guó)際會(huì)議的
通知、產(chǎn)品的廣告等。
----(3)網(wǎng)頁(yè)式推送 在一個(gè)特定網(wǎng)頁(yè)內(nèi)將所推送的信息提供 給用戶(hù),如某企業(yè)、某組織
、某個(gè)人的網(wǎng)頁(yè)。
----(4)專(zhuān)用式推送 采用專(zhuān)門(mén)的信息發(fā)送和接收軟件,信源 將信息推送給專(zhuān)門(mén)用戶(hù),如
機(jī)密的點(diǎn)對(duì)點(diǎn)通信。
----Microsoft和Netscape的Web瀏覽器都支持信息推送模式, Pointcast Inc.等公司還
開(kāi)發(fā)了一些網(wǎng)上信息推送軟件,如Pointcast Network等。我國(guó)的網(wǎng)絡(luò) 軟件“資訊天使
(WebAgent) ”也具有信息推送功能。
----2.智能數(shù)據(jù)庫(kù)系統(tǒng)的主動(dòng)信息推送
----(1) 操作式推送(客戶(hù)推送式) 由客戶(hù)數(shù)據(jù)操作啟動(dòng)信 息推送。當(dāng)某客戶(hù)對(duì)數(shù)據(jù)
進(jìn)行操作時(shí),把修改后的新數(shù)據(jù)存入數(shù)據(jù)庫(kù)后,即啟動(dòng)信息推 送過(guò)程,將新數(shù)據(jù)推送給
其他客戶(hù)。
----(2) 觸發(fā)式推送(服務(wù)器推送式) 由數(shù)據(jù)庫(kù)中的觸發(fā)器 啟動(dòng)信息推送。當(dāng)數(shù)據(jù)發(fā)
生變化時(shí),出現(xiàn)增加(Insert)、刪除(Delete)、修改(Update)操作時(shí), 觸發(fā)器啟動(dòng)信息
推送過(guò)程。
----3.信息推送的方式
----(1)直接推送式 直接將信源中的信息本身(數(shù)據(jù)、圖表、 圖像等)送給用戶(hù)。
----(2) 間接推送式 只將有關(guān)信息的目錄或索引通知發(fā)送 給用戶(hù),由用戶(hù)根據(jù)通知去
查詢(xún)相應(yīng)的信源。
二、 信息拉取技術(shù)
----常用的、典型的信息拉取技術(shù),如數(shù)據(jù)庫(kù)查詢(xún)是由用戶(hù) 主動(dòng)查詢(xún)數(shù)據(jù)庫(kù),從數(shù)據(jù)庫(kù)
中拉取所需信息。其主要優(yōu)點(diǎn)是:針對(duì)性好,用戶(hù)針對(duì)自己 的需求有目的地去查詢(xún)、搜
索所需的信息;信源任務(wù)輕,信息系統(tǒng)只是被動(dòng)地接受查詢(xún), 提供用戶(hù)所需的部分信息
。
----主要缺點(diǎn)是:及時(shí)性差,當(dāng)信源中信息更新變化時(shí), 用戶(hù)難以及時(shí)拉取新的動(dòng)態(tài)信
息;對(duì)用戶(hù)要求高,要求用戶(hù)對(duì)信源系統(tǒng)有相應(yīng)的專(zhuān)業(yè)知 識(shí),并掌握查詢(xún)技術(shù)。
----Internet上的信息拉取技術(shù)(“網(wǎng)查”)可以說(shuō)是數(shù)據(jù)庫(kù) 查詢(xún)技術(shù)(“庫(kù)查”)的擴(kuò)展
和延伸。用戶(hù)面對(duì)的不止是一個(gè)數(shù)據(jù)庫(kù),而是擁有海量信息的 Internet環(huán)境。因此,近
幾年來(lái),發(fā)展了各種網(wǎng)絡(luò)信息拉取(查詢(xún))的輔助工具——“搜 索引擎 (Search Engi
ne) ”,不同的搜索引擎有不同的功能和用途,且各有其特點(diǎn)。它可 分為兩類(lèi):
----1. 目錄分類(lèi)式搜索引擎
----這類(lèi)搜索引擎提供按類(lèi)編排的網(wǎng)站目錄,有站名、網(wǎng) 址及摘要信息。用戶(hù)可按信息
類(lèi)別查詢(xún),進(jìn)行網(wǎng)站檢索。在文字框中輸入要查詢(xún)的關(guān)鍵 詞,點(diǎn)擊按紐,便可將有關(guān)網(wǎng)
站站名、網(wǎng)址及摘要信息拉取出來(lái)。目前,“搜狐”、“常 青藤”等都屬于目錄分類(lèi)搜
索引擎。
----2. 全文檢索式搜索引擎
----這類(lèi)搜索引擎提供全文檢索功能。用戶(hù)通過(guò)輸入關(guān)鍵 詞、點(diǎn)擊按紐,可將與關(guān)鍵詞
相關(guān)的各個(gè)網(wǎng)頁(yè)的地址和相應(yīng)的一段全文信息拉取出來(lái)。 HotBot 、Altavista等就屬全
文搜索引擎。
----上述兩類(lèi)搜索引擎各有其優(yōu)缺點(diǎn):
目錄分類(lèi)式搜索引擎比較簡(jiǎn)單,可有效地查詢(xún)到所需的站點(diǎn),適用于目錄查 詢(xún)。
全文檢索式搜索引擎比較復(fù)雜,可自動(dòng)檢索WWW站點(diǎn)的最新網(wǎng)頁(yè),適用于文檔 檢索。
----需要進(jìn)一步發(fā)展目錄分類(lèi)與全文檢索相結(jié)合的搜索 引擎,為用戶(hù)提供從網(wǎng)上拉取信
息更靈活、更高效的工具。
三、 信息推拉技術(shù)
----信息推送與信息拉取兩種模式各有其優(yōu)缺點(diǎn),兩者 的比較如下表所示:
----因此,應(yīng)當(dāng)取長(zhǎng)補(bǔ)短,靈活地應(yīng)用信息推送與信息拉 取技術(shù),研究、開(kāi)發(fā)兩者相結(jié)
合的“信息推拉”技術(shù)。
----信息“推
?? 快捷鍵說(shuō)明
復(fù)制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號(hào)
Ctrl + =
減小字號(hào)
Ctrl + -