?? 1.txt
字號:
發信人: soullion (river), 信區: DataMining
標 題: 智能信息“推-拉”技術
發信站: 南京大學小百合站 (Fri Mar 1 11:30:52 2002)
發信人: wangxiaoxia (等待是一生最初蒼老,浪漫是自己心靈吟唱), 信區: InfoManage
r
標 題: 智能信息“推-拉”技術
發信站: 南京大學小百合站 (Fri Feb 23 20:09:11 2001), 站內信件
智能信息“推-拉”技術
·西網·
----------------------------------------------------------------------------
----
---- 現代信息科學技術的發展,為人們提供了多種多樣的信息獲取和傳送方法及技術,
從“信 源”與“用戶”的關系來看,可分為兩種模式:“信息推送”模式(Information
Push),由“信 源”主動將信息推送給“用戶”,如電臺廣播;“信息拉取”模式(Info
rmation Pull),由“用 戶”主動從“信源”中拉取信息,如查詢數據庫。
----上述兩種信息“推送”與“拉取”模式,各有其優缺點。 如何取長補短、相互結合
是需要研究的一個問題。
----隨著信息高速公路的發展和普及,人們被包圍在信息的汪 洋大海中。Internet是海
量信源,網上的海量信息,既有有用的知識,也有無用的“垃圾”。 新的信息不斷地、
迅速地產生,信息量以指數規律猛烈地增長和擴展,形成“信息爆炸”。 因此,如何從
海量的數據和信息中高效地獲取有用知識,如何從迅速爆炸的信息中及時 地獲取最新信
息,如何提高信息拉取與推送的智能水平,如何提高Internet、數據庫的主 動信息服務
能力,如何滿足各種用戶不同的個性化需求等,都是人們面臨的挑戰性課題。
一、 信息推送技術
----傳統的、典型的信息推送模式,如電臺廣播,作為“信 源”的電臺主動向廣大聽眾
——用戶,及時地播送各種信息。
----信息推送模式的主要優點是:及時性好,信源及時地向用 戶推送不斷更新的動態信
息;對用戶要求低,普遍適用于廣大公眾,不要求用戶有專門的 技術。
----主要缺點是:針對性差,推送的信息內容缺乏針對性,不 便滿足用戶的個性要求;
信源任務重,信源系統要主動地、快速地、不斷地將大量信息 推送給用戶。
----Internet的信息推送技術,也被稱為“網播(Netcast)”, 是1996年由Pointcas
t Network公司首先提出的。它與有關媒體公司合作,利用其信息推送 軟件,向Intern
et的廣大用戶,主動地發布、推送各種新聞、財經、體育等信息。用戶在 Internet上瀏
覽,不是盲目地點擊和游蕩,而是像收聽電臺廣播那樣,可選擇自己感興趣 的頻道或節
目,有目的地獲取信息。因此,網播可認為是廣播模式在Internet上的應用和 發展。
----1. “網播”的信息推送方式
----(1) 頻道式推送 頻道式網播技術是目前普遍采用的一 種模式,它將某些頁面定義
為瀏覽器中的頻道,用戶可像選擇電視頻道那樣接收有興趣 的網播信息。目前還沒有一
個統一的技術標準。Microsoft、Netscape、Pointcast都有各 自的頻道定義格式。例如
,Microsoft提出的“頻道定義格式(CDF:Channel Definition Format)”是一種為現有
站點信息內容建立的目標索引文本文件,它提供了獨立于信息格 式的基于內容的索引結
構,允許個人化定制的信息推送,可優化安排推送時間,以提高 信息推送的效率;Nets
cape提出了一種“元內容格式(MCF: Meta Content Format)”是基于 “元內容”的網
播方式。
----(2) 郵件式推送 用電子郵件方式主動將所推送信息發 布給各用戶,如國際會議的
通知、產品的廣告等。
----(3)網頁式推送 在一個特定網頁內將所推送的信息提供 給用戶,如某企業、某組織
、某個人的網頁。
----(4)專用式推送 采用專門的信息發送和接收軟件,信源 將信息推送給專門用戶,如
機密的點對點通信。
----Microsoft和Netscape的Web瀏覽器都支持信息推送模式, Pointcast Inc.等公司還
開發了一些網上信息推送軟件,如Pointcast Network等。我國的網絡 軟件“資訊天使
(WebAgent) ”也具有信息推送功能。
----2.智能數據庫系統的主動信息推送
----(1) 操作式推送(客戶推送式) 由客戶數據操作啟動信 息推送。當某客戶對數據
進行操作時,把修改后的新數據存入數據庫后,即啟動信息推 送過程,將新數據推送給
其他客戶。
----(2) 觸發式推送(服務器推送式) 由數據庫中的觸發器 啟動信息推送。當數據發
生變化時,出現增加(Insert)、刪除(Delete)、修改(Update)操作時, 觸發器啟動信息
推送過程。
----3.信息推送的方式
----(1)直接推送式 直接將信源中的信息本身(數據、圖表、 圖像等)送給用戶。
----(2) 間接推送式 只將有關信息的目錄或索引通知發送 給用戶,由用戶根據通知去
查詢相應的信源。
二、 信息拉取技術
----常用的、典型的信息拉取技術,如數據庫查詢是由用戶 主動查詢數據庫,從數據庫
中拉取所需信息。其主要優點是:針對性好,用戶針對自己 的需求有目的地去查詢、搜
索所需的信息;信源任務輕,信息系統只是被動地接受查詢, 提供用戶所需的部分信息
。
----主要缺點是:及時性差,當信源中信息更新變化時, 用戶難以及時拉取新的動態信
息;對用戶要求高,要求用戶對信源系統有相應的專業知 識,并掌握查詢技術。
----Internet上的信息拉取技術(“網查”)可以說是數據庫 查詢技術(“庫查”)的擴展
和延伸。用戶面對的不止是一個數據庫,而是擁有海量信息的 Internet環境。因此,近
幾年來,發展了各種網絡信息拉?。ú樵儯┑妮o助工具——“搜 索引擎 (Search Engi
ne) ”,不同的搜索引擎有不同的功能和用途,且各有其特點。它可 分為兩類:
----1. 目錄分類式搜索引擎
----這類搜索引擎提供按類編排的網站目錄,有站名、網 址及摘要信息。用戶可按信息
類別查詢,進行網站檢索。在文字框中輸入要查詢的關鍵 詞,點擊按紐,便可將有關網
站站名、網址及摘要信息拉取出來。目前,“搜狐”、“常 青藤”等都屬于目錄分類搜
索引擎。
----2. 全文檢索式搜索引擎
----這類搜索引擎提供全文檢索功能。用戶通過輸入關鍵 詞、點擊按紐,可將與關鍵詞
相關的各個網頁的地址和相應的一段全文信息拉取出來。 HotBot 、Altavista等就屬全
文搜索引擎。
----上述兩類搜索引擎各有其優缺點:
目錄分類式搜索引擎比較簡單,可有效地查詢到所需的站點,適用于目錄查 詢。
全文檢索式搜索引擎比較復雜,可自動檢索WWW站點的最新網頁,適用于文檔 檢索。
----需要進一步發展目錄分類與全文檢索相結合的搜索 引擎,為用戶提供從網上拉取信
息更靈活、更高效的工具。
三、 信息推拉技術
----信息推送與信息拉取兩種模式各有其優缺點,兩者 的比較如下表所示:
----因此,應當取長補短,靈活地應用信息推送與信息拉 取技術,研究、開發兩者相結
合的“信息推拉”技術。
----信息“推
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -