?? 11.txt
字號:
發信人: yaomc (白頭翁&山東大漢), 信區: DataMining
標 題: 數據挖掘--網站信息分析的好幫手。
發信站: 南京大學小百合站 (Thu Jan 24 10:54:59 2002), 站內信件
數據挖掘--網站信息分析的好幫手
人們在訪問網站的同時,便提供了個人對網站內容的反饋信息:點擊了哪一個
鏈接,在哪里瀏覽時間最多,用了哪個搜索項、總體瀏覽時間、個人姓名和住址等
。所有這些信息都被保存在一個數據庫中。
從數據庫保存的信息來看,網站擁有了大量的網站訪問者及其訪問內容的信息
,但擁有這些信息卻不見得能夠充分利用。借助數據倉庫報告系統(一般稱作在線
分析處理系統),只能報告可直接觀察到的和簡單相關的信息,不能告訴網站信息
模式及怎樣對其進行處理,并且它很難深刻分析復雜信息,需要網站自已加工與處
理。
然而,廠商和商業分析員可以采用數據挖掘技術來解決上述問題。
認識訪問者
為了讓網站能夠使用數據挖掘技術,廠商必須記錄訪問者特征及訪問者所使用
的條款特征。
訪問者特征包括人口統計特征、心理特征和技術特征。人口統計特征是一些可
變的屬性,比如家庭地址、收入、購買力或所擁有的娛樂設備。心理特征包括通過
心理調查發現的個性類型。技術特征是指訪問者的系統屬性,比如所采用的操作系
統、瀏覽器、域名和調制解調器的速度等等。
條款特征包括網絡內容信息(介質類型、內容分類和URL)和產品信息(產品編號
、產品目錄、顏色、體積、價格、利潤、數量和特價等級)等內容。
當訪問者訪問某網站時,有關訪問者的數據便會被逐漸積累起來。訪問者--條
款的交互信息主要包括購買歷史、廣告歷史和優選信息,其中,購買歷史是一個購
買產品和購買日期的目錄;廣告歷史表明把哪一個條款展示給訪問者;優選信息是
指訪問者訪問的優先等級;點擊流信息是訪問者點擊的超級鏈接的歷史信息;鏈接
機會是指提供給訪問者的超級鏈接。訪問者--網站統計信息是指每次會話的信息,
比如總的訪問時間、所瀏覽的網頁及每次會話的利潤等。訪問者--公司信息包括一
個訪問者推薦客戶的數量、每個月的訪問次數及上一次的訪問時間等,還包括商標
評價,即訪問者對商標正面或負面的評價,此信息可以通過周期性的廠商調查來獲
得。
列出目標
在網上進行交易的最大優點是廠商可以更加有效地估計出訪問者的反應。當廠
商有明確的且可以量化的目標時,采用數據挖掘技術的效果最好。廠商可以考慮這
樣一些目標:增加每次會話的平均瀏覽頁數;增加每次結賬的平均利潤;減少退貨
;增加顧客數量;提高商標知名度;提高回頭率(比如在30天內重新回來的顧客的
數量);增加每次訪問的結賬次數。
解決問題
解決問題的第一步是清楚地描述問題。通常,網絡廠商需要解決的問題是如何
尋找合適的廣告人群、將網頁個性化、把同時購買的貨物放在同一個網頁上、自動
地把商品分類,找出同一類訪問者的特征、估計貨物丟失的數據并預測未來行為。
所有這一切都涉及尋找并支持各種不同的隱含模式。
--
Welcome to http://datamining.bbs.lilybbs.net.
※ 來源:.南京大學小百合站 bbs.nju.edu.cn.[FROM: 202.204.36.15]
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -