亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

? 歡迎來到蟲蟲下載站! | ?? 資源下載 ?? 資源專輯 ?? 關于我們
? 蟲蟲下載站

?? 747.txt

?? This complete matlab for neural network
?? TXT
字號:
發信人: mining (key), 信區: DataMining
標  題: 數據挖掘語言淺析
發信站: 南京大學小百合站 (Sat Dec  8 12:04:57 2001), 站內信件

(復旦大學:朱劍秋,張曉飛等)1.  引言 
隨著網絡技術的發展和計算機使用的日益廣泛,電子化數據越來越多,人們正面臨“數據
豐富而知識貧乏”的問題。八十年代末興起的數據挖掘(data mining)技術或數據庫中的
知識發現(knowledge discovery in database,KDD)技術為解決此問題開辟了一條道路
。數據挖掘是在大量的數據中發現潛在的、有價值的模式和數據間關系(知識)的過程。
經過十多年的工作 ,數據挖掘技術的研究與應用已取得了很大的成果,然而,我們還面臨
著許多問題:(1)各種數據挖掘問題及挖掘方法基于不同的模型和技術,彼此互相孤立,
聯系很少;(2)缺少簡明精確的問題描述方法,挖掘的語義通常是由實現方法決定的;(
3)數據挖掘系統僅提供孤立的知識發現功能,難于嵌入大型應用;(4)數據挖掘引擎與
數據庫系統是松散耦合,T.Imielinski 和 H.Mannila 稱其為"文件挖掘(file mining)系
統",它沒有提供應用獨立的操作原語。 
到目前為止,數據挖掘行業是高度分散的,公司和研究機構獨立開發各自的數據挖掘系統
和平臺,沒有形成開放性的標準;同時數據挖掘本身是一門多學科綜合跨度非常大的技術
,這兩點是上述問題存在的根本原因。近年來數據挖掘語言的研究為解決上列問題,提出
一個新的研究方向。 
    本文組織結構如下:在第2節提出了數據挖掘語言分類的方法,將數據挖掘語言分為:
查詢語言,建模語言,以及通用語言三種類型,然后,分別在2.1、2.2與2.3小節舉例闡述
這三種數據挖掘語言的特點。在第3節對三種數據挖掘語言進行分析與評價,指出了各自的
優缺點。最后指出了數據挖掘語言的發展趨勢,以及若干待解決的問題。 
2.     數據挖掘語言的分類 
設計一個好的數據挖掘語言的重要性可以通過觀察關系數據庫系統的歷史來證實。在數據
庫市場上,關系數據庫系統已經占支配地位數十年了。關系查詢語言的標準化,發生在關
系數據庫開發的早期階段,關系數據庫領域的成功廣泛地依賴于關系數據庫查詢語言的標
準化。盡管每個商業的關系數據庫系統都有各自的圖形用戶接口GUI,每個接口的根本的核
心仍然是標準化的關系數據庫查詢語言。關系查詢語言的標準化為關系數據庫的開發和發
展提供了基礎。它使得信息交換更加容易,同時提升了關系數據庫技術的商業性和被廣泛
接受的程度。因此,有一個好的數據挖掘語言可以有助于數據挖掘系統平臺的標準化的開
發,甚至可以象HTML推動Internet的發展一樣,推動數據挖掘行業的開發和發展。
設計全面的數據挖掘語言是一個巨大的挑戰,因為數據挖掘覆蓋了寬廣的任務,從數據特
征化到挖掘關聯規則,數據分類,聚集和偏差檢測,等等。每個任務都有不同的需求。設
計一個有效的數據挖掘語言需要對各種不同的數據挖掘任務的能力、限制、以及運行機制
都有深入地理解。       數據挖掘語言的研究經歷了兩個階段,第一個階段是研究單位和
公司自行研究和開發階段;第二階段是研究單位和公司組成聯盟,研制和開發數據挖掘語
言標準化的階段。這兩個階段趨勢界限是很明顯的。第一個階段成果包括Jiawei Han等研
制的DMQL;Imielinski和Virmani提出的MSQL;Meo、Psaila、和Ceri提出MINE RULE操作器
;等。第二階段主要包括數據挖掘組織協會(DMG)提出的預言模型標記語言PMML,以及微
軟公司提出的OLE DB for Data Mining規范。
       對于上述數據挖掘語言,根據功能和側重點不同,我們將其分為三種類型:數據挖
掘查詢語言;數據挖掘建模語言;通用數據挖掘語言。第一階段的數據挖掘語言一般屬于
查詢語言;PMML屬于建模語言;OLE DB for DM屬于通用數據挖掘語言。下面我們分別介紹
其特點和功能。2.1  數據挖掘查詢語言[1,2] 
數據挖掘系統應該有能力支持特殊的和交互的數據挖掘(sad-hoc and interactive data 
mining),目的是為了靈活和有效的知識發現。數據挖掘查詢語言即是設計用來支持這個特
點的。我們首先以加拿大Simon Franser大學Jiawei Han等開發的數據挖掘系統DBMiner中
數據挖掘查詢語言DMQL(Data Mining Query Language)來介紹查詢語言的特點,接著簡
單介紹其它研究工作。
數據挖掘查詢語言DMQL由數據挖掘原語組成,數據挖掘原語用來定義一個數據挖掘任務。
用戶使用數據挖掘原語與數據挖掘系統通信,使得知識發現更有效。這些原語有以下幾個
種類:數據庫一部分的規范以及用戶感興趣的數據集(包括感興趣的數據庫屬性或數據倉
庫的維度);挖掘知識的種類;在指導挖掘過程中有用的背景知識;模式估值的興趣度測
量;以及挖掘出的知識如何可視化表示。數據挖掘原語允許用戶在挖掘過程中從不同的角
度或深度與數據挖掘系統進行交互式地通信。
數據挖掘查詢的基本單位是數據挖掘任務,通過數據挖掘查詢語言,數據挖掘任務可以通
過查詢的形式輸入到數據挖掘系統中。一個數據挖掘查詢由以下五種基本的數據挖掘原語
定義:
1)  任務相關數據原語
這是被挖掘的數據庫的一部分。挖掘的數據不是整個數據庫,只是和具體商業問題相關、
或者用戶感興趣的數據集,即是數據庫中一部分表,以及表中感興趣的屬性。該原語包括
以下具體的內容:數據庫或數據倉庫的名稱;數據庫表或數據倉庫的立方體;數據選擇的
條件;相關的屬性或維;數據分組定義。
2)  被挖掘的知識的種類原語
該原語指定被執行的數據挖掘的功能,在DMQL中將挖掘知識分為五種類型,即五種知識的
表達:特征規則;辨別規則;關聯規則;分類/預言;聚集。
3)  背景知識原語
用戶能夠指定背景知識,或者關于被挖掘的領域知識。這些知識對于引導知識發現過程和
評估發現的模式都是非常有用的。背景知識原語包括:概念層次(concept hierarchy);
對數據關系的用戶信任度(user beliefs about relationships in the data)。
4)  興趣度測量原語
這個功能是將不感興趣的模式從知識中排除出去。興趣度測量能夠用來引導數據挖掘過程
,或者在發現后評估被發現的模式。不同種類的知識有不同種類的興趣度測量方法。例如
對關聯規則來說,興趣度測量包括支持度(support)和可信度(confidence)。低于用戶
指定的支持度和可信度閾值的規則被認為是不感興趣的。興趣度測量原語包括:簡單性(
simplicity);確定性(certainty,比如:可信度);效用(utility,比如:支持度)
;新穎性(novelty)。
5)  被發現模式的表示和可視化原語
這個原語定義被發現的模式顯示的方式,用戶能夠選擇不同的知識表示形式。該原語包括
:規則,表格,報告,圖表,圖形,決策樹,和立方體;向下鉆入和向上累積(drill-do
wn and roll-up)。 
DMQL正是基于這些原語設計的數據挖掘查詢語言。它允許從關系數據庫和數據倉庫中多個
抽象層次上特殊(ad-hoc)和交互地挖掘多種種類的知識。DMQL采用類似SQL語言的語法,
因此它能夠很容易地和關系查詢語言SQL集成。
除了DMQL以外,我們簡單介紹其它一些數據挖掘查詢語言的研究工作。MSQL是一個數據挖
掘查詢語言,它有Imielinski和Virmani提出。這個語言使用了類似SQL的語法和SQL原語(
包括排序、分組、和其它原語)。既然在數據挖掘中可能產生大量的規則,MSQL提供了一
個稱作GetRule和SelectRule的原語,用于規則產生和規則選擇。它統一地對待數據和規則
,因此,能夠在執行數據選擇,以及基于查詢的規則產生時進行優化工作,同時也能在操
縱或者查詢產生規則的集合時進行優化。其它在數據挖掘語言設計方面的研究工作包括Me
o、Psaila、和Ceri提出MINE RULE操作器。它同樣遵循類似SQL的語法,是為挖掘關聯規則
設計的規則產生查詢語言。
2.2  數據挖掘建模語言[3] 
數據挖掘建模語言是對數據挖掘模型進行描述和定義的語言。如果我們設計一種標準的數
據挖掘建模語言,使得數據挖掘系統在模型定義和描述方面有標準可以遵循,那么各系統
之間可以共享模型,既可以解決目前各數據挖掘系統之間封閉性的問題,有可以在其它應
用系統中間嵌入數據挖掘模型,解決孤立的知識發現問題。“預言模型標記語言”(Pred
ictive Model Markup Language,PMML)正是這樣一種數據挖掘建模語言。
PMML被一個稱作數據挖掘協會(The Data Mining Group ,http://www.dmg.org/,DMG)
的組織開發。該組織由Angoss, Magnify, NCR, SPSS和芝加哥Illinois大學 等企業和
單位組成,它的目的是開發預言模型開放標準,策略是將此標準推薦給W3C工作組,使PMM
L成為W3C的正式推薦物。目前DMG宣布了定義預言模型開放標準的第一個版本PMML 1.0。P
MML主要目的是允許應用程序和聯機分析處理(OLAP)工具能從數據挖掘系統獲得模型,而
不用獨自開發數據挖掘模塊。另一個目的是能夠收集使用大量潛在的模型,并且統一管理
各種模型的集合。這些能力在商業應用領域是有效的配置分析模型的基礎。
PMML是一種基于XML的語言,用來定義預言模型。它為各個公司定義預言模型和在不同的應
用程序之間共享模型提供了一種快速并且簡單的方式。通過使用標準的XML解析器對PMML進
行解析,應用程序能夠決定模型輸入和輸出的數據類型,模型詳細的格式,并且按照標準
的數據挖掘術語來解釋模型的結果。
PMML提供了一個靈活機制來定義預言模型的模式,同時支持涉及多個預言模型的模型選擇
和模型平衡(model averaging)。對于那些需要全部學習、部分學習和分布式學習(ens
emble learning, partitioned learning, and distributed learning)的應用程序,這
種語言被證明是非常有用的。另外,它使得在不同的應用程序和系統之間移動預言模型變
得容易、方便。特別地,PMML非常適合部分學習、元學習、分布式學習、以及相關領域。

使用PMML進行模型定義由以下幾部分組成:
1)    頭文件(a header)
2)    數據模式(a data schema)
3)    數據挖掘模式(a data mining schema)
4)    預言模型模式(a predictive model schema)
5)    預言模型定義(definitions for predictive models)
6)    全體模型定義(definitions for ensembles of models)
7)    選擇和聯合模型和全體模型的規則(rules for selecting and combining models
 and ensembles of models)
8)    異常處理的規則(rules for exception handling)
其中第5項組件是必不可少的。另外預言模型的模式必須被定義,這能夠利用一個或多個模
式(組件3,4,5)來定義。其它幾項組件是可選的。
PMML1.0標準版提供了一個小的DTD(文檔類型定義,XML術語)集合,DTD詳細說明了決策
樹和多項式回歸模型的實體和屬性。DTD1.0遵循著一個通用模式,該模式將一個數據字典
和一個或多個模型的定義相結合,數據字典能夠立即應用于模式。數據字典的元素是非常
簡單的。
       DMG當前正在制定PMML版本1.1,該版本提供獨立于應用程序定義模型的方法,使得
版權問題和不兼容問題不再成為應用程序之間交換模型的障礙。      

--
※ 來源:.南京大學小百合站 bbs.nju.edu.cn.[FROM: 202.118.237.14]

?? 快捷鍵說明

復制代碼 Ctrl + C
搜索代碼 Ctrl + F
全屏模式 F11
切換主題 Ctrl + Shift + D
顯示快捷鍵 ?
增大字號 Ctrl + =
減小字號 Ctrl + -
亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频
91麻豆精东视频| 欧美一区二区成人| 国内精品视频666| 亚洲日本在线看| 精品福利二区三区| 欧美性大战久久久久久久蜜臀| 精品一区二区三区免费| 夜夜爽夜夜爽精品视频| 国产精品色在线观看| 日韩精品在线一区| 欧美性大战久久| 99精品国产热久久91蜜凸| 韩国v欧美v亚洲v日本v| 日韩av电影一区| 亚洲丶国产丶欧美一区二区三区| 国产精品久久久久久久久免费相片| 精品理论电影在线| 欧美日韩精品久久久| 91日韩精品一区| 成人一区在线观看| 国产美女久久久久| 九九九久久久精品| 久久国产欧美日韩精品| 日韩国产欧美三级| 丝袜美腿亚洲色图| 五月婷婷欧美视频| 亚洲一区二区三区四区在线观看| 亚洲日本一区二区三区| 国产精品久久福利| 中文字幕av一区二区三区| 国产午夜精品久久| 国产欧美一区二区精品久导航| 久久婷婷国产综合国色天香| 日韩精品中午字幕| 亚洲精品在线网站| 久久综合色婷婷| 国产日本欧洲亚洲| 国产日韩高清在线| 国产精品女主播在线观看| 国产精品日韩成人| 国产精品成人免费| 尤物在线观看一区| 亚洲国产一区二区视频| 偷拍一区二区三区| 裸体在线国模精品偷拍| 免费亚洲电影在线| 精品在线免费视频| 高清日韩电视剧大全免费| 成人理论电影网| 99re这里只有精品视频首页| 色香色香欲天天天影视综合网| 色综合天天综合给合国产| 91福利视频久久久久| 欧美日韩国产高清一区二区| 日韩一区二区三区三四区视频在线观看| 欧美一卡2卡三卡4卡5免费| 精品噜噜噜噜久久久久久久久试看 | 国产精品综合av一区二区国产馆| 国产精品影音先锋| 99久久免费精品高清特色大片| 在线免费观看成人短视频| 欧美精品粉嫩高潮一区二区| 精品剧情在线观看| 中文字幕欧美三区| 亚洲精品一二三四区| 亚洲少妇30p| 日本在线不卡一区| 成人污污视频在线观看| 欧洲视频一区二区| 日韩美女视频一区二区在线观看| 国产精品网站在线播放| 一区二区三区在线高清| 日韩1区2区3区| 粉嫩一区二区三区性色av| 欧美午夜片在线观看| 日韩欧美在线123| 中文字幕av一区二区三区免费看| 亚洲国产日韩在线一区模特| 九九**精品视频免费播放| 94-欧美-setu| 日韩精品一区二区三区视频播放 | 欧美精品日日鲁夜夜添| 精品国产1区二区| 一区二区在线观看不卡| 国内精品久久久久影院薰衣草| 色琪琪一区二区三区亚洲区| 2024国产精品视频| 一区二区欧美国产| 国产91对白在线观看九色| 欧美日韩免费电影| 久久久久久久久97黄色工厂| 午夜欧美视频在线观看| 大尺度一区二区| 欧美一级精品在线| 一区二区三区不卡视频在线观看| 国产一区二区三区在线观看免费视频 | 日本一区二区三级电影在线观看| 午夜精品在线看| 成人av电影在线| 精品剧情在线观看| 午夜精品123| 91蜜桃传媒精品久久久一区二区| 精品日韩在线一区| 亚洲图片欧美视频| 99久久免费视频.com| 久久久精品国产免费观看同学| 亚洲高清一区二区三区| 91伊人久久大香线蕉| 国产欧美精品一区二区色综合| 琪琪久久久久日韩精品| 欧美中文字幕一区| 国产精品久久久久久久裸模| 国产一区三区三区| 日韩免费在线观看| 五月综合激情婷婷六月色窝| 日本韩国欧美在线| 欧美激情综合五月色丁香小说| 国内精品伊人久久久久av一坑 | 91丨九色丨蝌蚪丨老版| 国产亚洲婷婷免费| 国产一区二区三区精品欧美日韩一区二区三区 | 亚洲国产日韩av| 91小视频免费看| 国产精品视频看| 成人在线视频一区| 国产亚洲女人久久久久毛片| 国产一区二三区| 久久久久久夜精品精品免费| 国产麻豆9l精品三级站| 精品久久五月天| 国内精品视频666| 久久久久久久久免费| 国产老女人精品毛片久久| 久久久综合九色合综国产精品| 久久97超碰色| 久久久美女毛片| 成人短视频下载| 亚洲图片你懂的| 欧洲在线/亚洲| 婷婷六月综合网| 日韩一区二区免费在线电影| 麻豆精品视频在线观看| 精品粉嫩aⅴ一区二区三区四区 | 欧美日韩精品免费| 视频一区免费在线观看| 日韩色在线观看| 国产一本一道久久香蕉| 国产情人综合久久777777| 成人性生交大合| 亚洲精品日韩综合观看成人91| 在线观看国产日韩| 全部av―极品视觉盛宴亚洲| 精品人在线二区三区| 国产91清纯白嫩初高中在线观看| 国产精品视频在线看| 欧美主播一区二区三区| 日本不卡123| 久久伊人蜜桃av一区二区| 成人免费高清视频| 一区二区免费在线| 欧美一级黄色片| 国产麻豆精品久久一二三| 中文字幕视频一区| 欧美日韩mp4| 国产福利一区二区| 夜夜操天天操亚洲| 欧美zozozo| 91在线看国产| 琪琪一区二区三区| 中文字幕制服丝袜成人av| 色婷婷狠狠综合| 麻豆91小视频| 亚洲色欲色欲www在线观看| 91精品国产色综合久久不卡电影| 国产一区二区网址| 亚洲自拍偷拍综合| 欧美成人一区二区三区片免费 | 高清shemale亚洲人妖| 亚洲欧美日韩综合aⅴ视频| 制服视频三区第一页精品| 成人午夜电影网站| 奇米影视在线99精品| 国产精品二三区| 欧美成人精品高清在线播放| 91首页免费视频| 精品在线免费观看| 亚洲风情在线资源站| 国产精品乱码久久久久久| 884aa四虎影成人精品一区| 波多野结衣欧美| 久久精品国产第一区二区三区| 亚洲日本一区二区| 久久久久亚洲蜜桃| 7777精品伊人久久久大香线蕉完整版| 高清beeg欧美| 免费观看在线色综合| 亚洲精品乱码久久久久| 国产女主播在线一区二区| 日韩一级高清毛片| 91在线视频播放地址|