亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

? 歡迎來到蟲蟲下載站! | ?? 資源下載 ?? 資源專輯 ?? 關于我們
? 蟲蟲下載站

?? 2.txt

?? This complete matlab for neural network
?? TXT
字號:
發信人: mining (key), 信區: DataMining
標  題: 數據挖掘語言淺析
發信站: 南京大學小百合站 (Sat Dec  8 12:04:57 2001), 站內信件

(復旦大學:朱劍秋,張曉飛等)1.  引言 
隨著網絡技術的發展和計算機使用的日益廣泛,電子化數據越來越多,人們正面臨“數據
豐富而知識貧乏”的問題。八十年代末興起的數據挖掘(data mining)技術或數據庫中的
知識發現(knowledge discovery in database,KDD)技術為解決此問題開辟了一條道路
。數據挖掘是在大量的數據中發現潛在的、有價值的模式和數據間關系(知識)的過程。
經過十多年的工作 ,數據挖掘技術的研究與應用已取得了很大的成果,然而,我們還面臨
著許多問題:(1)各種數據挖掘問題及挖掘方法基于不同的模型和技術,彼此互相孤立,
聯系很少;(2)缺少簡明精確的問題描述方法,挖掘的語義通常是由實現方法決定的;(
3)數據挖掘系統僅提供孤立的知識發現功能,難于嵌入大型應用;(4)數據挖掘引擎與
數據庫系統是松散耦合,T.Imielinski 和 H.Mannila 稱其為"文件挖掘(file mining)系
統",它沒有提供應用獨立的操作原語。 
到目前為止,數據挖掘行業是高度分散的,公司和研究機構獨立開發各自的數據挖掘系統
和平臺,沒有形成開放性的標準;同時數據挖掘本身是一門多學科綜合跨度非常大的技術
,這兩點是上述問題存在的根本原因。近年來數據挖掘語言的研究為解決上列問題,提出
一個新的研究方向。 
    本文組織結構如下:在第2節提出了數據挖掘語言分類的方法,將數據挖掘語言分為:
查詢語言,建模語言,以及通用語言三種類型,然后,分別在2.1、2.2與2.3小節舉例闡述
這三種數據挖掘語言的特點。在第3節對三種數據挖掘語言進行分析與評價,指出了各自的
優缺點。最后指出了數據挖掘語言的發展趨勢,以及若干待解決的問題。 
2.     數據挖掘語言的分類 
設計一個好的數據挖掘語言的重要性可以通過觀察關系數據庫系統的歷史來證實。在數據
庫市場上,關系數據庫系統已經占支配地位數十年了。關系查詢語言的標準化,發生在關
系數據庫開發的早期階段,關系數據庫領域的成功廣泛地依賴于關系數據庫查詢語言的標
準化。盡管每個商業的關系數據庫系統都有各自的圖形用戶接口GUI,每個接口的根本的核
心仍然是標準化的關系數據庫查詢語言。關系查詢語言的標準化為關系數據庫的開發和發
展提供了基礎。它使得信息交換更加容易,同時提升了關系數據庫技術的商業性和被廣泛
接受的程度。因此,有一個好的數據挖掘語言可以有助于數據挖掘系統平臺的標準化的開
發,甚至可以象HTML推動Internet的發展一樣,推動數據挖掘行業的開發和發展。
設計全面的數據挖掘語言是一個巨大的挑戰,因為數據挖掘覆蓋了寬廣的任務,從數據特
征化到挖掘關聯規則,數據分類,聚集和偏差檢測,等等。每個任務都有不同的需求。設
計一個有效的數據挖掘語言需要對各種不同的數據挖掘任務的能力、限制、以及運行機制
都有深入地理解。       數據挖掘語言的研究經歷了兩個階段,第一個階段是研究單位和
公司自行研究和開發階段;第二階段是研究單位和公司組成聯盟,研制和開發數據挖掘語
言標準化的階段。這兩個階段趨勢界限是很明顯的。第一個階段成果包括Jiawei Han等研
制的DMQL;Imielinski和Virmani提出的MSQL;Meo、Psaila、和Ceri提出MINE RULE操作器
;等。第二階段主要包括數據挖掘組織協會(DMG)提出的預言模型標記語言PMML,以及微
軟公司提出的OLE DB for Data Mining規范。
       對于上述數據挖掘語言,根據功能和側重點不同,我們將其分為三種類型:數據挖
掘查詢語言;數據挖掘建模語言;通用數據挖掘語言。第一階段的數據挖掘語言一般屬于
查詢語言;PMML屬于建模語言;OLE DB for DM屬于通用數據挖掘語言。下面我們分別介紹
其特點和功能。2.1  數據挖掘查詢語言[1,2] 
數據挖掘系統應該有能力支持特殊的和交互的數據挖掘(sad-hoc and interactive data 
mining),目的是為了靈活和有效的知識發現。數據挖掘查詢語言即是設計用來支持這個特
點的。我們首先以加拿大Simon Franser大學Jiawei Han等開發的數據挖掘系統DBMiner中
數據挖掘查詢語言DMQL(Data Mining Query Language)來介紹查詢語言的特點,接著簡
單介紹其它研究工作。
數據挖掘查詢語言DMQL由數據挖掘原語組成,數據挖掘原語用來定義一個數據挖掘任務。
用戶使用數據挖掘原語與數據挖掘系統通信,使得知識發現更有效。這些原語有以下幾個
種類:數據庫一部分的規范以及用戶感興趣的數據集(包括感興趣的數據庫屬性或數據倉
庫的維度);挖掘知識的種類;在指導挖掘過程中有用的背景知識;模式估值的興趣度測
量;以及挖掘出的知識如何可視化表示。數據挖掘原語允許用戶在挖掘過程中從不同的角
度或深度與數據挖掘系統進行交互式地通信。
數據挖掘查詢的基本單位是數據挖掘任務,通過數據挖掘查詢語言,數據挖掘任務可以通
過查詢的形式輸入到數據挖掘系統中。一個數據挖掘查詢由以下五種基本的數據挖掘原語
定義:
1)  任務相關數據原語
這是被挖掘的數據庫的一部分。挖掘的數據不是整個數據庫,只是和具體商業問題相關、
或者用戶感興趣的數據集,即是數據庫中一部分表,以及表中感興趣的屬性。該原語包括
以下具體的內容:數據庫或數據倉庫的名稱;數據庫表或數據倉庫的立方體;數據選擇的
條件;相關的屬性或維;數據分組定義。
2)  被挖掘的知識的種類原語
該原語指定被執行的數據挖掘的功能,在DMQL中將挖掘知識分為五種類型,即五種知識的
表達:特征規則;辨別規則;關聯規則;分類/預言;聚集。
3)  背景知識原語
用戶能夠指定背景知識,或者關于被挖掘的領域知識。這些知識對于引導知識發現過程和
評估發現的模式都是非常有用的。背景知識原語包括:概念層次(concept hierarchy);
對數據關系的用戶信任度(user beliefs about relationships in the data)。
4)  興趣度測量原語
這個功能是將不感興趣的模式從知識中排除出去。興趣度測量能夠用來引導數據挖掘過程
,或者在發現后評估被發現的模式。不同種類的知識有不同種類的興趣度測量方法。例如
對關聯規則來說,興趣度測量包括支持度(support)和可信度(confidence)。低于用戶
指定的支持度和可信度閾值的規則被認為是不感興趣的。興趣度測量原語包括:簡單性(
simplicity);確定性(certainty,比如:可信度);效用(utility,比如:支持度)
;新穎性(novelty)。
5)  被發現模式的表示和可視化原語
這個原語定義被發現的模式顯示的方式,用戶能夠選擇不同的知識表示形式。該原語包括
:規則,表格,報告,圖表,圖形,決策樹,和立方體;向下鉆入和向上累積(drill-do
wn and roll-up)。 
DMQL正是基于這些原語設計的數據挖掘查詢語言。它允許從關系數據庫和數據倉庫中多個
抽象層次上特殊(ad-hoc)和交互地挖掘多種種類的知識。DMQL采用類似SQL語言的語法,
因此它能夠很容易地和關系查詢語言SQL集成。
除了DMQL以外,我們簡單介紹其它一些數據挖掘查詢語言的研究工作。MSQL是一個數據挖
掘查詢語言,它有Imielinski和Virmani提出。這個語言使用了類似SQL的語法和SQL原語(
包括排序、分組、和其它原語)。既然在數據挖掘中可能產生大量的規則,MSQL提供了一
個稱作GetRule和SelectRule的原語,用于規則產生和規則選擇。它統一地對待數據和規則
,因此,能夠在執行數據選擇,以及基于查詢的規則產生時進行優化工作,同時也能在操
縱或者查詢產生規則的集合時進行優化。其它在數據挖掘語言設計方面的研究工作包括Me
o、Psaila、和Ceri提出MINE RULE操作器。它同樣遵循類似SQL的語法,是為挖掘關聯規則
設計的規則產生查詢語言。
2.2  數據挖掘建模語言[3] 
數據挖掘建模語言是對數據挖掘模型進行描述和定義的語言。如果我們設計一種標準的數
據挖掘建模語言,使得數據挖掘系統在模型定義和描述方面有標準可以遵循,那么各系統
之間可以共享模型,既可以解決目前各數據挖掘系統之間封閉性的問題,有可以在其它應
用系統中間嵌入數據挖掘模型,解決孤立的知識發現問題。“預言模型標記語言”(Pred
ictive Model Markup Language,PMML)正是這樣一種數據挖掘建模語言。
PMML被一個稱作數據挖掘協會(The Data Mining Group ,http://www.dmg.org/,DMG)
的組織開發。該組織由Angoss, Magnify, NCR, SPSS和芝加哥Illinois大學 等企業和
單位組成,它的目的是開發預言模型開放標準,策略是將此標準推薦給W3C工作組,使PMM
L成為W3C的正式推薦物。目前DMG宣布了定義預言模型開放標準的第一個版本PMML 1.0。P
MML主要目的是允許應用程序和聯機分析處理(OLAP)工具能從數據挖掘系統獲得模型,而
不用獨自開發數據挖掘模塊。另一個目的是能夠收集使用大量潛在的模型,并且統一管理
各種模型的集合。這些能力在商業應用領域是有效的配置分析模型的基礎。
PMML是一種基于XML的語言,用來定義預言模型。它為各個公司定義預言模型和在不同的應
用程序之間共享模型提供了一種快速并且簡單的方式。通過使用標準的XML解析器對PMML進
行解析,應用程序能夠決定模型輸入和輸出的數據類型,模型詳細的格式,并且按照標準
的數據挖掘術語來解釋模型的結果。
PMML提供了一個靈活機制來定義預言模型的模式,同時支持涉及多個預言模型的模型選擇
和模型平衡(model averaging)。對于那些需要全部學習、部分學習和分布式學習(ens
emble learning, partitioned learning, and distributed learning)的應用程序,這
種語言被證明是非常有用的。另外,它使得在不同的應用程序和系統之間移動預言模型變
得容易、方便。特別地,PMML非常適合部分學習、元學習、分布式學習、以及相關領域。

使用PMML進行模型定義由以下幾部分組成:
1)    頭文件(a header)
2)    數據模式(a data schema)
3)    數據挖掘模式(a data mining schema)
4)    預言模型模式(a predictive model schema)
5)    預言模型定義(definitions for predictive models)
6)    全體模型定義(definitions for ensembles of models)
7)    選擇和聯合模型和全體模型的規則(rules for selecting and combining models
 and ensembles of models)
8)    異常處理的規則(rules for exception handling)
其中第5項組件是必不可少的。另外預言模型的模式必須被定義,這能夠利用一個或多個模
式(組件3,4,5)來定義。其它幾項組件是可選的。
PMML1.0標準版提供了一個小的DTD(文檔類型定義,XML術語)集合,DTD詳細說明了決策
樹和多項式回歸模型的實體和屬性。DTD1.0遵循著一個通用模式,該模式將一個數據字典
和一個或多個模型的定義相結合,數據字典能夠立即應用于模式。數據字典的元素是非常
簡單的。
       DMG當前正在制定PMML版本1.1,該版本提供獨立于應用程序定義模型的方法,使得
版權問題和不兼容問題不再成為應用程序之間交換模型的障礙。      

--
※ 來源:.南京大學小百合站 bbs.nju.edu.cn.[FROM: 202.118.237.14]

?? 快捷鍵說明

復制代碼 Ctrl + C
搜索代碼 Ctrl + F
全屏模式 F11
切換主題 Ctrl + Shift + D
顯示快捷鍵 ?
增大字號 Ctrl + =
減小字號 Ctrl + -
亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频
久久精品国产久精国产| 午夜久久久久久久久| 久久综合久久久久88| 91精品久久久久久久99蜜桃| 欧美精品乱码久久久久久按摩| 91在线精品一区二区三区| 大胆亚洲人体视频| 丁香婷婷综合网| 成人久久视频在线观看| eeuss鲁片一区二区三区| 99久久精品免费看国产| 色婷婷久久99综合精品jk白丝| 日本丶国产丶欧美色综合| 欧美日韩一级二级| 欧美一区二区久久| 欧美激情一区二区三区四区| 国产精品女同一区二区三区| 亚洲欧美日韩国产成人精品影院| 一区二区三区四区高清精品免费观看 | 久久久久久免费网| 日本一区二区视频在线观看| 国产精品短视频| 亚洲午夜久久久| 黑人巨大精品欧美黑白配亚洲| 风间由美一区二区三区在线观看| 91蜜桃传媒精品久久久一区二区| 在线观看中文字幕不卡| 日韩欧美电影在线| 国产精品三级av| 三级影片在线观看欧美日韩一区二区| 久久99精品网久久| 日本道在线观看一区二区| 欧美哺乳videos| 亚洲视频综合在线| 久久av资源站| 欧洲亚洲国产日韩| 国产色产综合产在线视频| 一区二区三区四区蜜桃| 国产一区在线精品| 在线亚洲免费视频| 欧美极品xxx| 日本午夜一本久久久综合| 岛国av在线一区| 在线综合+亚洲+欧美中文字幕| 日本一区二区三区在线观看| 亚洲丶国产丶欧美一区二区三区| 国产美女娇喘av呻吟久久| 欧美无人高清视频在线观看| 国产欧美视频一区二区| 蜜臀av性久久久久蜜臀aⅴ流畅| www.99精品| 久久久综合视频| 免费视频一区二区| 欧美天堂亚洲电影院在线播放| 国产亚洲欧美一区在线观看| 蜜臀av一区二区在线观看| 在线观看亚洲一区| 国产精品久久久久三级| 国产精一品亚洲二区在线视频| 欧美天天综合网| 亚洲综合一区二区精品导航| 成人免费毛片aaaaa**| xfplay精品久久| 久久精品国产澳门| 6080日韩午夜伦伦午夜伦| 亚洲综合无码一区二区| www.色综合.com| 中文字幕中文乱码欧美一区二区 | 久久久不卡影院| 精品一区二区三区的国产在线播放 | 成人福利视频在线| 中文一区一区三区高中清不卡| 国产麻豆成人精品| 精品成人在线观看| 国产麻豆成人传媒免费观看| 精品日韩欧美在线| 狠狠狠色丁香婷婷综合激情 | 欧美亚洲日本一区| 一区二区欧美精品| 欧美日本一道本在线视频| 亚洲黄色片在线观看| 色综合久久88色综合天天| 亚洲品质自拍视频| 色偷偷一区二区三区| 亚洲综合区在线| 欧美精品xxxxbbbb| 日韩av成人高清| 日韩欧美国产一区二区三区 | 在线亚洲精品福利网址导航| 亚洲大片免费看| 日韩亚洲欧美一区二区三区| 久久国内精品视频| 国产精品女上位| 欧美在线观看视频一区二区| 日韩高清不卡一区| 久久久精品国产99久久精品芒果| 成人动漫中文字幕| 亚洲综合视频在线| ww亚洲ww在线观看国产| 99久久99久久精品免费观看| 亚洲成人av在线电影| 日韩欧美国产一区在线观看| 国产成a人亚洲| 亚洲一区二区美女| 久久精品亚洲乱码伦伦中文| 91尤物视频在线观看| 日韩不卡在线观看日韩不卡视频| 久久夜色精品一区| 在线观看三级视频欧美| 老司机午夜精品| 亚洲免费观看高清完整版在线观看熊 | 精品国产一区二区三区不卡| 不卡视频在线观看| 久久精品噜噜噜成人av农村| 综合欧美亚洲日本| 精品人在线二区三区| 91麻豆视频网站| 国产一区二区三区观看| 一区二区在线电影| 久久精品亚洲精品国产欧美kt∨| 欧美日韩一二区| 成人自拍视频在线| 麻豆免费精品视频| 一区二区三区蜜桃网| wwwwxxxxx欧美| 欧美剧在线免费观看网站| 成人h精品动漫一区二区三区| 石原莉奈一区二区三区在线观看| 亚洲欧美一区二区在线观看| 精品处破学生在线二十三| 欧美日韩亚洲另类| 日韩亚洲欧美综合| 日本韩国一区二区三区| jvid福利写真一区二区三区| 久久 天天综合| 日韩av电影免费观看高清完整版在线观看 | 日韩高清不卡在线| 亚洲国产成人91porn| 欧美激情一区三区| 久久久国产一区二区三区四区小说 | 97aⅴ精品视频一二三区| 国产一区二区三区高清播放| 麻豆91精品视频| 青青草97国产精品免费观看 | 国产精品自拍一区| 久久国产精品99精品国产| 亚洲国产日韩一区二区| 亚洲欧美视频在线观看| 中文字幕不卡一区| 国产精品国产馆在线真实露脸 | 午夜久久久影院| 午夜国产精品一区| 亚洲成人激情综合网| 艳妇臀荡乳欲伦亚洲一区| 亚洲欧美另类综合偷拍| 亚洲精品一卡二卡| 激情欧美日韩一区二区| 久久99精品国产麻豆婷婷| 日韩av中文在线观看| 免费看黄色91| 久久99在线观看| 寂寞少妇一区二区三区| 国产真实乱子伦精品视频| 国产老妇另类xxxxx| 国产精品一区二区91| 国产精品1区2区| av在线不卡电影| 欧美在线播放高清精品| 欧美精品少妇一区二区三区| 欧美成人乱码一区二区三区| 久久午夜国产精品| 国产精品欧美久久久久一区二区| 亚洲欧洲日产国码二区| 亚洲国产一区二区三区| 日韩专区欧美专区| 国产乱妇无码大片在线观看| 99久久久国产精品免费蜜臀| 91久久精品一区二区三区| 欧美一区二区三区免费观看视频| 久久久久久久久久久99999| 亚洲人吸女人奶水| 蜜乳av一区二区| 99视频精品免费视频| 欧美日韩国产免费一区二区| 久久亚洲一区二区三区四区| 成人免费在线视频观看| 青青草国产精品97视觉盛宴| 成人免费视频网站在线观看| 欧美日韩高清影院| 国产欧美久久久精品影院| 亚洲成人午夜电影| 国产精品一区二区男女羞羞无遮挡| a在线欧美一区| 精品国产乱码久久久久久图片| 自拍偷自拍亚洲精品播放| 毛片一区二区三区| 欧美在线观看视频一区二区三区 | 国产精品免费视频一区| 韩国精品主播一区二区在线观看| 99r精品视频|