亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

蟲蟲首頁| 資源下載| 資源專輯| 精品軟件
登錄| 注冊

您現(xiàn)在的位置是:首頁 > 技術(shù)閱讀 >  無監(jiān)督學(xué)習(xí):決策樹AI異常檢測

無監(jiān)督學(xué)習(xí):決策樹AI異常檢測

時(shí)間:2024-01-26

最近我去了一個(gè)關(guān)于流處理的演講,但是該演講的用例(use case)是關(guān)于異常檢測。當(dāng)他們開始談?wù)摕o監(jiān)督?jīng)Q策樹時(shí),我的天線就豎起來了。無監(jiān)督?jīng)Q策樹是什么意思?它們會分裂出什么?

事實(shí)證明,在異常檢測領(lǐng)域,無監(jiān)督?jīng)Q策樹的應(yīng)用是相當(dāng)普遍的。但是因?yàn)槲也⒉粡氖略擃I(lǐng)域的相關(guān)工作,而且我懷疑我們中也很少有人在從事該領(lǐng)域的工作,所以我覺得我有必要分享下我發(fā)現(xiàn)的東西。

異常 VS 稀疏數(shù)據(jù)

幾周前,我們介紹了處理不平衡數(shù)據(jù)集的技術(shù)。對于數(shù)據(jù)集不平衡到什么程度應(yīng)被歸為異常這個(gè)問題,人們并沒有統(tǒng)一的標(biāo)準(zhǔn)。就像判斷藝術(shù)的偉大與否,你看到的時(shí)候你就知道了。

這里我們作為例證的異常指的是入侵檢測中的異常。雖然這些異常一天之內(nèi)會出現(xiàn)好多次,但是跟常規(guī)的網(wǎng)頁日志和系統(tǒng)數(shù)據(jù)包所產(chǎn)生的巨量數(shù)據(jù)相比,但是這些數(shù)據(jù)還是很少見的。具體到人的生活當(dāng)中,異??梢允切庞每ㄔp欺事件和正常 CT 掃描中發(fā)現(xiàn)癌癥。

如果你認(rèn)為你的用例介于稀疏和異常之間,那么就按照我們所做的一樣,將兩種方法都試一下,看看哪個(gè)最好。

監(jiān)督 VS 無監(jiān)督

在異常檢測中,我們試圖識別與數(shù)據(jù)集內(nèi)與預(yù)期模式不匹配且根據(jù)定義很少的項(xiàng)目或事件。入侵檢測系統(tǒng)中廣泛地采用了‘基于特征碼(signature based)’的方法來創(chuàng)建用于正常的監(jiān)督技術(shù)中的訓(xùn)練數(shù)據(jù)。當(dāng)監(jiān)測到攻擊時(shí),相關(guān)的流量模式就會被記錄、標(biāo)記和人為地被分類為一次入侵,然后這些數(shù)據(jù)會與正常數(shù)據(jù)結(jié)合起來,用于創(chuàng)建監(jiān)督訓(xùn)練集。

不論是受監(jiān)督?jīng)Q策樹、無監(jiān)督?jīng)Q策樹或者是由二者形成的隨機(jī)森林,均可用作異常檢測的工具。決策樹是非參數(shù)的,也不會對數(shù)據(jù)的分布做出假設(shè)。它們擅長將數(shù)字和分類相結(jié)合,高效地去處理缺失的數(shù)據(jù)。所有類型的異常數(shù)據(jù)往往都是高維度數(shù)據(jù),而決策樹可以將其全部納入其中,并提供合理清晰的指導(dǎo),以便在修剪(pruning)后僅留下重要信息。

完整的來說,還有一類半監(jiān)督異常檢測,其訓(xùn)練數(shù)據(jù)僅由正常事務(wù)組成,不包含任何異常。這也被稱為‘一類分類(One Class Classification)’,并以稍微不同的方式使用一類 SVM 或自動編碼器,在這里就不討論。

事實(shí)上,有監(jiān)督方法在入侵檢測方面仍然比無監(jiān)督方式更精確,但是它們完全無法確定新的或許有嚴(yán)重威脅的零時(shí)差(zero-day)攻擊。

無監(jiān)督?jīng)Q策樹

無監(jiān)督?jīng)Q策樹的概念其實(shí)有點(diǎn)誤導(dǎo)性,因?yàn)樗鋵?shí)是一個(gè)無監(jiān)督的聚類算法的組合,通過創(chuàng)建第一個(gè)關(guān)于好壞的猜測,來決定決策樹應(yīng)該在何處分裂。

步驟一:對您的數(shù)據(jù)運(yùn)行一個(gè)聚類算法。我在嘗試了幾乎所有的聚類技術(shù)后,似乎舊的 k-NN 仍然是最好的。設(shè)定 K=2 似乎很誘人,但是鑒于可能存在多種不同類型的入侵,預(yù)期好的結(jié)果是不現(xiàn)實(shí)的。實(shí)際的指導(dǎo)是將 K 至少設(shè)置為 10,并且對值進(jìn)行高達(dá) 50 的試驗(yàn)。在此過程中,因?yàn)閿?shù)據(jù)是未標(biāo)記的,所以沒有能夠確定最佳聚類的目標(biāo)函數(shù)。

雖然在文獻(xiàn)中并沒有涉及,但是我們有很好的理由去嘗試一下早期關(guān)于不平衡數(shù)據(jù)集的文章中討論過的 SMOTE (Synthetic Minority Oversampling Technique),因?yàn)樵摷夹g(shù)的主要目的是澄清聚類之間的界限。

步驟二:記錄了數(shù)據(jù)中的聚類后,以正常的方式運(yùn)行決策樹。顯然的是,如果 K 很大,那么這將是一個(gè)多級問題,就需要通過解釋閾值來發(fā)現(xiàn)異常。

從圖中 ROC 曲線可以看出比照乳腺癌檢測基準(zhǔn)數(shù)據(jù),k-NN 方法得到的結(jié)果是很不錯(cuò)的(請注意 AUC 軸在 0.5 時(shí)截止)。

異常檢測無監(jiān)督?jīng)Q策樹的實(shí)際執(zhí)行其實(shí)更為復(fù)雜,還會有關(guān)于不同類型異常的問題、數(shù)據(jù)規(guī)范化過程以及基準(zhǔn)數(shù)據(jù)集本身的變化等多方面的問題。如果你想深入研究這一點(diǎn),我建議你可以去閱讀下本文摘錄圖表的原文,該文比較了各種數(shù)據(jù)集中八種不同的技術(shù)。

最佳實(shí)踐

如果你想對此進(jìn)行探索,那么用已存在的無監(jiān)督隨機(jī)森林的 Python 腳本,會讓這個(gè)過程更容易一些。另外,我聽的演講來自于戴爾 EMC 的新興技術(shù)部(Emerging Technologies Division)的首席解決方案架構(gòu)師 Boni Bruno。他描述的場景是通過監(jiān)測每個(gè)單獨(dú)的地點(diǎn),來實(shí)現(xiàn)在世界范圍內(nèi)分布的遍及全球各地的數(shù)據(jù)中心進(jìn)行異常監(jiān)測。

該技術(shù)體系結(jié)構(gòu)的核心是 Spark Streaming。流(stream)中的一個(gè)操作會包含有基于 Python 無監(jiān)督隨機(jī)森林腳本的監(jiān)測算法。警報(bào)通知會在監(jiān)測到入侵后,不到 5 秒之內(nèi)發(fā)出。

同樣有意思的是,該系統(tǒng)的設(shè)定是每 24 小時(shí)收集一個(gè)新的(真正的大數(shù)據(jù))數(shù)據(jù)集,來重新訓(xùn)練模型,以便實(shí)時(shí)捕獲任何新的零時(shí)差攻擊。

作者簡介:

Bill Vorhies 是一個(gè)數(shù)據(jù)科學(xué)中心的主編,自 2001 年起一直擔(dān)任數(shù)據(jù)科學(xué)家。他的聯(lián)系方式是:Bill@DataScienceCentral.com

原文鏈接:https://www.datasciencecentral.com/profiles/blogs/have-you-heard-about-unsupervised-decision-trees

來源:AI 前線

往期推薦

基于稀疏表示的半監(jiān)督學(xué)習(xí)方法的創(chuàng)新與應(yīng)用

塵埃大小的計(jì)算機(jī)現(xiàn)已具備深度學(xué)習(xí)能力

深度學(xué)習(xí)重塑助聽器:助聽器佩戴者終于

能在嘈雜的房間中辨別聲音了

亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频
欧美在线免费| 国产精品免费在线| 国产精品成人一区二区三区吃奶| 国产视频一区在线| 久久久久五月天| 亚洲国产美女久久久久| 欧美视频你懂的| 久久久精品动漫| 一本大道av伊人久久综合| 狠狠色2019综合网| 欧美三日本三级少妇三2023| 欧美在线啊v一区| 一本久道久久综合狠狠爱| 国产精品一区二区在线观看网站| 久久嫩草精品久久久精品一| 亚洲精选国产| 国产综合视频| 国产精品草莓在线免费观看| 麻豆精品在线观看| 亚洲欧美日韩综合一区| 一区二区精品在线| 亚洲日本中文| 在线日韩日本国产亚洲| 国产亚洲欧美日韩一区二区| 欧美日韩一区二区三区在线 | 欧美视频免费看| 欧美fxxxxxx另类| 久久本道综合色狠狠五月| 亚洲女女女同性video| 中文国产成人精品久久一| 日韩午夜一区| 亚洲午夜久久久久久尤物| 亚洲自拍偷拍福利| 亚洲一区二区综合| 亚洲一区二区三区涩| av成人免费在线| 欧美国产一区二区三区激情无套| 艳女tv在线观看国产一区| 久久五月天婷婷| 欧美日韩第一页| 91久久久久久久久久久久久| 欧美高清在线精品一区| 久久久www成人免费无遮挡大片| 亚洲性线免费观看视频成熟| 欧美精品大片| 日韩视频永久免费| 亚洲国产精彩中文乱码av在线播放| 亚洲天堂av综合网| 国产亚洲欧美一区在线观看| 国内成+人亚洲| 亚洲日本成人网| 午夜国产一区| 欧美大片一区二区| 国产精品有限公司| 亚洲精品综合精品自拍| 一区二区高清在线| 在线亚洲电影| 欧美承认网站| 国产精品国产三级欧美二区 | 亚洲在线一区| 欧美风情在线观看| 国产日韩欧美麻豆| 亚洲一区二区在线看| 欧美高清在线一区| 91久久久久久| 欧美精品乱码久久久久久按摩| 精品成人一区二区| 另类av一区二区| 亚洲大片av| 欧美日产在线观看| 亚洲精品一区二区三区不| 久久久999| 亚洲欧洲一区| 国产精品久久国产精品99gif| 日韩一级不卡| 精品69视频一区二区三区| 亚洲视频免费在线| 国产精品成人一区二区艾草| 夜夜嗨av色一区二区不卡| 欧美日韩理论| 亚洲中字在线| 国产女主播一区| 另类国产ts人妖高潮视频| 亚洲国产高清高潮精品美女| 欧美久久视频| 欧美影院在线| 日韩亚洲欧美成人一区| 国产农村妇女毛片精品久久麻豆| 久久久91精品国产| 亚洲人体1000| 1024成人| 亚洲欧美激情四射在线日| 欧美精品一区二区三区蜜桃| 一区二区三区久久久| 在线日韩中文| 亚洲第一主播视频| 国产深夜精品| 国产欧美精品xxxx另类| 国产精品日产欧美久久久久| 欧美日韩免费一区二区三区| 美女黄网久久| 欧美精品乱人伦久久久久久| 欧美成人免费小视频| 欧美freesex8一10精品| 蜜桃久久av| 久久国产精品久久久| 99天天综合性| 亚洲女爱视频在线| 欧美大片一区| 国产一区二区三区精品久久久| 国产精品一区二区久久久| 亚洲最新在线视频| 91久久久国产精品| 久久久久久一区二区三区| 国产精品自在在线| 亚洲欧美在线观看| 亚洲三级影院| 亚洲人成免费| 欧美大片在线观看一区二区| 亚洲精品中文字| 欧美第一黄色网| 国内精品久久国产| 欧美电影免费观看高清完整版| 一区二区欧美视频| 欧美激情第三页| 国产噜噜噜噜噜久久久久久久久 | 亚洲欧洲中文日韩久久av乱码| 欧美在线免费播放| 亚洲大胆人体视频| 国产中文一区二区| 国产精品sss| 国产欧美一区二区三区久久人妖| 狠狠噜噜久久| 亚洲欧美日韩国产综合在线| 牛牛影视久久网| 欧美成人黑人xx视频免费观看| 欧美国产精品专区| 国产精品区一区二区三区| 亚洲国产精品一区二区www| 日韩一区二区精品在线观看| 欧美日韩dvd在线观看| 国产欧美日韩综合| 精品电影在线观看| 六十路精品视频| 狠狠久久亚洲欧美| 夜夜嗨网站十八久久| 亚洲欧美国产视频| 国产精品久久久久久久久搜平片 | 久久综合伊人77777| 久久久午夜精品| 欧美视频在线一区二区三区| 亚洲国产91| 欧美手机在线视频| 欧美一区二区三区成人| 国产精品初高中精品久久| 亚洲小视频在线观看| 国产精品私拍pans大尺度在线| 欧美一级片一区| 欧美精品一区二区三| 亚洲精品一级| 国产精品日韩精品欧美在线| 欧美一区二区三区免费观看| 欧美日韩在线高清| 一本色道久久精品| 国产亚洲成精品久久| 欧美专区在线观看| 欧美日韩精品不卡| 亚洲人久久久| 国内久久视频| 欧美体内谢she精2性欧美| 农村妇女精品| 亚洲乱码精品一二三四区日韩在线| 国产精品一区视频| 欧美激情1区2区| 久久精品亚洲热| 91久久久在线| 一区二区在线视频| 国产欧美 在线欧美| 国产精品亚洲综合一区在线观看 | 欧美日韩播放| 亚洲欧美另类在线| 揄拍成人国产精品视频| 国内自拍亚洲| 国模私拍一区二区三区| 亚洲最新在线视频| 韩国v欧美v日本v亚洲v| 国产精品乱子久久久久| 欧美剧在线免费观看网站| 久久久精品动漫| 亚洲免费一级电影| 亚洲欧美日韩区| 性伦欧美刺激片在线观看| 国产精品女主播| 欧美四级电影网站| 国产精品视频久久久| 国产美女扒开尿口久久久| 国产精品mv在线观看| 国产精品久久久久天堂| 国产亚洲aⅴaaaaaa毛片| 狠狠色狠狠色综合日日tαg|