亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

? 歡迎來到蟲蟲下載站! | ?? 資源下載 ?? 資源專輯 ?? 關于我們
? 蟲蟲下載站

?? 5.txt

?? This complete matlab for neural network
?? TXT
字號:
發信人: ashun (阿順), 信區: DataMining
標  題: 數據挖掘入門(五)
發信站: 南京大學小百合站 (Mon Aug 20 10:10:58 2001)

                            描述型數據挖掘


統計和可視化


要想建立一個好的預言模型,你必須了解自己的數據。最基本的方法是計算各種統計變量
(平均值、方差等)和察看數據的分布情況。你也可以用數據透視表察看多維數據。


數據的種類可分為連續的,有一個用數字表示的值(比如銷售量)或離散的,分成一個個
的類別(如紅、綠、藍)。離散數據可以進一步分為可排序的,數據間可以比較大小(如
,高、中、低)和標稱的,不可排序(如郵政編碼)。


圖形和可視化工具在數據準備階段尤其重要,它能讓你快速直觀的分析數據,而不是給你
枯燥乏味的文本和數字。它不僅讓你看到整個森林,還允許你拉近每一棵樹來察看細節。
在圖形模式下人們很容易找到數據中可能存在的模式、關系、異常等,直接看數字則很難

可視化工具的問題是模型可能有很多維或變量,但是我們只能在2維的屏幕或紙上展示它。
比如,我們可能要看的是信用風險與年齡、性別、婚姻狀況、參加工作時間的關系。因此
,可視化工具必須用比較巧妙的方法在兩維空間內展示n維空間的數據。雖然目前有了一些
這樣的工具,但它們都要用戶“訓練”過他們的眼睛后才能理解圖中畫的到底是什么東西
。對于眼睛有色盲或空間感不強的人,在使用這些工具時可能會遇到困難。


聚集(分群)


聚集是把整個數據庫分成不同的群組。它的目的是要群與群之間差別很明顯,而同一個群
之間的數據盡量相似。與分類不同(見后面的預測型數據挖掘),在開始聚集之前你不知
道要把數據分成幾組,也不知道怎么分(依照哪幾個變量)。因此在聚集之后要有一個對
業務很熟悉的人來解釋這樣分群的意義。很多情況下一次聚集你得到的分群對你的業務來
說可能并不好,這時你需要刪除或增加變量以影響分群的方式,經過幾次反復之后才能最
終得到一個理想的結果。神經元網絡和K-均值是比較常用的聚集算法。


不要把聚集與分類混淆起來。在分類之前,你已經知道要把數據分成哪幾類,每個類的性
質是什么,聚集則恰恰相反。


關聯分析


關聯分析是尋找數據庫中值的相關性。兩種常用的技術是關聯規則和序列模式。關聯規則
是尋找在同一個事件中出現的不同項的相關性,比如在一次購買活動中所買不同商品的相
關性。序列模式與此類似,他尋找的是事件之間時間上的相關性,如對股票漲跌的分析。


關聯規則可記為A==>B,A稱為前提和左部(LHS),B稱為后續或右部(RHS)。如關聯規則
“買錘子的人也會買釘子”,左部是“買錘子”,右部是“買釘子”。


要計算包含某個特定項或幾個項的事務在數據庫中出現的概率只要在數據庫中直接統計即
可。某一特定關聯(“錘子和釘子”)在數據庫中出現的頻率稱為支持度。比如在總共10
00個事務中有15個事務同時包含了“錘子和釘子”,則此關聯的支持度為1.5%。非常低的
支持度(比如1百萬個事務中只有一個)可能意味著此關聯不是很重要,或出現了錯誤數據
(如,“男性和懷孕”)。


要找到有意義的規則,我們還要考察規則中項及其組合出現的相對頻率。當已有A時,B發
生的概率是多少?也即概率論中的條件概率。回到我們的例子,也就是問“當一個人已經
買了錘子,那他有多大的可能也會買釘子?”這個條件概率在數據挖掘中也稱為可信度,
計算方法是求百分比:(A與B同時出現的頻率)/(A出現的頻率)。


讓我們用一個例子更詳細的解釋這些概念:


 


總交易筆數(事務數):1,000


包含“錘子”:50


包含“釘子”:80


包含“鉗子”:20


包含“錘子”和“釘子”:15


包含“鉗子”和“釘子”:10


包含“錘子”和“鉗子”:10


包含“錘子”、“鉗子”和“釘子”:5


 


則可以計算出:


 


“錘子和釘子”的支持度=1.5%(15/1,000)


“錘子、釘子和鉗子”的支持度=0.5%(5/1,000)


“錘子==>釘子”的可信度=30%(15/50)


“釘子==>錘子”的可信度=19%(15/80)


“錘子和釘子==>鉗子”的可信度=33%(5/15)


“鉗子==>錘子和釘子”的可信度=25%(5/20)


 


我們可以看到買錘子的人也買釘子的可能性(30%)高于買釘子的人要買錘子的可能性(1
9%)。錘子和釘子關聯的支持度已經足夠高了,意味著這是一條有意義的關聯規則。


改善度(lift)是另外一個描述規則價值的數值。改善度越高A的出現對B出現的可能性影
響越大。改善度是一個比值:(A==>B的可信度)/(B出現的頻率)。如:


 


“錘子==>釘子”的改善度:3.75(30% / 8%)


“錘子和釘子==>鉗子”的改善度:16.5(33% / 2%)


 


關聯規則算法的另一個重要的性質是指定項的概念層次。比如在我們討論的錘子和釘子的
例子中沒有涉及產品的品牌和型號。這一點很重要,如在“金屬制品-->五金工具-->釘子
-->5號釘子-->XX廠的5號釘子”的概念層次上,基于不同的目的,你可能需要選擇不同的
層次。


注意數據挖掘得到的關聯規則或序列模式并不是真正的規則,他只是對數據庫中數據之間
相關性的一種描述。還沒有其他數據來驗證得到的規則的正確性,也不能保證利用過去的
數據得到的規律在未來新的情況下仍有效。


有時很難決定能利用你發現的關聯規則做些什么。比如,在超市貨架的擺放策略上,按照
發現的關聯規則把相關性很強的物品放在一起,反而可能會使整個超市的銷售量下降—顧
客如果可以很容易的找到他要買的商品,他就不會再買那些本來不在他的購買計劃上的商
品。總之,在采取任何行動之前一定要經過分析和實驗,即使它是利用數據挖掘得到的知
識。


有些軟件產品用圖形的方式顯示項之間的相關性。如圖3所示,每個圓圈代表一個項或一個
事件,線代表他們間的關系,線越粗表示相關性越強,這樣對軟件的使用者來說就很直觀
--
業精于勤荒于嬉,行成于思毀于隨。 —— 韓愈
臨淵羨魚不如退而結網。           —— 班固
勿以惡小而為之,勿以善小而不為。 —— 劉備

※ 來源:.南京大學小百合站 http://bbs.nju.edu.cn [FROM: 202.119.80.20]

?? 快捷鍵說明

復制代碼 Ctrl + C
搜索代碼 Ctrl + F
全屏模式 F11
切換主題 Ctrl + Shift + D
顯示快捷鍵 ?
增大字號 Ctrl + =
減小字號 Ctrl + -
亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频
国产精品免费网站在线观看| 91视频免费观看| 国产a久久麻豆| 91在线观看免费视频| 国产欧美综合色| 风间由美一区二区三区在线观看 | 日本韩国一区二区三区视频| 国产欧美精品国产国产专区| 91精品91久久久中77777| 国内精品免费在线观看| 亚洲欧美怡红院| 91视频.com| 奇米在线7777在线精品| 国产色产综合色产在线视频| 色综合中文字幕国产 | 久久99精品国产麻豆婷婷| 蜜桃精品在线观看| 欧美日韩精品一区二区三区蜜桃 | 久久www免费人成看片高清| 久久久综合激的五月天| 粉嫩一区二区三区性色av| 久久综合九色综合久久久精品综合| 亚洲伊人伊色伊影伊综合网| 久久福利资源站| 欧美日本乱大交xxxxx| 日本中文字幕一区二区视频| 久久久综合精品| 免费在线成人网| 亚洲欧美综合色| 亚洲特黄一级片| 亚洲一区二区精品久久av| 亚洲成人中文在线| 粗大黑人巨茎大战欧美成人| 福利一区二区在线| 91久久精品国产91性色tv| 国产精品白丝jk白祙喷水网站| 亚洲图片欧美综合| 中文成人综合网| 亚洲国产精品v| 日韩精品一区二区三区老鸭窝 | 日韩视频一区二区三区在线播放| 在线免费观看成人短视频| 亚洲观看高清完整版在线观看| 欧美一区二区三区视频在线 | 亚洲精品乱码久久久久久久久| 蜜桃在线一区二区三区| 首页亚洲欧美制服丝腿| 欧美日韩www| 国产aⅴ综合色| 国产乱理伦片在线观看夜一区| 蜜桃精品视频在线| 亚洲美女偷拍久久| 中文字幕一区二区三区四区不卡| 婷婷综合久久一区二区三区| 五月激情综合婷婷| 91麻豆.com| 欧美不卡视频一区| 亚洲丰满少妇videoshd| 91麻豆视频网站| 精品美女一区二区| 精品少妇一区二区三区视频免付费 | 亚洲精品国产品国语在线app| 中文字幕亚洲在| 日韩理论片一区二区| 欧美激情中文字幕| 亚洲欧美日韩一区| 久久99精品国产麻豆婷婷| 国产精品一区二区久久不卡| 国产一区二区三区免费看| 国产成人超碰人人澡人人澡| 精品国产成人在线影院| 91丨porny丨中文| 国产成人啪午夜精品网站男同| 粉嫩嫩av羞羞动漫久久久| 欧美系列在线观看| 国产欧美一区二区精品忘忧草| 国产一区二区三区国产| 精品国产一区二区三区久久久蜜月| 日韩精品欧美精品| 欧美一区二区成人6969| 精品一二三四在线| 中文字幕一区二区在线播放| 欧美午夜免费电影| 美女看a上一区| 日韩视频一区二区在线观看| 亚洲尤物在线视频观看| 国产福利一区二区三区在线视频| 91精品国产乱| 亚洲蜜桃精久久久久久久| 韩国视频一区二区| 亚洲精品在线观| 蜜桃视频免费观看一区| 风流少妇一区二区| 国产欧美日韩麻豆91| 亚洲电影在线播放| 国产乱码精品一区二区三区忘忧草 | 成人免费视频app| 亚洲精品国产视频| 欧美日韩免费在线视频| 精品区一区二区| 亚洲图片欧美激情| 国产一区二区三区久久悠悠色av| 欧美成人官网二区| 美女视频黄a大片欧美| 午夜精品福利在线| 精品国产乱码久久久久久蜜臀| 国产99一区视频免费 | 国产欧美日韩在线观看| 欧美性感一区二区三区| 成人免费av资源| 亚洲国产美女搞黄色| 久久这里只有精品视频网| 成人免费av网站| 亚洲激情五月婷婷| 日韩三级.com| 99麻豆久久久国产精品免费| 午夜精品成人在线视频| 欧美电视剧在线看免费| 国产乱人伦精品一区二区在线观看| 亚洲精品一线二线三线无人区| 久久国产精品99久久久久久老狼| 日韩欧美第一区| 青青草伊人久久| 久久久久88色偷偷免费| 91久久免费观看| 色婷婷激情久久| 成人夜色视频网站在线观看| 国产三级精品在线| 国产aⅴ综合色| 久久99久久99小草精品免视看| 精品乱人伦一区二区三区| www.日韩精品| 成人99免费视频| 一区二区三区四区不卡在线| 日韩视频一区在线观看| 亚洲大型综合色站| 日韩欧美亚洲国产另类| 在线免费观看视频一区| 97精品久久久久中文字幕| 国产伦精一区二区三区| 不卡的av电影| 精品一区二区在线视频| 成人久久久精品乱码一区二区三区| 成人高清在线视频| 精品区一区二区| 日韩毛片高清在线播放| 美洲天堂一区二卡三卡四卡视频| 国产精品一级二级三级| 91久久久免费一区二区| 精品盗摄一区二区三区| 亚洲精品精品亚洲| ...av二区三区久久精品| 亚洲自拍偷拍综合| 国产日产欧美一区二区三区| 精品国一区二区三区| 91精品国产手机| 欧美日本韩国一区| 色欧美乱欧美15图片| 韩国精品主播一区二区在线观看| 国产色产综合色产在线视频| 中文字幕免费不卡在线| 国产亚洲精品福利| 色综合久久88色综合天天| 国内精品免费在线观看| 国产在线精品一区二区三区不卡 | 97se亚洲国产综合在线| 国产一区二区三区免费观看| 激情小说欧美图片| 亚洲va韩国va欧美va精品| 午夜国产不卡在线观看视频| 伦理电影国产精品| 99国产精品99久久久久久| 在线观看91av| 亚洲天堂福利av| 懂色av中文字幕一区二区三区 | 看电影不卡的网站| 成人激情黄色小说| 777a∨成人精品桃花网| 精品av综合导航| 国产亲近乱来精品视频| 亚洲天堂网中文字| 亚洲福利视频一区| 蜜桃视频一区二区| 99r国产精品| 欧美老年两性高潮| 久久亚洲综合色| 国产精品看片你懂得| 国产精品美女久久久久久| 久久蜜桃一区二区| 亚洲v日本v欧美v久久精品| 国产精品1区2区3区| 久久99久国产精品黄毛片色诱| 91福利国产精品| 国产精品亲子乱子伦xxxx裸| 国产精品美女www爽爽爽| 国产日韩欧美麻豆| 26uuu精品一区二区在线观看| 国产成人激情av| 8v天堂国产在线一区二区| 亚洲图片你懂的|