亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

? 歡迎來到蟲蟲下載站! | ?? 資源下載 ?? 資源專輯 ?? 關于我們
? 蟲蟲下載站

?? 11.txt

?? This complete matlab for neural network
?? TXT
字號:
發信人: ashun (阿順), 信區: DataMining
標  題: 數據挖掘入門(五)
發信站: 南京大學小百合站 (Mon Aug 20 10:10:58 2001)

                            描述型數據挖掘


統計和可視化


要想建立一個好的預言模型,你必須了解自己的數據。最基本的方法是計算各種統計變量
(平均值、方差等)和察看數據的分布情況。你也可以用數據透視表察看多維數據。


數據的種類可分為連續的,有一個用數字表示的值(比如銷售量)或離散的,分成一個個
的類別(如紅、綠、藍)。離散數據可以進一步分為可排序的,數據間可以比較大小(如
,高、中、低)和標稱的,不可排序(如郵政編碼)。


圖形和可視化工具在數據準備階段尤其重要,它能讓你快速直觀的分析數據,而不是給你
枯燥乏味的文本和數字。它不僅讓你看到整個森林,還允許你拉近每一棵樹來察看細節。
在圖形模式下人們很容易找到數據中可能存在的模式、關系、異常等,直接看數字則很難

可視化工具的問題是模型可能有很多維或變量,但是我們只能在2維的屏幕或紙上展示它。
比如,我們可能要看的是信用風險與年齡、性別、婚姻狀況、參加工作時間的關系。因此
,可視化工具必須用比較巧妙的方法在兩維空間內展示n維空間的數據。雖然目前有了一些
這樣的工具,但它們都要用戶“訓練”過他們的眼睛后才能理解圖中畫的到底是什么東西
。對于眼睛有色盲或空間感不強的人,在使用這些工具時可能會遇到困難。


聚集(分群)


聚集是把整個數據庫分成不同的群組。它的目的是要群與群之間差別很明顯,而同一個群
之間的數據盡量相似。與分類不同(見后面的預測型數據挖掘),在開始聚集之前你不知
道要把數據分成幾組,也不知道怎么分(依照哪幾個變量)。因此在聚集之后要有一個對
業務很熟悉的人來解釋這樣分群的意義。很多情況下一次聚集你得到的分群對你的業務來
說可能并不好,這時你需要刪除或增加變量以影響分群的方式,經過幾次反復之后才能最
終得到一個理想的結果。神經元網絡和K-均值是比較常用的聚集算法。


不要把聚集與分類混淆起來。在分類之前,你已經知道要把數據分成哪幾類,每個類的性
質是什么,聚集則恰恰相反。


關聯分析


關聯分析是尋找數據庫中值的相關性。兩種常用的技術是關聯規則和序列模式。關聯規則
是尋找在同一個事件中出現的不同項的相關性,比如在一次購買活動中所買不同商品的相
關性。序列模式與此類似,他尋找的是事件之間時間上的相關性,如對股票漲跌的分析。


關聯規則可記為A==>B,A稱為前提和左部(LHS),B稱為后續或右部(RHS)。如關聯規則
“買錘子的人也會買釘子”,左部是“買錘子”,右部是“買釘子”。


要計算包含某個特定項或幾個項的事務在數據庫中出現的概率只要在數據庫中直接統計即
可。某一特定關聯(“錘子和釘子”)在數據庫中出現的頻率稱為支持度。比如在總共10
00個事務中有15個事務同時包含了“錘子和釘子”,則此關聯的支持度為1.5%。非常低的
支持度(比如1百萬個事務中只有一個)可能意味著此關聯不是很重要,或出現了錯誤數據
(如,“男性和懷孕”)。


要找到有意義的規則,我們還要考察規則中項及其組合出現的相對頻率。當已有A時,B發
生的概率是多少?也即概率論中的條件概率。回到我們的例子,也就是問“當一個人已經
買了錘子,那他有多大的可能也會買釘子?”這個條件概率在數據挖掘中也稱為可信度,
計算方法是求百分比:(A與B同時出現的頻率)/(A出現的頻率)。


讓我們用一個例子更詳細的解釋這些概念:


 


總交易筆數(事務數):1,000


包含“錘子”:50


包含“釘子”:80


包含“鉗子”:20


包含“錘子”和“釘子”:15


包含“鉗子”和“釘子”:10


包含“錘子”和“鉗子”:10


包含“錘子”、“鉗子”和“釘子”:5


 


則可以計算出:


 


“錘子和釘子”的支持度=1.5%(15/1,000)


“錘子、釘子和鉗子”的支持度=0.5%(5/1,000)


“錘子==>釘子”的可信度=30%(15/50)


“釘子==>錘子”的可信度=19%(15/80)


“錘子和釘子==>鉗子”的可信度=33%(5/15)


“鉗子==>錘子和釘子”的可信度=25%(5/20)


 


我們可以看到買錘子的人也買釘子的可能性(30%)高于買釘子的人要買錘子的可能性(1
9%)。錘子和釘子關聯的支持度已經足夠高了,意味著這是一條有意義的關聯規則。


改善度(lift)是另外一個描述規則價值的數值。改善度越高A的出現對B出現的可能性影
響越大。改善度是一個比值:(A==>B的可信度)/(B出現的頻率)。如:


 


“錘子==>釘子”的改善度:3.75(30% / 8%)


“錘子和釘子==>鉗子”的改善度:16.5(33% / 2%)


 


關聯規則算法的另一個重要的性質是指定項的概念層次。比如在我們討論的錘子和釘子的
例子中沒有涉及產品的品牌和型號。這一點很重要,如在“金屬制品-->五金工具-->釘子
-->5號釘子-->XX廠的5號釘子”的概念層次上,基于不同的目的,你可能需要選擇不同的
層次。


注意數據挖掘得到的關聯規則或序列模式并不是真正的規則,他只是對數據庫中數據之間
相關性的一種描述。還沒有其他數據來驗證得到的規則的正確性,也不能保證利用過去的
數據得到的規律在未來新的情況下仍有效。


有時很難決定能利用你發現的關聯規則做些什么。比如,在超市貨架的擺放策略上,按照
發現的關聯規則把相關性很強的物品放在一起,反而可能會使整個超市的銷售量下降—顧
客如果可以很容易的找到他要買的商品,他就不會再買那些本來不在他的購買計劃上的商
品。總之,在采取任何行動之前一定要經過分析和實驗,即使它是利用數據挖掘得到的知
識。


有些軟件產品用圖形的方式顯示項之間的相關性。如圖3所示,每個圓圈代表一個項或一個
事件,線代表他們間的關系,線越粗表示相關性越強,這樣對軟件的使用者來說就很直觀
--
業精于勤荒于嬉,行成于思毀于隨。 —— 韓愈
臨淵羨魚不如退而結網。           —— 班固
勿以惡小而為之,勿以善小而不為。 —— 劉備

※ 來源:.南京大學小百合站 http://bbs.nju.edu.cn [FROM: 202.119.80.20]

?? 快捷鍵說明

復制代碼 Ctrl + C
搜索代碼 Ctrl + F
全屏模式 F11
切換主題 Ctrl + Shift + D
顯示快捷鍵 ?
增大字號 Ctrl + =
減小字號 Ctrl + -
亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频
亚洲黄色小视频| 亚洲精品成人在线| 欧美精品一卡两卡| 欧美亚洲一区三区| 欧美日韩久久久| 在线成人高清不卡| 精品欧美乱码久久久久久1区2区| 大胆亚洲人体视频| 色婷婷亚洲一区二区三区| 91国偷自产一区二区三区成为亚洲经典 | 国产精品青草久久| 亚洲国产精品二十页| 精品国产乱码久久久久久图片 | 亚洲一二三区在线观看| 亚洲日本丝袜连裤袜办公室| 国产精品久久久久久久蜜臀 | 亚洲国产日韩精品| 免费欧美在线视频| 国产精品一区二区在线播放| 成人av网站大全| 欧美在线观看18| 精品国精品自拍自在线| 亚洲欧洲成人av每日更新| 亚洲精品ww久久久久久p站| 日本91福利区| 不卡一区二区三区四区| 欧美日韩一区 二区 三区 久久精品| 欧美性色aⅴ视频一区日韩精品| 欧美日韩黄视频| 久久久久97国产精华液好用吗| 中文字幕av一区二区三区高| 亚洲主播在线观看| 国产精品中文字幕一区二区三区| yourporn久久国产精品| 欧美精品tushy高清| 国产精品少妇自拍| 日韩电影免费在线| 一本色道亚洲精品aⅴ| 欧美v亚洲v综合ⅴ国产v| 一区在线观看免费| 久久国产精品99久久久久久老狼| 成人精品国产福利| 日韩视频免费观看高清在线视频| 久久久久久久久久久久久久久99 | 一区二区欧美在线观看| 国内欧美视频一区二区| 在线观看一区不卡| 国产日韩在线不卡| 久久国产精品99精品国产| 91久久香蕉国产日韩欧美9色| 91精品国产黑色紧身裤美女| 成人欧美一区二区三区白人| 久久99国内精品| 3d成人动漫网站| 亚洲一级二级三级| 91啪九色porn原创视频在线观看| 日韩一区二区在线看| 亚洲福利国产精品| 在线亚洲高清视频| 亚洲女厕所小便bbb| 成人激情免费网站| 国产精品美女久久久久久久久久久 | 久久精品国产99国产| caoporn国产一区二区| 日韩精品一区二区三区视频| 天天亚洲美女在线视频| 99re这里都是精品| 国产精品国产三级国产aⅴ中文| 奇米影视7777精品一区二区| 欧美唯美清纯偷拍| 一区二区高清视频在线观看| 91麻豆国产香蕉久久精品| 欧美激情在线一区二区三区| 国产在线一区观看| 国产亚洲欧美一级| 成人福利视频在线看| 欧美国产综合色视频| 国产一区二区三区免费| 国产欧美一区二区三区在线看蜜臀 | 91麻豆swag| 一区精品在线播放| 99久久精品国产一区二区三区| 国产区在线观看成人精品| 国产精品系列在线播放| 久久精品视频在线看| 成人免费毛片a| 亚洲主播在线观看| 欧美电影精品一区二区| 国产九色sp调教91| 亚洲男女毛片无遮挡| 欧美视频一二三区| 精油按摩中文字幕久久| 久久久久久久久97黄色工厂| 成人午夜激情影院| 亚洲综合精品自拍| 日韩欧美一区二区免费| 国产精品99久久久久久有的能看| 国产日产欧美一区二区视频| www.欧美色图| 日韩专区中文字幕一区二区| 日韩一级高清毛片| 成人综合在线观看| 午夜电影网一区| 日本一二三四高清不卡| 色婷婷久久一区二区三区麻豆| 亚洲第一二三四区| 国产日产欧美一区二区三区| 91久久线看在观草草青青| 另类中文字幕网| 一区二区三区在线观看动漫| 91麻豆精品国产91久久久久| 国产高清一区日本| 丝袜美腿亚洲综合| 亚洲视频在线一区| 久久精品视频免费观看| 欧美日韩不卡一区二区| 成人爽a毛片一区二区免费| 亚洲大片精品永久免费| 国产精品美女视频| 久久美女艺术照精彩视频福利播放| 粉嫩在线一区二区三区视频| 午夜精品久久久久久久99水蜜桃| 久久中文字幕电影| 欧美精品第1页| 色就色 综合激情| 国产成人av电影在线播放| 天天综合日日夜夜精品| 亚洲欧洲中文日韩久久av乱码| 91精品国产麻豆国产自产在线 | 欧美日韩成人综合天天影院| 成人综合婷婷国产精品久久| 日韩激情av在线| 一区二区三区在线播| 国产精品灌醉下药二区| 精品国精品国产| 日韩欧美一区二区视频| 欧美日本一区二区| 欧美性色黄大片| 欧洲精品视频在线观看| av电影在线观看完整版一区二区| 久草中文综合在线| 免费观看在线色综合| 午夜精品视频一区| 午夜在线成人av| 视频一区免费在线观看| 伊人开心综合网| 自拍av一区二区三区| 综合激情成人伊人| 亚洲精品成人精品456| 亚洲男人的天堂在线观看| 亚洲三级在线免费观看| 中文字幕一区二区三区视频| 久久美女艺术照精彩视频福利播放 | 亚洲一区av在线| 亚洲妇熟xx妇色黄| 婷婷开心久久网| 另类小说欧美激情| 国产精品一区二区果冻传媒| 韩国精品在线观看| 国产成人亚洲综合a∨猫咪| 成人精品免费看| 日本精品一级二级| 日韩西西人体444www| 精品久久久久久久久久久久久久久| 欧美在线看片a免费观看| 欧美日韩免费高清一区色橹橹 | 欧美日韩一卡二卡三卡| 欧美日韩国产欧美日美国产精品| 欧美日韩综合色| 2023国产一二三区日本精品2022| 精品久久久三级丝袜| 亚洲国产激情av| 夜夜精品浪潮av一区二区三区| 国产精品毛片a∨一区二区三区| 欧美国产禁国产网站cc| 亚洲欧洲精品一区二区精品久久久 | 老司机午夜精品| 紧缚捆绑精品一区二区| 成人丝袜高跟foot| 欧美日韩成人综合| 欧美激情在线看| 日韩中文字幕区一区有砖一区 | 久久草av在线| 白白色 亚洲乱淫| 91精品国产综合久久精品图片| 91精品国产综合久久福利| 欧美激情一区二区在线| 亚洲综合在线免费观看| 九九**精品视频免费播放| 一本在线高清不卡dvd| 精品国产免费视频| 亚洲综合一区在线| 国产精品69久久久久水密桃| 欧美网站大全在线观看| 久久精品视频一区二区| 日本中文字幕一区| 在线区一区二视频| 中文字幕免费不卡| 国产综合久久久久影院| 91.com视频|