?? apriori算法介紹.txt
字號:
對于單維、單層、布爾關聯規則的最常用的經典算法是APRIORI算法,其他類型的關聯規則算法通常是在一定約束條件下的APRIORI算法的變形。
APRRORI算法使用頻繁項性質的先驗知識,逐層搜索迭代,用K-項集產生(K+1)-項集。APRRORI算法的一個顯著特點是:利用APRIORI性質,壓縮了頻繁項集,提高了算法的效率。APRIORI性質定理:頻繁項集的所有非空子集都必須也是頻繁的.根據定義如果項集I不滿足最小支持度闡值,則I不是頻繁的,即P(I)<MIN_SUP,如果項A添加到I,則結果項集(即IUA)不可能比I更頻繁出現。因此,IUA也不是頻繁的,即P(IUA)<MIN_SUP。APRIORI算法采用了連接和剪枝兩步:(1)連接步:為找LK,通過LK-1與自己連接產生侯選K-項集的候選集合,該候選項集的集合記作CK。記號LI[J]表示LI的第J項。假定事務或項集中的項按字典次序排序, 如果(L1[1]=L2[1])∧(L1[2]=L2
[2])∧(L1[3] =L2[3])∧…∧(L1[k-2] =L2[k-2])∧(L1[k-1] <L2[k-2]) 則L1與L2是可連接的,連接產生的結果項集是L1[1]L1[2]… L1[k-1]L2[k-1] (2)剪枝步:Ck是Lk的超集:它的成員可以是頻繁的,也可以是不頻繁的,但所有的頻繁K-項集都包含在Ck中。掃描數據庫,確定Ck中每個候選的計數,從而確定Lk(即根據定義,計數值不小于最小支持度計數的所有候選是頻繁的,從而屬于Lk)。在壓縮Ck時,應用了APRIORI性質,即任何非頻繁的K-1項集都不可能是頻繁K項集的子集。因此,如果一個候選K項集的K-1項子集不屬于Lk,則該候選項也不可能是頻繁的,從Ck中刪除。
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -