靚麗時尚館

位置:首頁 > 健康生活 > 心理

apriori演算法基本步驟

心理9.66K
apriori演算法基本步驟

1、 Apriori 演算法是一種最有影響力的挖掘布林關聯規則的頻繁項集的 演算法,它是由Rakesh Agrawal 和RamakrishnanSkrikant 提出的。

它使用一種稱作逐層搜尋的迭代方法,k- 項集用於探索(k+1)- 項集。

首先,找出頻繁 1- 項集的集合。該集合記作L1。L1 用於找頻繁2- 項集的集合 L2,而L2 用於找L2,如此下去,直到不能找到 k- 項集。每找一個 Lk 需要一次資料庫掃描。為提高頻繁項集逐層產生的效率,一種稱作Apriori 性質的重 要性質 用於壓縮搜尋空間。其執行定理在於一是頻繁項集的所有非空子集都必須也是頻繁的

二是非頻繁項集的所有父集都是非頻繁的。

2、 Apriori演算法過程分為兩個步驟:

第一步通過迭代,檢索出事務資料庫中的所有頻繁項集,即支援度不低於使用者設定的閾值的項集

第二步利用頻繁項集構造出滿足使用者最小信任度的規則。

具體做法就是:

首先找出頻繁1-項集,記為L1然後利用L1來產生候選項集C2,對C2中的項進行判定挖掘出L2,即頻繁2-項集不斷如此迴圈下去直到無法發現更多的頻繁k-項集為止。每挖掘一層Lk就需要掃描整個資料庫一遍。

標籤:apriori 演算法