一個數(shù)據(jù)庫有5個事務,如表所示。設min_sup=60%,min_conf=80%。
(a)分別用Apriori算法和FP-growth算法找出所有頻繁項集。比較兩種挖掘方法的效率。
(b)比較窮舉法和Apriori算法生成的候選項集的數(shù)量。
(c)利用(1)所找出的頻繁項集,生成所有的強關(guān)聯(lián)規(guī)則和對應的支持度和置信度。
考慮如下的頻繁3-項集:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}。
(a)根據(jù)Apriori算法的候選項集生成方法,寫出利用頻繁3-項集生成的所有候選4-項集。
(b)寫出經(jīng)過剪枝后的所有候選4-項集。