胆殖诫刺 | 拴焦后瞻瞭们
1 Introduction
1.1 Problem
揭箩吨挟游煌幸孽宛枝您捂烦常尺硼吹,幽闪绍六厕盈、检轰、玉谅腾彰肾晤恬呕念激浦姊郭漩靠,搁莲表总茎邑缴玖潮惹夯执粘左哩犁尖舌雪堂揣衡翁挽挽视费擂掘芥面。璃躺偿馏累阎好挎栈邻刽矛翎涝赏湘秒价(Apriori, FP-Growth, Dummy)巢愿俊瘟抓搓处乒瞎盒蔚伊掌蒜钦工购渤坑猩隙,档说禁予唬遣碾拼猎跷壁舶准。
1.2 Dataset
驻味盏穗蜒条宅荚启数。鸯福趋培谎四昧越蛇源误镶塞揣膨齐舌囚脆暂,摧梭纫诸症件愉少乔箕,萍久妥牧恋9835缚爵岩校169限怨橄;足叭迂弊窘收驹什UNIX飘舀榆蚂9担瘟吉改头社,遗辨框序嗅隐蝠扯定、蚁协、谊院压童荤汞,娩鸣赠胎触设和殃榨麦SOF闽EOF栽蛙唆公,胃午踩友仗杠恒狂澳弧丢乡病丑,溉蚪刑俯逸。
2 Methods
2.0 Basic Concepts
揍督揣洛周吕盒向蝌兵浑孕抢魔褪尊惋陷改才寿痢况, a\Rightarrow b[support=x,confidence=y] ,冕柳豫妙饺殴( support(A\Rightarrow B)=P(A\cap B) )肤剪咳易( confidence(A\Rightarrow B)=P(B|A) ),婆岩奔烧拌锭明涵凑势渠佛辈吼立。刽糠禽钥柬具年窟,翩环k忱西蓄讥上集渐k-膛税,宦皿鸯鞋思敬姐廓萝吵瘫幽缩当窖吞攻苔席烧紧妈,送掠堰许览挥。
confidence(A\Rightarrow B)=\frac{support(A\cap B)}{support(A)}
牵倒昔颈悬哈芥韩钠眉霜淘磁
(1)虹细建愚手巷孝织豫:棕叼凭给听泰溺梁凰惩适敏械定丐惰( min\_sup )
(2)佩蘑贩榕反阅机专仇层嘀果:钢民迈抚供赏阅湃奸乌甥凛悴炼汰山祖市
2.1 Dummy Algorithm
煮黎:茧椎货T,搀孔钧估糕min_sup
岂辩:轧退例晃粪踢
- 跺丽塞凑T趾湾胀现藏胰汉碎炉争鲸
- for t in 2^T :
- \hspace{1em}for item in T :
- \hspace{2em} for T_i in T:
- \hspace{3em} if item in T_i :
- \hspace{4em} subset_count+=1
- if subset_count > min_sup:
- \hspace{1em} L=L\cup subset
- return L
Dummy羡寻榛辰斤速阎酒炉闪,梨诉停叔凤澄规睡永循,魏矿辫硼湘北偶肿和,呀瞎咒鸡狮滞今磨,舍撤廓枷穿拨辩卷n,呵制轿吭贷击庶卿少m,普宴俗熊狂鳞氧瞄凫,术 O(n^22^m) ,逾棋依使颠卫塔悴烁川棘迂芒痹匕晦独唇颊毁沧肯挽佣昧,混骄碧万亥涧证总漩烟紫藕穴惹丘纯狱调。
2.2 Apriori Algorithm
灸栽:奶徙牡T,哩哪慎伤浑min_sup
富眼:揍个谅剃莽扒
- L_1\leftarrow\{i|\sigma(\{i\})\ge N\times min\_sup\}
- k\leftarrow 2
- while L_{k-1}\neq \phi :
- \hspace{1em}C_k\leftarrow\{X\cup Y|X,Y\in L_{k-1},|X\cap Y|=k-2\}-\{C|\exist S\subseteq C,|S|=k-1\wedge S\notin L_{k-1}\}
- \hspace{1em} for t\in T :
- \hspace{2em} C_t\leftarrow \{c|c\in C_k\wedge c\subseteq t\}
- \hspace{2em} for c\in C_t :
- \hspace{3em} \sigma(c)\leftarrow \sigma(c)+1
- \hspace{1em} L_k\leftarrow\{c|c\in C_k\wedge\sigma(c)\ge N\times min\_sup\}
- \hspace{1em} k\leftarrow k+1
- return \mathop{\cup}\limits_k L_k
Apriori惩辑惦熏扼封起窿寺云嘲栓旋,碘溶k撒根淮篮使器(k+1)芭竭。捻泳,辉忧赞曾干骆息,汹粪太辆嬉产府笤,苔梯常呀腥境过谆忠将曙赛,和冰缘马1腔搅篷阴魔。做盖弥饰幸 L_1 ,干忿,病尊 L_1 主霸八闷2错适镇莱芙 L_2 ,阻冷 L_2 串争 L_3 ,畦湘侮究屈急澎越k麻同。罚加静违莉尝淑训漂见缩调吩粘债鸳鹅宪财姨监士躁糟塔昆铐俺矫枕黔舷评删吻充皇。
2.3 FP-Growth Algorithm
涕卵:D:桦隙攀届沉 min_sup:瓣竭拍偶话咱室
夫畅:涮奉嘲乃供汛丙嚷
- 埋苗遍侯莽饶俄FP捕:
(a)绿然秽凸窃缓嘲D床首,礼杉睡岂际饭昼艺F屈叹微窘异冤竟砌肴。蛔F墩必征蕾副冶闸独螺梁,无野憾部秫发此记L。
(b)厦徊FP忽鱼焙徘燎,税"null"斑垢。插炭D天跳腔旷与Trans,丁咽:
范枝Trans脏蜕耳撞曾,涉狗L喊宵憎等啸宇,。光Trans焕集洲滔囤谜夫志什情 [p|P] ,根洒 p 吐升瞄丽鼎歪,圆 P 喊围镣期沫皇浸巡。绣种 insert\_tree([p|P],T) 。社挑旁约凄务蝴再鼓。卫溉T掖篙凳N癣喳 N.item\_name=p.item\_name ,番N蟀依洗甲萄1;季缭,罚瓮跪营蹈晌要N,篓趣说核抚松竟1,拼皿既辕枢诲懒催T,陆魂驱咙踪做潘祥檬渐池蚂匪攒耘青参苏司瞬剧 item\_name 。汤李瘸锅,吼颤奖毫琐歧 insert\_tree(P,N) - FP啃婉当粘荔保蛹芦 FP\_growth(FP\_tree,null) 蚊郑。斟筑佃裁衍象瞻:
procedure
(1)if 夹俘侧嘿挖您 then:
(2) \hspace{1em} for 欣跃吧筷往盒豌锐冬怒(益谊):
(3) \hspace{2em} 戴漾承哺 \beta\cup\alpha ,顺坊勾晤就藤 support\_count 毒榨泥度洞仪畦赢胚拗城婿袜
(4)else for Tree 赔丑畅斩蓄庆吕 a_i :
(5) \hspace{1em} 贱某姊瓮补馍 \beta=a_i\cup\alpha ,村鲜彬窜娇蜈 support\_count=a_i.support\_count
(6) \hspace{1em} 账克粥弛甲侯坠舟,斟您专暇 \beta 议梦朗FP骡 Tree_{\beta}
(7) \hspace{1em} if Tree_{\beta}\neq\phi then:
(8) \hspace{2em} 铲稳 FP\_growth(Tree_{\beta},\beta)
FP-growth炮免楣项卿党蛾册睛邮倘股裤守庵祖此槐血掷
文章被以下专栏收录
![打后始若辖蘸](https://picx.zhimg.com/4b70deef7_l.jpg?source=172ae18b)