3分鐘了解“關(guān)聯(lián)規(guī)則”推薦

“把啤酒放在尿布旁,有助于提升啤酒銷售量”是關(guān)聯(lián)規(guī)則推薦正文不含任何公式,保證PM弄懂。

一、概念

什么是關(guān)聯(lián)規(guī)則(Association Rules)?

:關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘中的概念,通過分析數(shù)據(jù),找到數(shù)據(jù)之間的關(guān)聯(lián)。電商中經(jīng)常用來分析購買物品之間的相關(guān)性,例如,“購買尿布的用戶,有大概率購買啤酒”,這就是一個(gè)關(guān)聯(lián)規(guī)則。

畫外音:如果把買尿布記作A,買啤酒記作B。

“買尿布的用戶有較大概率買啤酒”這個(gè)關(guān)聯(lián)規(guī)則記作A -> B。

什么是關(guān)聯(lián)規(guī)則推薦(Association Rule Based Recommendaion)?

:顧名思義,利用關(guān)聯(lián)規(guī)則,來實(shí)施推薦。關(guān)聯(lián)規(guī)則推薦的目標(biāo),是希望達(dá)到

“將尿布放入購物車之后,再推薦啤酒”

“直接推薦啤酒”

獲取有更好的售賣效果。

畫外音:這個(gè)目標(biāo)非常非常重要,有些場景,或許直接推薦更有效。

關(guān)聯(lián)規(guī)則推薦的典型應(yīng)用

線下,可以將尿布和啤酒放在一起

線上,可以在用戶將尿布放入購物車后,立刻推薦啤酒

二、如何實(shí)施

假設(shè)某電商會售賣ABCD四種商品,歷史上共5筆訂單,分別賣出{A,B,C}, {B,C,D}, {A,B,C,D}, {A,C}, {C}?如何來實(shí)施“關(guān)聯(lián)規(guī)則”推薦呢?

第一步:數(shù)據(jù)準(zhǔn)備

如上圖,縱坐標(biāo)是所有歷史訂單,橫坐標(biāo)是每筆訂單售出的商品。

第二步:計(jì)算關(guān)聯(lián)規(guī)則(組合商品)的支持度

什么是支持度(support)?

:共5筆訂單,3筆包含商品A,A的支持度是3/5。

很容易計(jì)算出,各個(gè)商品的支持度。從支持度可以看出,Best Seller是商品C,100%的訂單中都包含商品C,C的支持度是1。

除了單個(gè)商品,組合商品也有支持度。

共5筆訂單,2筆同時(shí)包含AB,即A->B的支持度是2/5。

畫外音:全局總共4種商品,假設(shè)關(guān)聯(lián)規(guī)則只關(guān)聯(lián)2種商品,則一共需要計(jì)算C(4,2)共6種組合商品的支持度{AB,AC,AD,BC,BD,CD}。

支持度評估商品包含在訂單中的“概率”,一個(gè)訂單,有多大概率包含這個(gè)商品。

畫外音:一般會先對支持度高的商品實(shí)施推薦,如果先實(shí)優(yōu)化支持度低的商品,即使推薦效果翻倍,總體訂單提升效果也會很有限。

第三步:計(jì)算關(guān)聯(lián)規(guī)則的置信度

什么是置信度(confidence)?

:已知購買了A,有多大概率購買了B(即同時(shí)購買了AB),稱A -> B的置信度。

可以看到,商品A有3次購買,這3次中有2次購買了B,A->B的置信度是2/3。

畫外音:額,本來不想貼公式的

confidence(A->B) = support(A->B)/support(A)= (2/5)/(3/5) = 2/3

這也相對比較好理解,

分子:support(A->B)是同時(shí)購買AB的比例

分母:support(A)是只購買A的比例

二者相除,得到“購買了A,有多大概率購買B”,置信度的本質(zhì)是條件概率。

這里需要注意的是,X->Y與Y->X的置信度不一定相等。

如上圖:

B->C的置信度是1,買商品B時(shí),100%會買C,

C->B的置信度是3/5,買商品C時(shí),只有3/5買了B。

畫外音:

support(B->C)=3/5

support(C->B)=3/5

confidence(B->C)=support(B->C)/support(B)=1

confidence(C->B)=support(C->B)/support(C)=3/5

公式是給程序看的,excel表格是給人看的,結(jié)果都一樣。

第四步:計(jì)算關(guān)聯(lián)規(guī)則的提升度

上一個(gè)例子里,confidence(B->C)=1,即:如果用戶購買商品B,100%會買C,那是不是意味著,如果用戶將商品B放入購物車,就可以向用戶推薦商品C呢?

:不是。

“將尿布放入購物車之后,再推薦啤酒”

“直接推薦啤酒”

獲取有更好的售賣效果。

雖然購買商品B,100%會買C

畫外音:confidence(B->C)=1

但直接推薦C,用戶也100%會買C

畫外音:support(C)=1

會發(fā)現(xiàn),購買B與購買C是獨(dú)立事件,用戶買不買C和用戶買不買B沒有直接關(guān)系。這里的關(guān)聯(lián)規(guī)則推薦,并沒有比直接推薦獲取更好的效果。

用什么指標(biāo)來評估關(guān)聯(lián)規(guī)則推薦的效果呢?

:提升度。

什么是提升度(lift)?

大于1,說明有效,在購買A時(shí)推薦B,比直接推薦B,效果更好

等于1,說明無關(guān),購買A與購買B,是獨(dú)立事件

畫外音:又有公式了

lift(A->B) =confidence(A->B)/support(B)

這也相對比較好理解,

分子:confidence(A->B),購買A時(shí),有多大概率同時(shí)購買B

分母:support(B),有多大概率直接購買B

二者相除,得到效果是否更好。

還是通過兩個(gè)直觀的例子來看。

來看看關(guān)聯(lián)規(guī)則A->B,與直接推薦B,效果有沒有提升:

有3個(gè)訂單購買A,這3個(gè)訂單中有2個(gè)訂單購買了B,所以A->B的置信度是2/3,即買了A有2/3的概率會買B

直接推薦B的話,5個(gè)訂單中有3個(gè)購買了B,所以B的支持度是3/5,即有3/5的概率會直接買B

會發(fā)現(xiàn),關(guān)聯(lián)規(guī)則推薦的效果更好。

畫外音:根據(jù)公式

confidence(A->B) =support(A->B)/support(A) = 2/3

support(B) = 3/5

lift(A->B) =confidence(A->B)/support(B) = 10/9

來看看關(guān)聯(lián)規(guī)則A->D,與直接推薦D,效果有沒有提升:

有3個(gè)訂單購買A,這3個(gè)訂單中有1個(gè)訂單購買了D,所以A->D的置信度是1/3,即買了A有1/3的概率會買D

直接推薦D的話,5個(gè)訂單中有2個(gè)購買了B,所以D的支持度是2/5,即有2/5的概率會直接買D

畫外音:根據(jù)公式

confidence(A->D) =support(A->D)/support(A) = 1/3

support(D) = 2/5

lift(A->D) = confidence(A->D)/support(D)= 5/6

lift(A->B) < 1,故關(guān)聯(lián)規(guī)則推薦是負(fù)相關(guān)的。

三、總結(jié)

關(guān)聯(lián)規(guī)則A->B推薦,目標(biāo)是,在“用戶將A放入購物車時(shí),推薦B”比“單獨(dú)推薦B”獲取更好的效果

A->B的支持度,是用戶同時(shí)購買A和B概率

A->B的置信度,是用戶購買A的同時(shí),有多大概率購買B

A->B的提升度,是“用戶購買A的同時(shí),有多大概率購買B”與“直接購買B的概率”的比值

(1)這個(gè)值大于1時(shí),說明A->B有正向效果

(2)這個(gè)值等于1時(shí),說明A和B是獨(dú)立事件

(3)這個(gè)值小于1時(shí),說明A->B有負(fù)向效果


轉(zhuǎn)載自:https://www.sohu.com/a/227841704_178889

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容