
當(dāng)我們走進(jìn)超市,迎面而來的就是貨架上琳瑯滿目的商品。這些商品的擺放,或者不同品類的貨架分布是隨機(jī)排列的嗎?答案是NO!
相必都聽說過啤酒與尿布的故事,這兩個表面上毫不相關(guān)的商品,在超市中擺放在一起時二者的銷量都大幅度提升。這里就不討論這個案例的真實性如何,但用它來理解產(chǎn)品之間的關(guān)聯(lián)十分形象,再說好的故事總是更有傳播度。
如果購買商品A的客戶,對于商品B,相對于其他商品,有更大的購買概率的話,那么AB商品就具有更高的關(guān)聯(lián)度,為了提高銷售額,應(yīng)盡可能將二者擺放到一起。網(wǎng)店也可以將商品A放在商品B的推薦頁中。
首先需挖掘出哪些商品之間存在更大的關(guān)聯(lián)度
下面用PowerBI來進(jìn)行關(guān)聯(lián)度分析:
假設(shè)一家超市的某些產(chǎn)品的銷售數(shù)據(jù),我們要計算出購買商品A的客戶中,有多少客戶也同時購買了商品B?這些客戶購買了商品B的金額有多大?
1.客戶關(guān)聯(lián)度
由于要分析的商品A和商品B都在商品名單表中,為了分別計算相互不影響,復(fù)制一個商品名單表,這里命名為'商品名單2',與訂單表建立虛線關(guān)系,數(shù)據(jù)模型如下圖,

將商品名單表中的產(chǎn)品名稱拖入到表格中,作為商品A,然后利用下面這個度量值計算商品A的客戶數(shù)量,
[客戶數(shù)]=COUNTROWS(VALUES('訂單表'[單號]))
然后利用商品名單2表中的商品名稱,生成一個切片器,以便選擇不同的產(chǎn)品,關(guān)聯(lián)產(chǎn)品假設(shè)為商品B。
下面這個是計算關(guān)聯(lián)分析的重點,購買了A的客戶中,有多少客戶也購買了產(chǎn)品B?
也就是同時購買A和B的客戶數(shù),度量值如下:
同時購買A和B的客戶數(shù) =
VAR B=
? ? CALCULATETABLE(
? ? ? ? VALUES('訂單表'[單號]),
? ? ? ? USERELATIONSHIP('商品名單2'[商品名稱],'訂單表'[商品名稱]),
? ? ? ? ALL('商品名單'[商品名稱])
? ? )
RETURN CALCULATE([客戶數(shù)],B)
通過以上兩個度量值相除,就可以計算出關(guān)聯(lián)產(chǎn)品的客戶占比,
關(guān)聯(lián)客戶占比 = DIVIDE([同時購買A和B的客戶數(shù)],[客戶數(shù)])
把上面這幾個度量值放入表格中,通過點擊不同的關(guān)聯(lián)產(chǎn)品,就可以自動計算出商品A和商品B之間的重復(fù)客戶占比,


但是兩個商品的客戶的重合度高,不代表帶來的銷售額就更高,所以還要分析一下,購買A的客戶中,同時購買的商品B銷售額有多少?通過金額這個維度來分析一下關(guān)聯(lián)性。
2.銷售金額關(guān)聯(lián)性
先來寫兩個簡單的度量值,商品A的銷售額和商品B的銷售額:
商品A的銷售額:
銷售額=SUM('訂單表'[銷售金額])
商品B的銷售額:
關(guān)聯(lián)產(chǎn)品B的銷售額 =?
CALCULATE([銷售額],
? ? USERELATIONSHIP('商品名單2'[商品名稱],'訂單表'[商品名稱]),
? ? ALL('商品名單'[商品名稱]) )
由于商品B來自于商品名單2表,而商品名單2表與訂單表是虛線關(guān)系,所以用?USERELATIONSHIP來激活關(guān)系。它主要是為了計算購買商品A的客戶中,購買了商品B的金額有多少?
然后就可以計算同時購買A和B的客戶中,購買商品B的金額。
A客戶購買B的金額 =
VAR A=
? ? CALCULATETABLE(VALUES('訂單表'[單號]))
VAR B=
? ? CALCULATETABLE(
? ? ? ? VALUES('訂單表'[單號]),
? ? ? ? USERELATIONSHIP('商品名單2'[商品名稱],'訂單表'[商品名稱]),
? ? ? ? ALL('商品名單'[商品名稱]))
RETURN?
? ? CALCULATE([關(guān)聯(lián)產(chǎn)品B的銷售額],
? ? ? ? NATURALINNERJOIN(A,B)))
這個度量值的含義是,先找出商品A和商品B的客戶列表,然后通過?NATURALINNERJOIN函數(shù)找出這兩個客戶列表的交集,也就是同時購買了這兩種商品的客戶,然后計算這些客戶的商品B銷售額就可以了。
同樣把這個度量值放到表格中,可以看出關(guān)聯(lián)銷售額,

有時候,客戶重合比例高的兩個產(chǎn)品,帶來的關(guān)聯(lián)產(chǎn)品的銷售額并不一定高,這個跟商品價格、購買數(shù)量都有關(guān)系。
3.關(guān)聯(lián)度四象限分析
通過上面的幾個度量值,獲得了相關(guān)分析的數(shù)據(jù),為了更直觀的展示出產(chǎn)品之間的關(guān)聯(lián)度,這里使用四象限分析法來展示。
其實就是制作一個散點圖,將兩個維度:關(guān)聯(lián)客戶占比作為Y軸,A客戶購買B的金額作為X軸,并按客戶占比、關(guān)聯(lián)產(chǎn)品銷售額的平均線作為恒線,切割出四個象限,并利用商品名稱作為圖例,顯示效果如下:

出現(xiàn)在第一象限(右上角)的產(chǎn)品,就是與切片器選中的商品不僅客戶重合度高,而且?guī)淼匿N售額也更高,具有高相關(guān)性,應(yīng)該特別關(guān)注。
該模型還可以分析某一段時間的關(guān)聯(lián)性,比如促銷期間、節(jié)假日期間,客戶的購買特征很可能與平時是不同的。

至此,一個簡單的關(guān)聯(lián)商品分析模型建立完成,根據(jù)關(guān)聯(lián)商品的不同,動態(tài)顯示不同的高相關(guān)度產(chǎn)品,并且可以隨著時間段的變化而變化,
如果有客戶畫像、銷售地點等數(shù)據(jù),還可以將這些數(shù)據(jù)作為外部篩選器,挖掘出不同客戶、不同地域的關(guān)聯(lián)產(chǎn)品組合。
當(dāng)然,這個模型挖掘的關(guān)聯(lián)商品只是初步結(jié)果,還應(yīng)對這個結(jié)果進(jìn)行進(jìn)一步驗證,避免因偶然或人為因素導(dǎo)致的關(guān)聯(lián)性,比如是否有某兩種商品的捆綁銷售活動等。
關(guān)聯(lián)商品分析是非常有用的數(shù)據(jù)挖掘方式,能夠幫助企業(yè)進(jìn)行商品精準(zhǔn)營銷、商品組合以及發(fā)現(xiàn)更多潛在客戶,真正的利用數(shù)據(jù),為企業(yè)創(chuàng)造價值。