PowerBI:關(guān)聯(lián)商品分析


當(dāng)我們走進(jìn)超市,迎面而來的就是貨架上琳瑯滿目的商品。這些商品的擺放,或者不同品類的貨架分布是隨機(jī)排列的嗎?答案是NO!

相必都聽說過啤酒與尿布的故事,這兩個表面上毫不相關(guān)的商品,在超市中擺放在一起時二者的銷量都大幅度提升。這里就不討論這個案例的真實性如何,但用它來理解產(chǎn)品之間的關(guān)聯(lián)十分形象,再說好的故事總是更有傳播度。

如果購買商品A的客戶,對于商品B,相對于其他商品,有更大的購買概率的話,那么AB商品就具有更高的關(guān)聯(lián)度,為了提高銷售額,應(yīng)盡可能將二者擺放到一起。網(wǎng)店也可以將商品A放在商品B的推薦頁中。

首先需挖掘出哪些商品之間存在更大的關(guān)聯(lián)度

下面用PowerBI來進(jìn)行關(guān)聯(lián)度分析:

假設(shè)一家超市的某些產(chǎn)品的銷售數(shù)據(jù),我們要計算出購買商品A的客戶中,有多少客戶也同時購買了商品B?這些客戶購買了商品B的金額有多大?

1.客戶關(guān)聯(lián)度

由于要分析的商品A和商品B都在商品名單表中,為了分別計算相互不影響,復(fù)制一個商品名單表,這里命名為'商品名單2',與訂單表建立虛線關(guān)系,數(shù)據(jù)模型如下圖,

將商品名單表中的產(chǎn)品名稱拖入到表格中,作為商品A,然后利用下面這個度量值計算商品A的客戶數(shù)量,

[客戶數(shù)]=COUNTROWS(VALUES('訂單表'[單號]))

然后利用商品名單2表中的商品名稱,生成一個切片器,以便選擇不同的產(chǎn)品,關(guān)聯(lián)產(chǎn)品假設(shè)為商品B。

下面這個是計算關(guān)聯(lián)分析的重點,購買了A的客戶中,有多少客戶也購買了產(chǎn)品B?

也就是同時購買A和B的客戶數(shù),度量值如下:

同時購買A和B的客戶數(shù) =

VAR B=

? ? CALCULATETABLE(

? ? ? ? VALUES('訂單表'[單號]),

? ? ? ? USERELATIONSHIP('商品名單2'[商品名稱],'訂單表'[商品名稱]),

? ? ? ? ALL('商品名單'[商品名稱])

? ? )

RETURN CALCULATE([客戶數(shù)],B)

通過以上兩個度量值相除,就可以計算出關(guān)聯(lián)產(chǎn)品的客戶占比,

關(guān)聯(lián)客戶占比 = DIVIDE([同時購買A和B的客戶數(shù)],[客戶數(shù)])

把上面這幾個度量值放入表格中,通過點擊不同的關(guān)聯(lián)產(chǎn)品,就可以自動計算出商品A和商品B之間的重復(fù)客戶占比,

但是兩個商品的客戶的重合度高,不代表帶來的銷售額就更高,所以還要分析一下,購買A的客戶中,同時購買的商品B銷售額有多少?通過金額這個維度來分析一下關(guān)聯(lián)性。

2.銷售金額關(guān)聯(lián)性

先來寫兩個簡單的度量值,商品A的銷售額和商品B的銷售額:

商品A的銷售額:

銷售額=SUM('訂單表'[銷售金額])

商品B的銷售額:

關(guān)聯(lián)產(chǎn)品B的銷售額 =?

CALCULATE([銷售額],

? ? USERELATIONSHIP('商品名單2'[商品名稱],'訂單表'[商品名稱]),

? ? ALL('商品名單'[商品名稱]) )

由于商品B來自于商品名單2表,而商品名單2表與訂單表是虛線關(guān)系,所以用?USERELATIONSHIP來激活關(guān)系。它主要是為了計算購買商品A的客戶中,購買了商品B的金額有多少?

然后就可以計算同時購買A和B的客戶中,購買商品B的金額。

A客戶購買B的金額 =

VAR A=

? ? CALCULATETABLE(VALUES('訂單表'[單號]))

VAR B=

? ? CALCULATETABLE(

? ? ? ? VALUES('訂單表'[單號]),

? ? ? ? USERELATIONSHIP('商品名單2'[商品名稱],'訂單表'[商品名稱]),

? ? ? ? ALL('商品名單'[商品名稱]))

RETURN?

? ? CALCULATE([關(guān)聯(lián)產(chǎn)品B的銷售額],

? ? ? ? NATURALINNERJOIN(A,B)))

這個度量值的含義是,先找出商品A和商品B的客戶列表,然后通過?NATURALINNERJOIN函數(shù)找出這兩個客戶列表的交集,也就是同時購買了這兩種商品的客戶,然后計算這些客戶的商品B銷售額就可以了。

同樣把這個度量值放到表格中,可以看出關(guān)聯(lián)銷售額,

有時候,客戶重合比例高的兩個產(chǎn)品,帶來的關(guān)聯(lián)產(chǎn)品的銷售額并不一定高,這個跟商品價格、購買數(shù)量都有關(guān)系。

3.關(guān)聯(lián)度四象限分析

通過上面的幾個度量值,獲得了相關(guān)分析的數(shù)據(jù),為了更直觀的展示出產(chǎn)品之間的關(guān)聯(lián)度,這里使用四象限分析法來展示。

其實就是制作一個散點圖,將兩個維度:關(guān)聯(lián)客戶占比作為Y軸,A客戶購買B的金額作為X軸,并按客戶占比、關(guān)聯(lián)產(chǎn)品銷售額的平均線作為恒線,切割出四個象限,并利用商品名稱作為圖例,顯示效果如下:

出現(xiàn)在第一象限(右上角)的產(chǎn)品,就是與切片器選中的商品不僅客戶重合度高,而且?guī)淼匿N售額也更高,具有高相關(guān)性,應(yīng)該特別關(guān)注。

該模型還可以分析某一段時間的關(guān)聯(lián)性,比如促銷期間、節(jié)假日期間,客戶的購買特征很可能與平時是不同的。

至此,一個簡單的關(guān)聯(lián)商品分析模型建立完成,根據(jù)關(guān)聯(lián)商品的不同,動態(tài)顯示不同的高相關(guān)度產(chǎn)品,并且可以隨著時間段的變化而變化,

如果有客戶畫像、銷售地點等數(shù)據(jù),還可以將這些數(shù)據(jù)作為外部篩選器,挖掘出不同客戶、不同地域的關(guān)聯(lián)產(chǎn)品組合。

當(dāng)然,這個模型挖掘的關(guān)聯(lián)商品只是初步結(jié)果,還應(yīng)對這個結(jié)果進(jìn)行進(jìn)一步驗證,避免因偶然或人為因素導(dǎo)致的關(guān)聯(lián)性,比如是否有某兩種商品的捆綁銷售活動等。

關(guān)聯(lián)商品分析是非常有用的數(shù)據(jù)挖掘方式,能夠幫助企業(yè)進(jìn)行商品精準(zhǔn)營銷、商品組合以及發(fā)現(xiàn)更多潛在客戶,真正的利用數(shù)據(jù),為企業(yè)創(chuàng)造價值。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容