利用貝葉斯公式進行用戶購買率分析

一. 問題
我們要為一個電商商戶預測其用戶購買某個商品的概率,這個商戶提供了5個商品,用戶可以自由購買其中的商品,其中第5個商品是該商戶的重要商品。商戶用了很多方法引導其用戶購買第5個商品?,F(xiàn)在我要預測購買了前4個商品任意組合的用戶購買第5個商品的概率。

二. 貝葉斯公式
這個問題是一個典型的貝葉斯問題。貝葉斯是英國數(shù)學家,統(tǒng)計學中有一個基本的工具用他的名字命名,叫貝葉斯公式,貝葉斯公式描述了事件A在事件B發(fā)生的條件下概率。比如:事件A發(fā)生的概率是P(A),事件B發(fā)生的概率是P(B),事件A和事件B同時發(fā)生的概率是P(AB),事件A在事件B發(fā)生的條件下概率是P(A|B)。

P(A|B) = P(B|A)P(A) / P(B)

P(A) P(B) P(B|A) 都可以根據(jù)歷史數(shù)據(jù)計算可得。
貝葉斯公式實際上是將要計算的結果轉化為利用已知數(shù)據(jù)得出結論的工具。

三. 建模和求解
我們假設用戶購買商品A1的概率是P(A1),購買商品A2的概率是P(A2),購買商品P(A3)的概率就是P(A3),購買商品P(A4)的概率就是P(A4),購買商品P(A5)的概率就是P(A5)

我們按照用戶購買組合的情況,分組求解以上模型,我們將分為:

  1. 購買1個商品用戶,購買第5個商品的概率
    根據(jù)前面討論的模型,該情況下的貝葉斯算式是:
    P(A5| A1) = P(A1|A5) P(A5) / P(A1)
    P(A5| A2) = P(A2|A5) P(A5) / P(A2)
    P(A5| A3) = P(A3|A5) P(A5) / P(A3)
    P(A5| A4) = P(A4|A5) P(A5) / P(A4)

4個算式中的P(A1| A5),P(A2| A5),P(A3| A5),P(A4| A5),P(A1),P(A2),P(A3),P(A4),P(A5)都可以通過在已有的歷史數(shù)據(jù)的統(tǒng)計計算得出,換句話說,我們計算所需要用到的所有數(shù)值都是已知的。

以上4個算式的結果是:
P(A5| A1) = 0.13%
P(A5| A2) = 0.13%
P(A5| A3) = 0.1%
P(A5| A4) = 0.12%

  1. 購買2個商品的用戶,購買第5個商品的概率

按照貝葉斯公式,
P(A5| A1 A2) = P(A1 A2|A5) P(A5) / P(A1 A2)
P(A5| A1 A3) = P(A1 A3|A5) P(A5) / P(A1 A3)
P(A5| A1 A4) = P(A1 A4|A5)P(A5) / P(A1 A4)
P(A5| A2 A3) = P(A2 A3|A5)P(A5) / P(A2 A3)
P(A5| A2 A4) = P(A2 A4|A5)P(A5) / P(A2 A4)
P(A5| A3 A4) = P(A3 A4|A5)P(A5) / P(A3 A4)

同樣,算式中所用到的所有數(shù)據(jù)都可以通過對歷史數(shù)據(jù)的統(tǒng)計計算得出,經(jīng)過計算,最后得出:
P(A5| A1 A2) = P(A1 A2|A5) P(A5) / P(A1 A2) = 0.1%
P(A5| A1 A3) = P(A1 A3|A5) P(A5) / P(A1 A3) = 0.1%
P(A5| A1 A4) = P(A1 A4|A5)P(A5) / P(A1 A4) = 0.1%
P(A5| A2 A3) = P(A2 A3|A5)P(A5) / P(A2 A3) = 0.2%
P(A5| A2 A4) = P(A2 A4|A5)P(A5) / P(A2 A4) = 0.0%
P(A5| A3 A4) = P(A3 A4|A5)P(A5) / P(A3 A4) = 0.2%

  1. 購買3個商品的用戶,購買第5個商品的概率:
    P(A5| A1 A2 A3) = P(A1 A2 A3|A5) P(A5) / P(A1 A2 A3)
    P(A5| A1 A2 A4) = P(A1 A2 A4|A5) P(A5) / P(A1 A2 A4)
    P(A5| A1 A3 A4) = P(A1 A3 A4|A5) P(A5) / P(A1 A3 A4)
    P(A5| A2 A3 A4) = P(A2 A4 A4|A5) P(A5) / P(A2 A3 A4)

同前2種情況類似,最后結果是:
P(A5| A1 A2 A3) = P(A1 A2 A3|A5) P(A5) / P(A1 A2 A3) = 0.3%
P(A5| A1 A2 A4) = P(A1 A2 A4|A5) P(A5) / P(A1 A2 A4) = 0.4%
P(A5| A1 A3 A4) = P(A1 A3 A4|A5) P(A5) / P(A1 A3 A4) = 0.5%
P(A5| A2 A3 A4) = P(A2 A4 A4|A5) P(A5) / P(A2 A3 A4) = 0.0%

  1. 購買4個商品的組合,購買第5個商品的概率:
    P(A5| A1 A2 A3 A4) = P(A1 A2 A3 A4|A5) P(A5) / P(A1 A2 A3 A4)

同樣按照前面的方法計算,得出:
P(A5| A1 A2 A3 A4) = P(A1 A2 A3 A4|A5) P(A5) / P(A1 A2 A3 A4) = 1.6%

四. 結果分析
我們從2個角度來分析結果,1個角度是從每種情況下比較不同組合間的概率,1個角度是不同情況間的橫向對比。

  1. 每種情況下不同組合的概率:
    (1)只購買1個商品的情況下,不管用戶購買哪種商品,對購買第5種商品的概率都沒太大影響。4個數(shù)據(jù)的標準差是0.014,均值是0.12。
    (2)購買2個商品的情況下,購買A2A3和A3A4對結果是有明顯效果的,但是購買A2A4組合的用戶反而不太可能購買第5種商品。
    (3)購買3個商品的情況下,購買A1A3A4組合的用戶相比其他組合的用戶效果最好,而購買A2A3A4的用戶反而不太可能購買第5種商品。

  2. 購買不同數(shù)量商品組合間的對比
    購買1個商品結果均值是0.12%,購買2個商品的結果均值是0.12%,購買3個商品的結果均值是0.3%,購買4個商品的結果均值是1.6%??梢钥闯霎斢脩糍徺I3個、4個商品是,對購買第5種商品的概率是很大提升的,

四. 結論

  1. 購買1個商品的情況下,購買哪個商品對最后購買第5個商品的概率影響不大。
  2. 購買2個商品的情況下,只有A2和A4組合對購買第5個商品的概率有提升,其他組合對目標概率的提升不高。
  3. 購買3個商品的情況下,普遍能大幅提升購買第5個商品的概率,但是A2A3A4組合除外。
  4. 購買4個商品的情況下,能大大提高購買第5個商品的概率,該商戶應該想辦法引導用戶購買出第5個商品外的剩余全部的4個商品。
最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

友情鏈接更多精彩內(nèi)容