一. 問題
我們要為一個電商商戶預測其用戶購買某個商品的概率,這個商戶提供了5個商品,用戶可以自由購買其中的商品,其中第5個商品是該商戶的重要商品。商戶用了很多方法引導其用戶購買第5個商品?,F(xiàn)在我要預測購買了前4個商品任意組合的用戶購買第5個商品的概率。
二. 貝葉斯公式
這個問題是一個典型的貝葉斯問題。貝葉斯是英國數(shù)學家,統(tǒng)計學中有一個基本的工具用他的名字命名,叫貝葉斯公式,貝葉斯公式描述了事件A在事件B發(fā)生的條件下概率。比如:事件A發(fā)生的概率是P(A),事件B發(fā)生的概率是P(B),事件A和事件B同時發(fā)生的概率是P(AB),事件A在事件B發(fā)生的條件下概率是P(A|B)。
P(A|B) = P(B|A)P(A) / P(B)
P(A) P(B) P(B|A) 都可以根據(jù)歷史數(shù)據(jù)計算可得。
貝葉斯公式實際上是將要計算的結果轉化為利用已知數(shù)據(jù)得出結論的工具。
三. 建模和求解
我們假設用戶購買商品A1的概率是P(A1),購買商品A2的概率是P(A2),購買商品P(A3)的概率就是P(A3),購買商品P(A4)的概率就是P(A4),購買商品P(A5)的概率就是P(A5)
我們按照用戶購買組合的情況,分組求解以上模型,我們將分為:
- 購買1個商品用戶,購買第5個商品的概率
根據(jù)前面討論的模型,該情況下的貝葉斯算式是:
P(A5| A1) = P(A1|A5) P(A5) / P(A1)
P(A5| A2) = P(A2|A5) P(A5) / P(A2)
P(A5| A3) = P(A3|A5) P(A5) / P(A3)
P(A5| A4) = P(A4|A5) P(A5) / P(A4)
4個算式中的P(A1| A5),P(A2| A5),P(A3| A5),P(A4| A5),P(A1),P(A2),P(A3),P(A4),P(A5)都可以通過在已有的歷史數(shù)據(jù)的統(tǒng)計計算得出,換句話說,我們計算所需要用到的所有數(shù)值都是已知的。
以上4個算式的結果是:
P(A5| A1) = 0.13%
P(A5| A2) = 0.13%
P(A5| A3) = 0.1%
P(A5| A4) = 0.12%
- 購買2個商品的用戶,購買第5個商品的概率
按照貝葉斯公式,
P(A5| A1 A2) = P(A1 A2|A5) P(A5) / P(A1 A2)
P(A5| A1 A3) = P(A1 A3|A5) P(A5) / P(A1 A3)
P(A5| A1 A4) = P(A1 A4|A5)P(A5) / P(A1 A4)
P(A5| A2 A3) = P(A2 A3|A5)P(A5) / P(A2 A3)
P(A5| A2 A4) = P(A2 A4|A5)P(A5) / P(A2 A4)
P(A5| A3 A4) = P(A3 A4|A5)P(A5) / P(A3 A4)
同樣,算式中所用到的所有數(shù)據(jù)都可以通過對歷史數(shù)據(jù)的統(tǒng)計計算得出,經(jīng)過計算,最后得出:
P(A5| A1 A2) = P(A1 A2|A5) P(A5) / P(A1 A2) = 0.1%
P(A5| A1 A3) = P(A1 A3|A5) P(A5) / P(A1 A3) = 0.1%
P(A5| A1 A4) = P(A1 A4|A5)P(A5) / P(A1 A4) = 0.1%
P(A5| A2 A3) = P(A2 A3|A5)P(A5) / P(A2 A3) = 0.2%
P(A5| A2 A4) = P(A2 A4|A5)P(A5) / P(A2 A4) = 0.0%
P(A5| A3 A4) = P(A3 A4|A5)P(A5) / P(A3 A4) = 0.2%
- 購買3個商品的用戶,購買第5個商品的概率:
P(A5| A1 A2 A3) = P(A1 A2 A3|A5) P(A5) / P(A1 A2 A3)
P(A5| A1 A2 A4) = P(A1 A2 A4|A5) P(A5) / P(A1 A2 A4)
P(A5| A1 A3 A4) = P(A1 A3 A4|A5) P(A5) / P(A1 A3 A4)
P(A5| A2 A3 A4) = P(A2 A4 A4|A5) P(A5) / P(A2 A3 A4)
同前2種情況類似,最后結果是:
P(A5| A1 A2 A3) = P(A1 A2 A3|A5) P(A5) / P(A1 A2 A3) = 0.3%
P(A5| A1 A2 A4) = P(A1 A2 A4|A5) P(A5) / P(A1 A2 A4) = 0.4%
P(A5| A1 A3 A4) = P(A1 A3 A4|A5) P(A5) / P(A1 A3 A4) = 0.5%
P(A5| A2 A3 A4) = P(A2 A4 A4|A5) P(A5) / P(A2 A3 A4) = 0.0%
- 購買4個商品的組合,購買第5個商品的概率:
P(A5| A1 A2 A3 A4) = P(A1 A2 A3 A4|A5) P(A5) / P(A1 A2 A3 A4)
同樣按照前面的方法計算,得出:
P(A5| A1 A2 A3 A4) = P(A1 A2 A3 A4|A5) P(A5) / P(A1 A2 A3 A4) = 1.6%
四. 結果分析
我們從2個角度來分析結果,1個角度是從每種情況下比較不同組合間的概率,1個角度是不同情況間的橫向對比。
每種情況下不同組合的概率:
(1)只購買1個商品的情況下,不管用戶購買哪種商品,對購買第5種商品的概率都沒太大影響。4個數(shù)據(jù)的標準差是0.014,均值是0.12。
(2)購買2個商品的情況下,購買A2A3和A3A4對結果是有明顯效果的,但是購買A2A4組合的用戶反而不太可能購買第5種商品。
(3)購買3個商品的情況下,購買A1A3A4組合的用戶相比其他組合的用戶效果最好,而購買A2A3A4的用戶反而不太可能購買第5種商品。購買不同數(shù)量商品組合間的對比
購買1個商品結果均值是0.12%,購買2個商品的結果均值是0.12%,購買3個商品的結果均值是0.3%,購買4個商品的結果均值是1.6%??梢钥闯霎斢脩糍徺I3個、4個商品是,對購買第5種商品的概率是很大提升的,
四. 結論
- 購買1個商品的情況下,購買哪個商品對最后購買第5個商品的概率影響不大。
- 購買2個商品的情況下,只有A2和A4組合對購買第5個商品的概率有提升,其他組合對目標概率的提升不高。
- 購買3個商品的情況下,普遍能大幅提升購買第5個商品的概率,但是A2A3A4組合除外。
- 購買4個商品的情況下,能大大提高購買第5個商品的概率,該商戶應該想辦法引導用戶購買出第5個商品外的剩余全部的4個商品。