支持度:商品組合A、B出現(xiàn)的頻數(shù),記為S。
支持度很高的時(shí)候,代表商品A和B經(jīng)常同時(shí)被購(gòu)買(mǎi),但不能說(shuō)明A對(duì)B的影響。反例:所有訂單都買(mǎi)了A,那么A與其他所有產(chǎn)品的支持度都很高。
置信度:購(gòu)買(mǎi)商品A后,購(gòu)買(mǎi)商品B的概率,即條件概率,記為P。
置信度很高的時(shí)候,代表B經(jīng)常在A被買(mǎi)之后接著被購(gòu)買(mǎi)。但沒(méi)有考慮B本身的頻率,也不能說(shuō)明A對(duì)B的影響。反例:只有一個(gè)訂單買(mǎi)了B,那么所有前序商品對(duì)B的置信度都很高。
提升度:購(gòu)買(mǎi)商品A后購(gòu)買(mǎi)B的概率與所有購(gòu)買(mǎi)B的概率的比例,即P(A|B)/S(B),記為L(zhǎng)。可以說(shuō)明購(gòu)買(mǎi)A之后,對(duì)購(gòu)買(mǎi)商品B的提升程度。
例子:現(xiàn)有眼霜A與面膜B,買(mǎi)眼霜的人比買(mǎi)面膜的人多,S(眼霜)=10%,S(面膜)=5%,同時(shí)買(mǎi)眼霜和面膜的人很少,S(眼霜+面膜)=1%。由此可以算出:
P(眼霜|面膜) = S(眼霜+面膜) ÷ S(眼霜) = 10%
即10%的人會(huì)買(mǎi)眼霜,這10%中只有10%的人會(huì)繼續(xù)買(mǎi)面膜。這個(gè)數(shù)字并不高,看起來(lái)似乎不能說(shuō)明什么。但是,所有人中只有5%的人會(huì)買(mǎi)面膜,而買(mǎi)了眼霜的人群,就有10%的人會(huì)買(mǎi)面膜了!即:
L(眼霜→面膜) =??P(眼霜|面膜) ÷ S(面膜) = 2
也就是說(shuō),如果想要促使人們買(mǎi)面膜,讓他們先購(gòu)買(mǎi)眼霜再購(gòu)買(mǎi)面膜比直接讓他們購(gòu)買(mǎi)面膜要容易一倍。