準(zhǔn)確率,召回率,F(xiàn)值
https://www.zybuluo.com/mingyan926/note/565249
覆蓋率
對(duì)平臺(tái)來(lái)說(shuō)的,是希望消除馬太效應(yīng)(兩極分化),發(fā)掘長(zhǎng)尾能力。所以希望推薦的物品更加廣泛些,而不僅僅是一些熱門(mén)。

第一個(gè)公式是所有被推薦的商品的數(shù)量除以總的商品數(shù)量。
第二個(gè)公式是用熵來(lái)描述的,這里的p(i)是某個(gè)商品被推薦的概率,或者推薦某一類商品的概率(i可以是一件商品或者一類商品)。比如平臺(tái)一共做了一百次推薦,某個(gè)商品被推薦了3次,那么就是0.03。
根據(jù)熵的性質(zhì),H最大是在最不確定的時(shí)候,也就是最混亂。也就是說(shuō)每個(gè)商品都有相同的概率被推薦出去的時(shí)候,H最大。所以,覆蓋率越大,熵越大,就說(shuō)明每個(gè)商品被推薦的概率更均等。
多樣性
我們希望對(duì)于一次推薦給用戶的商品列表應(yīng)該盡可能的品類豐富,也就是差異性大些。

這里第一個(gè)公式表示的是對(duì)一個(gè)用戶的一次推薦過(guò)程的推薦列表中的多樣性。
假設(shè)這次推薦列表一共有n個(gè)商品,那我們就要評(píng)價(jià)下這n個(gè)商品的相似程度,評(píng)價(jià)方法就是看每?jī)蓚€(gè)商品的相似度,然后取個(gè)平均。
商品兩兩組合一共有 n(n-1)/2這么多種可能,這就是分母的含義,分子就是兩兩商品相似度之和(s(I,j)表示兩個(gè)商品的相似度,具體計(jì)算公式后面再說(shuō)。這樣得到的平均結(jié)果是相似度的平均,然后再用1減去,得到的就是多樣性。
而第二個(gè)式子是從整個(gè)平臺(tái)角度來(lái)說(shuō)的,就是把所有推薦列表的多樣性取個(gè)平均值。U代表所有推薦列表。