推薦系統(tǒng)評(píng)測(cè)指標(biāo)3-覆蓋率

覆蓋率指能夠推薦出來(lái)得物品占總物品的比例。
覆蓋分布:每個(gè)被推薦的分布應(yīng)該差不多。
Coverage = R(u)并集 / 總物品

方法一、信息熵

H= -sum(  p(i)log(p(i))  )  
其中 pi= sum(i)/sum(sum(i) )  #i 為第i個(gè)物品的流行度 / 所有物品流行度之和 

方法二、基尼系數(shù)
i 為第i個(gè)物品
G = sum((2j-n-1)p(ij)) /(n-1)


物品流行度p(ij) 按照流行度排序的第j個(gè)物品,給定物品流行度分布后的基尼系數(shù)。 
p = ((item,weight))
def Gini(p): 
         n=len(p)
         j=1
         for item,weight in sorted(p.items(),key=itemgetter(1)):
              G+=(2*j-n-1) * weight
               j=j+1 
         return G/float(n-1)     

赫希曼根據(jù)洛倫茨曲線提出的判斷分配平等程度的[指標(biāo)]。設(shè)實(shí)際流行度曲線和流行分配絕對(duì)平均曲線之間的面積為 A,實(shí)際流行度曲線右下方的面積為 B。并以 A 除以(A+B)的商表示不平等程度。

image.png

如果系統(tǒng)的流行度很平均,那么SA 就會(huì)很小,從而基尼系數(shù)會(huì)很小。

基尼系數(shù)最大為“1”,最小等于“0”。

基尼系數(shù)越接近0表明越是趨向平等。國(guó)際慣例把0.2以下視為絕對(duì)平均,0.2-0.3視為比較平均;0.3-0.4視為相對(duì)合理;0.4-0.5視為差距較大,當(dāng)基尼系數(shù)達(dá)到0.5以上時(shí),則表示收入懸殊。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容