覆蓋率指能夠推薦出來(lái)得物品占總物品的比例。
覆蓋分布:每個(gè)被推薦的分布應(yīng)該差不多。
Coverage = R(u)并集 / 總物品
方法一、信息熵
H= -sum( p(i)log(p(i)) )
其中 pi= sum(i)/sum(sum(i) ) #i 為第i個(gè)物品的流行度 / 所有物品流行度之和
方法二、基尼系數(shù):
i 為第i個(gè)物品
G = sum((2j-n-1)p(ij)) /(n-1)
物品流行度p(ij) 按照流行度排序的第j個(gè)物品,給定物品流行度分布后的基尼系數(shù)。
p = ((item,weight))
def Gini(p):
n=len(p)
j=1
for item,weight in sorted(p.items(),key=itemgetter(1)):
G+=(2*j-n-1) * weight
j=j+1
return G/float(n-1)
赫希曼根據(jù)洛倫茨曲線提出的判斷分配平等程度的[指標(biāo)]。設(shè)實(shí)際流行度曲線和流行分配絕對(duì)平均曲線之間的面積為 A,實(shí)際流行度曲線右下方的面積為 B。并以 A 除以(A+B)的商表示不平等程度。

image.png
如果系統(tǒng)的流行度很平均,那么SA 就會(huì)很小,從而基尼系數(shù)會(huì)很小。
基尼系數(shù)最大為“1”,最小等于“0”。
基尼系數(shù)越接近0表明越是趨向平等。國(guó)際慣例把0.2以下視為絕對(duì)平均,0.2-0.3視為比較平均;0.3-0.4視為相對(duì)合理;0.4-0.5視為差距較大,當(dāng)基尼系數(shù)達(dá)到0.5以上時(shí),則表示收入懸殊。