首先,給定一群用戶,用這群用戶對物品評分的方差度量這群用戶興趣的一致程度。如果方差很大,說明這一群用戶的興趣不太一致,反之則說明這群用戶的興趣比較一致。令σu∈U ' 為用戶集合 U' 中所有評分的方差, 基本思想是通過如下方式度量一個物品的區(qū)分度 D(i):

其中,N+(i)是喜歡物品 i 的用戶集合,N-(i)是不喜歡物品 i 的用戶集合,N(i) 是沒有對物品i 評分的用戶集合。也就是說,對于物品 i ,將用戶分成 3 類——喜歡物品 i 的用戶、不喜歡物品 i 的用戶和不知道物品 i 的用戶(即沒有給 i 評分的用戶)。如果這 3 類用戶集合內(nèi)的用戶對其他的物品興趣很不致,說明物品 i 具有較高的區(qū)分度。
算法首先會從所有用戶中找到具有最高區(qū)分度的物品 i ,然后將用戶分成 3類。然后在每類用戶中再找到最具區(qū)分度的物品,然后將每一類用戶又各自分為 3 類,也就是將總用戶分成 9 類,然后這樣繼續(xù)下去,最終可以通過對一系列物品的看法將用戶進(jìn)行分類。而在冷啟動時,我們從根節(jié)點開始詢問用戶對該節(jié)點物品的看法,然后根據(jù)用戶的選擇將用戶放到不同的分枝,直到進(jìn)入最后的葉子節(jié)點,此時我們就已經(jīng)對用戶的興趣有了比較清楚的了解,從而可以開始對用戶進(jìn)行比較準(zhǔn)確地個性化推薦