1 屬性的取值問題
對(duì)離散型的屬性可進(jìn)行獨(dú)熱編碼,那么對(duì)連續(xù)型屬性我們?cè)撊绾翁幚砟??進(jìn)行0-1標(biāo)準(zhǔn)化處理?
2 計(jì)算過(guò)程
我們通過(guò)簡(jiǎn)單的加減乘除就實(shí)現(xiàn)了計(jì)算,并沒有像機(jī)器學(xué)習(xí)里面一樣定義損失函數(shù),劃分訓(xùn)練集和測(cè)試集之類的操作。
3 該方法的一些優(yōu)點(diǎn)與不足
優(yōu)點(diǎn):推薦的物品不會(huì)太熱門,因?yàn)橛?jì)算過(guò)程中我們只考慮了單個(gè)用戶的歷史評(píng)分?jǐn)?shù)據(jù);個(gè)性化效果較好;原理易于理解。
不足:對(duì)于新的沒有歷史評(píng)分?jǐn)?shù)據(jù)的用戶,存在冷啟動(dòng)問題;相同內(nèi)容特征的物品差異性較小,不一定是用戶想要的;要求物品的屬性能比較容易抽取。
4 可優(yōu)化的地方
如果引入時(shí)間因子,即考慮到用戶的興趣會(huì)隨時(shí)間遷移的問題,則我們?cè)?.1小節(jié)中計(jì)算系數(shù)的公式也應(yīng)改變一下。
? ??????????????????????????????????????????
其中,為衰減因子,t=t(i) 可取為用戶對(duì)物品 i 的評(píng)分時(shí)間到當(dāng)前時(shí)間的時(shí)間間隔。為簡(jiǎn)單起見,對(duì)所有用戶,我們可以應(yīng)用同一個(gè)
值。再深入一點(diǎn)研究的話,應(yīng)該是不同的用戶興趣衰減的快慢也不一樣,即
=
。