推薦系統(tǒng)的本質(zhì)是提取用戶特征,并且匹配相應(yīng)的物品集進(jìn)行推薦,把整個(gè)過程進(jìn)行梳理拆分,大概可以分為四個(gè)階段:

一、生成用戶特征向量
這部分主要是對(duì)用戶信息提取,并且將行為轉(zhuǎn)化為特征向量。
用戶信息主要分為兩部分,一部分是屬性信息,如用戶的性別、所在地、職業(yè)等,這些信息一般可以通過注冊(cè)信息或關(guān)聯(lián)第三方賬號(hào)信息獲得;另一部分是用戶的行為信息,這部分信息通常是用戶在平臺(tái)產(chǎn)生一定的行為后,分析行為日志獲得。
對(duì)于不同的用戶信息,應(yīng)該給定不同的權(quán)重,比如,購買的權(quán)重>瀏覽的權(quán)重,因?yàn)橘徺I是個(gè)成本更高的操作;同理詳情頁瀏覽的權(quán)重>列表頁瀏覽
對(duì)于用戶的行為信息,也應(yīng)當(dāng)根據(jù)用戶行為的時(shí)間、次數(shù),給予不同的權(quán)重:時(shí)間越臨近的行為,應(yīng)當(dāng)反饋的是相對(duì)更新的信息,權(quán)重較高;頻次越高的行為,代表信息準(zhǔn)確度高,用戶喜好強(qiáng),權(quán)重較高
另外一個(gè)對(duì)于權(quán)重的給定,可以參考物品的熱門度,熱門物品一般推薦排序較為靠前,用戶的行為一定程度受熱門度影響,適當(dāng)降低熱門物品的權(quán)重會(huì)得到更準(zhǔn)確的用戶特征向量。
注:如果是新用戶,信息不足無法生成特征向量時(shí),建議直接使用topN列表,獲取一定的行為后再進(jìn)行個(gè)性化推薦
二、特征-物品相關(guān)推薦
根據(jù)用戶的特征向量,和物品進(jìn)行匹配,生成該用戶推薦的物品集;推薦方式一般有協(xié)同過濾、基于內(nèi)容的推薦,基于關(guān)聯(lián)規(guī)則等……
在匹配用戶特征向量和物品集時(shí),一般有正向推薦和反向推薦兩種:
正向推薦是按照物品關(guān)聯(lián)度做一定的推薦規(guī)則,適用于推薦較少的物品集,如文章的相關(guān)推薦等
反向推薦是直接過濾調(diào)不在特征候選集內(nèi)的物品,適用于推薦物品較多的時(shí)候,比如流列表
三、物品集過濾
對(duì)于上一步匹配出來的物品集,還要進(jìn)行一定的過濾,過濾原則是:剔除無效物品、低質(zhì)物品、重復(fù)物品或用戶已經(jīng)瀏覽過的物品
我們可以限定某些條件作為無效物品的過濾,如UGC平臺(tái)的已下線內(nèi)容、電商平臺(tái)的無庫存商品以及用戶手動(dòng)設(shè)置的篩選范圍之外的物品
低質(zhì)物品如電商平臺(tái)被舉報(bào)的假貨,新聞平臺(tái)的低質(zhì)文章等
對(duì)于多個(gè)一樣的物品,只推薦一個(gè);像新聞資訊平臺(tái)標(biāo)題、內(nèi)容一致的文章一個(gè)列表只推薦一篇就可以了;但在電商平臺(tái)這一點(diǎn)可能會(huì)不一樣,一樣的商品如果是來自不同的商家,是不可以過濾的
有些業(yè)務(wù)場(chǎng)景,用戶產(chǎn)生過行為(查看、近期購買等)的物品要進(jìn)行一定的過濾,比如用戶已經(jīng)看過的帖子、文章等不需要重復(fù)推薦;但在電商業(yè)務(wù)模式下就不一定要過濾,比如生鮮電商的猜你喜歡內(nèi)容推薦
總體來說,應(yīng)該根據(jù)平臺(tái)的業(yè)務(wù)不同,對(duì)各個(gè)推薦場(chǎng)景針對(duì)性制定過濾規(guī)則并且通過數(shù)據(jù)測(cè)試不斷調(diào)優(yōu)
四、物品集排名
在物品集輸出前的最后一步,是對(duì)已有物品集進(jìn)行排名,輸出給用戶的應(yīng)當(dāng)是個(gè)有序列表(輸出無序列表CTR及用戶滿意度均低于有序列表)
有序列表確認(rèn)的第一步,是確認(rèn)當(dāng)前場(chǎng)景的排名因子及權(quán)重,如特征-物品相關(guān)度權(quán)重、時(shí)間權(quán)重、物品分類及熱門標(biāo)記等……然后根據(jù)用戶反饋對(duì)排序進(jìn)行調(diào)優(yōu),在調(diào)優(yōu)過程中要關(guān)注關(guān)鍵數(shù)據(jù)指標(biāo)(如ctr、下單轉(zhuǎn)化率等)的變化,關(guān)鍵指標(biāo)不斷提升,代表效果在不斷優(yōu)化~