基于內(nèi)容的推薦算法

1.產(chǎn)生背景

? ? 基于內(nèi)容的推薦算法是基于標(biāo)的物的相關(guān)信息、用戶信息及用戶對(duì)標(biāo)的物的操作行為來(lái)構(gòu)建推薦算法模型,為用戶提供推薦服務(wù),這里的標(biāo)的物相關(guān)信息可以是對(duì)標(biāo)的物文字描述的metadata信息、標(biāo)簽、用戶評(píng)論、人工標(biāo)注的信息等。用戶相關(guān)信息是指人口統(tǒng)計(jì)學(xué)信息(如年齡、性別、偏好、地域、收入等等)。用戶對(duì)物的操作行為可以是評(píng)論、收藏、點(diǎn)贊、觀看、瀏覽、點(diǎn)擊、加購(gòu)物車、購(gòu)買等?;趦?nèi)容的推薦算法一般只依賴于用戶自身的行為用戶提供推薦,不涉及到其他用戶的行為。廣義的標(biāo)的物相關(guān)信息不限于文本信息、圖片、語(yǔ)音、視頻等都可以作為內(nèi)容推薦的信息來(lái)源,只不過(guò)這類信息處理成本較大,不光是算法難度大、處理的時(shí)間及存儲(chǔ)成本也相對(duì)更高?;趦?nèi)容的推薦算法是最早應(yīng)用于工程實(shí)踐的推薦算法,有大量的應(yīng)用案例,如今日頭條的推薦有很大比例是基于內(nèi)容的推薦算法。

2.特點(diǎn)

? ? 2.1. 個(gè)性化推薦

? ? 2.2. 用戶歷史行為

? ? 2.3. 物品相似性

3.網(wǎng)絡(luò)結(jié)構(gòu)

? ??

上圖為盜圖

4.算法模型

? ? 4.1. 基于用戶歷史行為記錄做推薦

? ? 4.2. 用戶和標(biāo)的物特征都用顯示的標(biāo)簽表示,利用該表示倒排索引法做推薦

? ? 4.3. 用戶和標(biāo)的物嵌入到同一個(gè)向量空間,基于向量相似做推薦

? ? 如何構(gòu)建用戶特征表示?

? ? 1)用戶行為記錄(用戶評(píng)分)作為顯示特征

? ? 2)物自身的標(biāo)簽和用戶的打分綜合評(píng)判

? ? 3)向量式的興趣特征

? ? 4)通過(guò)交互方式獲取用戶興趣標(biāo)簽

? ? 5)用戶的人口統(tǒng)計(jì)學(xué)特征

? ? 如何構(gòu)建標(biāo)的物的特征表示?

? ? 1)標(biāo)的物包含標(biāo)簽信息

? ? 2)標(biāo)的物具備結(jié)構(gòu)化的信息

? ? 3)包含文本信息的標(biāo)的物的特征表示

? ? ? ? 3.1)利用TF-IDF將文本信息轉(zhuǎn)化為特征向量

? ? ? ? 3.2)利用LDA算法構(gòu)建文章(標(biāo)的物)的主題

? ? ? ? 3.3)利用doc2vec算法構(gòu)建文本相似度

? ? 4)圖片、音頻、或視頻信息


怎樣利用用戶信息和標(biāo)的物信息為用戶做推薦?

? ? 1)基于物品相似性的協(xié)同過(guò)濾

? ??


????2)基于用戶相似性的協(xié)同過(guò)濾

? ??


????3)基于標(biāo)的物相似性的聚類推薦

? ??

????4)基于向量相似的推薦

? ? 5)基于標(biāo)簽的反向倒排索引排序的推薦

5.應(yīng)用場(chǎng)景

? ? 5.1)個(gè)性化推薦

6.參考

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容