一、基于用戶統(tǒng)計學(xué)的推薦

基于用戶統(tǒng)計學(xué)的推薦機制（Demographic-based Recommendation）是一種最易于實現(xiàn)的推薦方法，它只是簡單的根據(jù)系統(tǒng)用戶的基本信息發(fā)現(xiàn)用戶的相關(guān)程度，然后將相似用戶喜愛的其他物品推薦給當前用戶，圖1給出了這種推薦的工作原理。

圖1.png

從圖中可以很清楚的看到，首先，系統(tǒng)對每個用戶都有一個用戶 Profile 的建模，其中包括用戶的基本信息，例如用戶的年齡，性別等等；然后，系統(tǒng)會根據(jù)用戶的 Profile 計算用戶的相似度，可以看到用戶 A 的 Profile 和用戶 C 一樣，那么系統(tǒng)會認為用戶 A 和 C 是相似用戶，在推薦引擎中，可以稱他們是“鄰居”；最后，基于“鄰居”用戶群的喜好推薦給當前用戶一些物品，圖中將用戶 A 喜歡的物品 A 推薦給用戶 C。

這種基于用戶統(tǒng)計學(xué)的推薦機制的好處在于：

1.因為不使用當前用戶對物品的喜好歷史數(shù)據(jù)，所以對于新用戶來講沒有“冷啟動（Cold Start）”的問題。
2.這個方法不依賴于物品本身的數(shù)據(jù)，所以這個方法在不同物品的領(lǐng)域都可以使用，它是領(lǐng)域獨立的（domain-independent）。

那么這個方法的缺點和問題是什么呢？這種基于用戶的基本信息對用戶進行分類的方法過于粗糙，尤其是對品味要求較高的領(lǐng)域，比如圖書，電影和音樂等領(lǐng)域，無法得到很好的推薦效果?？赡茉谝恍╇娮由虅?wù)的網(wǎng)站中，這個方法可以給出一些簡單的推薦。另外一個局限是，這個方法可能涉及到一些與信息發(fā)現(xiàn)問題本身無關(guān)卻比較敏感的信息，比如用戶的年齡等，這些用戶信息不是很好獲取。

二、基于內(nèi)容的推薦

基于內(nèi)容的推薦是在推薦引擎出現(xiàn)之初應(yīng)用最為廣泛的推薦機制，它的核心思想是根據(jù)推薦物品或內(nèi)容的元數(shù)據(jù)，發(fā)現(xiàn)物品或者內(nèi)容的相關(guān)性，然后基于用戶以往的喜好記錄，推薦給用戶相似的物品。圖2 給出了基于內(nèi)容推薦的基本原理。

圖2.png

圖2 中給出了基于內(nèi)容推薦的一個典型的例子，電影推薦系統(tǒng)，首先我們需要對電影的元數(shù)據(jù)有一個建模，這里只簡單的描述了一下電影的類型；然后通過電影的元數(shù)據(jù)發(fā)現(xiàn)電影間的相似度，因為類型都是“愛情，浪漫”電影 A 和 C 被認為是相似的電影（當然，只根據(jù)類型是不夠的，要得到更好的推薦，我們還可以考慮電影的導(dǎo)演，演員等等）；最后實現(xiàn)推薦，對于用戶 A，他喜歡看電影 A，那么系統(tǒng)就可以給他推薦類似的電影 C。

這種基于內(nèi)容的推薦機制的好處在于它能很好的建模用戶的口味，能提供更加精確的推薦。但它也存在以下幾個問題：

1.需要對物品進行分析和建模，推薦的質(zhì)量依賴于對物品模型的完整和全面程度。在現(xiàn)在的應(yīng)用中我們可以觀察到關(guān)鍵詞和標簽（Tag）被認為是描述物品元數(shù)據(jù)的一種簡單有效的方法。

2.物品相似度的分析僅僅依賴于物品本身的特征，這里沒有考慮人對物品的態(tài)度。

3.因為需要基于用戶以往的喜好歷史做出推薦，所以對于新用戶有“冷啟動”的問題。

雖然這個方法有很多不足和問題，但他還是成功的應(yīng)用在一些電影，音樂，圖書的社交站點，有些站點還請專業(yè)的人員對物品進行基因編碼，比如潘多拉，在一份報告中說道，在潘多拉的推薦引擎中，每首歌有超過 100 個元數(shù)據(jù)特征，包括歌曲的風(fēng)格，年份，演唱者等等。

三、基于協(xié)同過濾的推薦

隨著 Web2.0 的發(fā)展，Web 站點更加提倡用戶參與和用戶貢獻，因此基于協(xié)同過濾的推薦機制因運而生。它的原理很簡單，就是根據(jù)用戶對物品或者信息的偏好，發(fā)現(xiàn)物品或者內(nèi)容本身的相關(guān)性，或者是發(fā)現(xiàn)用戶的相關(guān)性，然后再基于這些關(guān)聯(lián)性進行推薦?；趨f(xié)同過濾的推薦可以分為三個子類：基于用戶的推薦（User-based Recommendation），基于項目的推薦（Item-based Recommendation）和基于模型的推薦（Model-based Recommendation）。下面我們一個一個詳細的介紹著三種協(xié)同過濾的推薦機制。

3.1 基于用戶的協(xié)同過濾推薦

基于用戶的協(xié)同過濾推薦的基本原理是，根據(jù)所有用戶對物品或者信息的偏好，發(fā)現(xiàn)與當前用戶口味和偏好相似的“鄰居”用戶群，在一般的應(yīng)用中是采用計算“K- 鄰居”的算法；然后，基于這 K 個鄰居的歷史偏好信息，為當前用戶進行推薦。下圖3 給出了原理圖。

圖3.png

上圖示意出基于用戶的協(xié)同過濾推薦機制的基本原理，假設(shè)用戶 A 喜歡物品 A，物品 C，用戶 B 喜歡物品 B，用戶 C 喜歡物品 A ，物品 C 和物品 D；從這些用戶的歷史喜好信息中，我們可以發(fā)現(xiàn)用戶 A 和用戶 C 的口味和偏好是比較類似的，同時用戶 C 還喜歡物品 D，那么我們可以推斷用戶 A 可能也喜歡物品 D，因此可以將物品 D 推薦給用戶 A。

基于用戶的協(xié)同過濾推薦機制和基于人口統(tǒng)計學(xué)的推薦機制都是計算用戶的相似度，并基于“鄰居”用戶群計算推薦，但它們所不同的是如何計算用戶的相似度，基于人口統(tǒng)計學(xué)的機制只考慮用戶本身的特征，而基于用戶的協(xié)同過濾機制可是在用戶的歷史偏好的數(shù)據(jù)上計算用戶的相似度，它的基本假設(shè)是，喜歡類似物品的用戶可能有相同或者相似的口味和偏好。

3.2 基于項目的協(xié)同過濾推薦

基于項目的協(xié)同過濾推薦的基本原理也是類似的，只是說它使用所有用戶對物品或者信息的偏好，發(fā)現(xiàn)物品和物品之間的相似度，然后根據(jù)用戶的歷史偏好信息，將類似的物品推薦給用戶，圖4 很好的詮釋了它的基本原理。

假設(shè)用戶 A 喜歡物品 A 和物品 C，用戶 B 喜歡物品 A，物品 B 和物品 C，用戶 C 喜歡物品 A，從這些用戶的歷史喜好可以分析出物品 A 和物品 C 時比較類似的，喜歡物品 A 的人都喜歡物品 C，基于這個數(shù)據(jù)可以推斷用戶 C 很有可能也喜歡物品 C，所以系統(tǒng)會將物品 C 推薦給用戶 C。

與上面講的類似，基于項目的協(xié)同過濾推薦和基于內(nèi)容的推薦其實都是基于物品相似度預(yù)測推薦，只是相似度計算的方法不一樣，前者是從用戶歷史的偏好推斷，而后者是基于物品本身的屬性特征信息。

image.png

同時協(xié)同過濾，在基于用戶和基于項目兩個策略中應(yīng)該如何選擇呢？其實基于項目的協(xié)同過濾推薦機制是 Amazon 在基于用戶的機制上改良的一種策略，因為在大部分的 Web 站點中，物品的個數(shù)是遠遠小于用戶的數(shù)量的，而且物品的個數(shù)和相似度相對比較穩(wěn)定，同時基于項目的機制比基于用戶的實時性更好一些。但也不是所有的場景都是這樣的情況，可以設(shè)想一下在一些新聞推薦系統(tǒng)中，也許物品，也就是新聞的個數(shù)可能大于用戶的個數(shù)，而且新聞的更新程度也有很快，所以它的形似度依然不穩(wěn)定。所以，其實可以看出，推薦策略的選擇其實和具體的應(yīng)用場景有很大的關(guān)系。

3.3 基于模型的協(xié)同過濾推薦

基于模型的協(xié)同過濾推薦就是基于樣本的用戶喜好信息，訓(xùn)練一個推薦模型，然后根據(jù)實時的用戶喜好的信息進行預(yù)測，計算推薦。
基于協(xié)同過濾的推薦機制是現(xiàn)今應(yīng)用最為廣泛的推薦機制，它有以下幾個顯著的優(yōu)點：

1.它不需要對物品或者用戶進行嚴格的建模，而且不要求物品的描述是機器可理解的，所以這種方法也是領(lǐng)域無關(guān)的。
2.這種方法計算出來的推薦是開放的，可以共用他人的經(jīng)驗，很好的支持用戶發(fā)現(xiàn)潛在的興趣偏好

而它也存在以下幾個問題：

1.方法的核心是基于歷史數(shù)據(jù)，所以對新物品和新用戶都有“冷啟動”的問題。
2.推薦的效果依賴于用戶歷史偏好數(shù)據(jù)的多少和準確性。
3.在大部分的實現(xiàn)中，用戶歷史偏好是用稀疏矩陣進行存儲的，而稀疏矩陣上的計算有些明顯的問題，包括可能少部分人的錯誤偏好會對推薦的準確度有很大的影響等等。
4.對于一些特殊品味的用戶不能給予很好的推薦。
5.由于以歷史數(shù)據(jù)為基礎(chǔ)，抓取和建模用戶的偏好后，很難修改或者根據(jù)用戶的使用演變，從而導(dǎo)致這個方法不夠靈活。

四、混合的推薦機制

在現(xiàn)行的 Web 站點上的推薦往往都不是單純只采用了某一種推薦的機制和策略，他們往往是將多個方法混合在一起，從而達到更好的推薦效果。關(guān)于如何組合各個推薦機制，這里講幾種比較流行的組合方法。

4.1 加權(quán)的混合（Weighted Hybridization）: 用線性公式（linear formula）將幾種不同的推薦按照一定權(quán)重組合起來，具體權(quán)重的值需要在測試數(shù)據(jù)集上反復(fù)實驗，從而達到最好的推薦效果。

4.2 切換的混合（Switching Hybridization）：前面也講到，其實對于不同的情況（數(shù)據(jù)量，系統(tǒng)運行狀況，用戶和物品的數(shù)目等），推薦策略可能有很大的不同，那么切換的混合方式，就是允許在不同的情況下，選擇最為合適的推薦機制計算推薦。

4.3 分區(qū)的混合（Mixed Hybridization）：采用多種推薦機制，并將不同的推薦結(jié)果分不同的區(qū)顯示給用戶。其實，Amazon，當當網(wǎng)等很多電子商務(wù)網(wǎng)站都是采用這樣的方式，用戶可以得到很全面的推薦，也更容易找到他們想要的東西。

4.4 分層的混合（Meta-Level Hybridization）: 采用多種推薦機制，并將一個推薦機制的結(jié)果作為另一個的輸入，從而綜合各個推薦機制的優(yōu)缺點，得到更加準確的推薦。

五、多源數(shù)據(jù)召回，保障推薦的全面性和精準性

將業(yè)務(wù)結(jié)合熱門、編輯精選、最新、本地化內(nèi)容等多類數(shù)據(jù)進行綜合，吸取不同數(shù)據(jù)源的特點，并將這些內(nèi)容放入到精選出的內(nèi)容候選集里，再次推薦增加曝光；或人工打標簽、手動篩選或通過某個簡單的程序抓取相關(guān)的內(nèi)容，將其歸為一類放入內(nèi)容池，再經(jīng)過一系列操作后進行推薦。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

推薦機制

推薦機制

一、基于用戶統(tǒng)計學(xué)的推薦

二、基于內(nèi)容的推薦

三、基于協(xié)同過濾的推薦

3.1 基于用戶的協(xié)同過濾推薦

3.2 基于項目的協(xié)同過濾推薦

3.3 基于模型的協(xié)同過濾推薦

四、混合的推薦機制

五、多源數(shù)據(jù)召回，保障推薦的全面性和精準性

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

推薦機制

一、基于用戶統(tǒng)計學(xué)的推薦

二、基于內(nèi)容的推薦

三、基于協(xié)同過濾的推薦

3.1 基于用戶的協(xié)同過濾推薦

3.2 基于項目的協(xié)同過濾推薦

3.3 基于模型的協(xié)同過濾推薦

四、混合的推薦機制

五、多源數(shù)據(jù)召回，保障推薦的全面性和精準性

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

一、基于用戶統(tǒng)計學(xué)的推薦

三、基于協(xié)同過濾的推薦

五、多源數(shù)據(jù)召回，保障推薦的全面性和精準性