基于內(nèi)容的推薦,它是建立在項(xiàng)目的內(nèi)容信息上作出推薦的,而不需要依據(jù)用戶(hù)對(duì)項(xiàng)目的評(píng)價(jià)意見(jiàn),更多地需要用機(jī)器學(xué)習(xí)的方法從關(guān)于內(nèi)容的特征描述的事例中得到用戶(hù)的興趣資料,再考察用戶(hù)資料與待預(yù)測(cè)項(xiàng)目的相匹配程度。
基于內(nèi)容的推薦系統(tǒng)一個(gè)難點(diǎn)在于如何找到兩個(gè)項(xiàng)目之間的相似點(diǎn),要找項(xiàng)目之間的相似點(diǎn),就必須要對(duì)項(xiàng)目有比較明確的特征描述方式。
對(duì)于推薦項(xiàng)目目前沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)進(jìn)行描述,主要有基于內(nèi)容的方法和基于分類(lèi)的方法兩大類(lèi)方法。
針對(duì)文檔類(lèi)對(duì)象的這兩個(gè)表示方法給予分析:
? 基于內(nèi)容的方法是從對(duì)象本身抽取信息來(lái)表示對(duì)象,使用得最廣泛的方法是用加權(quán)關(guān)鍵詞矢量,該方法通過(guò)對(duì)一組文檔的統(tǒng)計(jì)分析得出文檔的特征向量;比如你看了哈利波特I,基于內(nèi)容的推薦算法發(fā)現(xiàn)哈利波特II-VI,與你以前觀看的在內(nèi)容上面(共有很多關(guān)鍵詞)有很大關(guān)聯(lián)性,就把后者推薦給你,這種方法可以避免Item的冷啟動(dòng)問(wèn)題。
? 基于分類(lèi)的方法是把推薦對(duì)象放入不同類(lèi)別中,這樣可以把同類(lèi)文檔推薦給對(duì)該類(lèi)文檔感興趣的用戶(hù)了。如果用戶(hù)之前閱讀過(guò)科技類(lèi)的文章,或者用戶(hù)的個(gè)人資料顯示科技相關(guān),而剛好有一篇文章也是科技類(lèi)的,那么就算可以把這篇文章推薦給用戶(hù)。
大綱如下:
第一部分:簡(jiǎn)單了解個(gè)性化推薦系統(tǒng);
第二部分:協(xié)同過(guò)濾推薦之基于用戶(hù)的協(xié)同過(guò)濾推薦(以麥包包為例);