一 推薦系統(tǒng)概述
? ? ? ?推薦系統(tǒng)目前幾乎無處不在,主流的app都基本應(yīng)用到了推薦系統(tǒng)。例如,旅游出行,攜程、去哪兒等都會給你推薦機票、酒店等等;點外賣,餓了么、美團等會給你推薦飯店;購物的時候,京東、淘寶、亞馬遜等會給你推薦“可能喜歡”的物品;看新聞,今日頭條、騰訊新聞等都會給你推送你感興趣的新聞....幾乎所有的app應(yīng)用或網(wǎng)站都存在推薦系統(tǒng)。
推薦系統(tǒng)目的:
? ?1.幫助用戶找到想要的商品(新聞,音樂等),發(fā)掘長尾(后文有簡介)
? ?2.降低信息過載,即現(xiàn)在是信息大爆炸的時代,物品越來越多,信息越來越多,而人的精力和時間是有限的,需要一個方式去更有效率地獲取信息,鏈接人與信息。
? 3.提高站點的點擊率和轉(zhuǎn)化率(電商,論壇,微博等)
針對用戶:
? ? ? ?在用戶明確的需求下:比如我們?nèi)ケ憷赀x購蘋果,我們可以憑經(jīng)驗去找到小攤位購買;在大型商場,我們可以通過導(dǎo)購牌分類,先找到出售生鮮水果的樓層,進而購買蘋果;在淘寶,京東等電商網(wǎng)站上,我們則是通過搜索引擎,來跳轉(zhuǎn)到相關(guān)的界面來選能夠
? ? ? ?在用戶沒有明確需求下:在信息過載的背景下,我們可以通過朋友介紹推薦,豆瓣參考評分等一系列的導(dǎo)游等等,這些統(tǒng)稱為推薦系統(tǒng)
? ? ? ?推薦系統(tǒng)不需要用戶明確的需求,而是通過用戶的歷史記錄,歷史行為來給用戶興趣的模型,從而主動給用戶推薦能夠滿足他們的興趣和需求的信息
針對商家:
? ? ?? 推薦系統(tǒng)可以更好的挖掘物品的長尾詞(傳統(tǒng)的80/20,即傳統(tǒng)的80%的銷售來源于20%的熱門品牌);主流商品往往代替了大部分用戶的需求,而長尾商品往往代表了一部分的個性需求。
? ? ? ?推薦系統(tǒng)的本質(zhì)是通過了一定的方式將用戶和物品聯(lián)系起來,而不同的推薦采用不同的方式,比如利用好友,用戶歷史興趣及其用戶的注冊興趣信息等!
二 推薦系統(tǒng)的應(yīng)用
? ? ? ?個性化的推薦系統(tǒng)需要依賴用戶的行為數(shù)據(jù),主要是通過分析大量的用戶的行為,給不同的用戶提供不同的個性化頁面展示,來提高網(wǎng)頁的點擊量和轉(zhuǎn)化率!
領(lǐng)域: 電子商務(wù),電影,音樂,社交,服務(wù),廣告等!
(1)電子商務(wù) —— Amazon
個性化推薦列表;相關(guān)推薦列表(打包銷售)
(2)電影和視頻網(wǎng)站 —— Netflix
(3)個性化音樂網(wǎng)絡(luò)電臺 —— Pandora 豆瓣
注意音樂推薦具有很多特殊點
(4)社交網(wǎng)絡(luò) —— Facebook
Facebook有個推薦API
(5)個性化閱讀 —— GoogleReader Zite
(6)基于位置的服務(wù)
位置是一種很重要的上下文信息
(7)個性化郵件 —— Tapestry
(8)個性化廣告 —— Facebook?
三 評測指標(biāo)
1 用戶滿意度 ?最重要指標(biāo)?
2 預(yù)測準(zhǔn)確度 ? ?(評分預(yù)測;TopN推薦:準(zhǔn)確率,召回率,度量等)
3 覆蓋率 :推薦系統(tǒng)對于物品的長尾的挖掘能力(推薦效應(yīng)初衷就是為了消除馬太效應(yīng),即強者俞強,弱者遇弱,可以理解為熱門商品越熱,冷門商品越冷)
判斷是否具有馬太效,可以利用基尼系數(shù)判斷(即G2>G1;評測推薦系統(tǒng)是否具有馬太效應(yīng)的簡單方法就是使用基尼系數(shù),如果G1是從初始用戶行為中計算出的物品流行度的基尼系數(shù),G2是從推薦列表中計算出的物品流行度的基尼系數(shù),那么當(dāng)G2>G1時,就說明推薦算法具有馬太效應(yīng))
4?多樣性 ?不在一棵樹上吊死
5新穎性 ?是指給用戶推薦那些他們之前沒有聽說過的物品
6 驚喜性
?注意與新穎性進行區(qū)別,尚沒有公認的定義指標(biāo),只能通過問卷調(diào)查獲取
7 信任性
提高推薦系統(tǒng)的信任度主要在于需要增加推薦系統(tǒng)的透明度,即提供對推薦系統(tǒng)的解釋,讓用戶明白其運行機制
考慮用戶的社交網(wǎng)絡(luò)信息,利用好友信息進行推薦,利用好友進行解釋等
8 實時性
(1)推薦系統(tǒng)需要實時地更新推薦列表來滿足用戶新的行為變化 —— 通過推薦列表的變化速率來評測
(2)推薦系統(tǒng)需要能夠?qū)⑿录尤胂到y(tǒng)的物品推薦給用戶 —— 利用用戶推薦列表中多大比例的物品是當(dāng)天新加入的來評測
9 健壯性
(1)健壯性衡量一個推薦系統(tǒng)抗擊作弊(人為攻擊)的能力
(2)評測主要利用模擬攻擊
(3)可以通過以下手段提高系統(tǒng)健壯性:
設(shè)計推薦系統(tǒng)時盡量使用代價比較高的用戶行為,例如將瀏覽行為換為購買行為
在使用數(shù)據(jù)前,進行攻擊測試,從而對數(shù)據(jù)進行清理
10 商業(yè)目標(biāo)
與網(wǎng)站的盈利模式相關(guān)
11 總結(jié)
(1)對于離線優(yōu)化來說,一般在給定覆蓋率、多樣性、新穎性等約束條件下,優(yōu)化預(yù)測準(zhǔn)確度。
(2)為了充分了解一個算法的性能,應(yīng)該在多個維度上進行評測:
用戶維度:主要包括用戶的人口統(tǒng)計信息、活躍度以及是不是新用戶等
物品維度:包括物品的屬性信息、流行度、平均分以及時不時新加入的物品等
時間維度:包括季節(jié)、是工作日還是周末,是白天還是晚上等
歡迎各位大神交流,交流QQ群:688933850