話說(shuō)推薦系統(tǒng)

一、推薦系統(tǒng)價(jià)值分析

推薦系統(tǒng)解決的是人與物品/信息的高效匹配問(wèn)題。人與物品/信息之間的關(guān)系,主要受用戶意圖和物品數(shù)量?jī)蓚€(gè)維度影響,而解決方案經(jīng)歷了三個(gè)階段:第一階段是在物品/信息數(shù)量較少時(shí),人直接通過(guò)逐個(gè)查看的方式即可解決;第二階段是物品/信息數(shù)量較多,為方便查找,提供物品/信息分類以及搜索功能;第三階段的推薦系統(tǒng)是為解決物品/信息數(shù)量多且用戶意圖模糊場(chǎng)景。

從推薦系統(tǒng)解決的主要問(wèn)題場(chǎng)景看,推薦系統(tǒng)適用的用戶為用戶B和用戶C。首先介紹下用戶A、B、C的特征:

1、用戶A? :用戶A對(duì)自己需要什么非常了解、屬于目標(biāo)清晰型 ,像男生買東西很多都屬于這類用戶。很多男生在打開購(gòu)物app之前,已經(jīng)明確要買什么,具體買哪家的,看品質(zhì)和價(jià)格。

2、用戶B:用戶B對(duì)自己需求很模糊,比如像女生買裙子,買長(zhǎng)款的、還是短款的?是買淑女風(fēng)的、還是買休閑風(fēng)的,傻傻搞不清楚。也許最后逛著逛著買了條短褲。

3、用戶C:用戶C在打開購(gòu)物app前,其實(shí)沒(méi)有購(gòu)物需求,只是因?yàn)楝F(xiàn)在比較閑,想逛逛有什么好看的、時(shí)尚的、新穎的東東。

從用戶A、B、C的購(gòu)物特征看,推薦系統(tǒng)能發(fā)揮作用并能影響其購(gòu)物路徑的是用戶B和用戶C。

推薦系統(tǒng)適用場(chǎng)景以及用戶類型

根據(jù)以上分析,推薦系統(tǒng)的價(jià)值總結(jié)如下:

1、用戶價(jià)值:推薦系統(tǒng)主要服務(wù)于具有B和C特質(zhì)的用戶,在用戶意圖不清晰時(shí)將合適物品送到用戶前、提升用戶的體驗(yàn),或者是在用戶閑逛時(shí),將適合他的物品呈現(xiàn)到他面前,提升用戶的驚喜度。

2、公司價(jià)值:

1)由于每個(gè)網(wǎng)站或app的展臺(tái)或者曝光點(diǎn)資源都有限,盡可能高效利用有限空間、為每個(gè)用戶呈現(xiàn)其所需的物品,提升物品轉(zhuǎn)化率和成交率;

2)盡可能提供用戶感興趣的物品,讓用戶愿意將時(shí)間消費(fèi)在我們的產(chǎn)品上,只要用戶愿意停留在我們產(chǎn)品上,物品的商業(yè)轉(zhuǎn)化機(jī)會(huì)就越大;

3)挖掘用戶的潛在興趣,協(xié)助用戶消費(fèi)升級(jí)(如網(wǎng)購(gòu))或者知識(shí)結(jié)構(gòu)擴(kuò)展(如資訊或者電子書籍類)。

二、推薦系統(tǒng)的端到端流程架構(gòu)

推薦系統(tǒng)的端到端流程架構(gòu)

該圖展示了推薦系統(tǒng)所包含的各個(gè)組件,以下章節(jié)對(duì)各關(guān)鍵組件進(jìn)行簡(jiǎn)單介紹。

三、數(shù)據(jù)采集

對(duì)于推薦系統(tǒng)來(lái)說(shuō),數(shù)據(jù)問(wèn)題是首要問(wèn)題,是決定是否具有搭建推薦系統(tǒng)的基石。數(shù)據(jù)不僅僅是提供給用戶的商品數(shù)據(jù),還包括用戶進(jìn)入app后的操作數(shù)據(jù),對(duì)于用戶的操作數(shù)據(jù)、需要做好埋點(diǎn),采集有效的數(shù)據(jù)。

為啥這里我強(qiáng)調(diào)有效數(shù)據(jù)呢?舉個(gè)例子,如果系統(tǒng)的各個(gè)階段都有數(shù)據(jù)埋點(diǎn),但是各埋各的、沒(méi)有統(tǒng)一標(biāo)準(zhǔn),可能會(huì)導(dǎo)致采集回來(lái)的數(shù)據(jù)處理效率低甚至無(wú)法處理。所以這里的數(shù)據(jù)問(wèn)題不僅僅指是否有數(shù)據(jù),而且需要格式統(tǒng)一的結(jié)構(gòu)化數(shù)據(jù),埋點(diǎn)嚴(yán)格遵循數(shù)據(jù)格式與長(zhǎng)度規(guī)范。在之前的工作中,遇到數(shù)據(jù)方面的問(wèn)題主要表現(xiàn)在三個(gè)方面:

1、埋點(diǎn)缺失,數(shù)據(jù)無(wú)法收集或者收集不全

2、數(shù)據(jù)沒(méi)有進(jìn)行科學(xué)的存儲(chǔ),導(dǎo)致無(wú)法使用

3、數(shù)據(jù)存儲(chǔ)無(wú)統(tǒng)一規(guī)范,采集的數(shù)據(jù)后處理效率低、甚至無(wú)法處理


四、特征提取

以電商場(chǎng)景為例,特征主要分為三個(gè)方面:

商品維度的特征。主要包括:商品上架時(shí)所帶的一些基本屬性,如商品的類別、品牌、價(jià)格,商品的物料、厚度,商品適合的季節(jié),商品面向的客戶性別、年齡等;用戶行為隱性體現(xiàn)的特征,如:點(diǎn)擊率、收藏率、加購(gòu)物車、下單等,這些數(shù)據(jù)能體現(xiàn)商品的熱度、受歡迎程度等;用戶行為隱性反應(yīng)各商品的質(zhì)量,如評(píng)論信息。綜合以上信息,一方面體現(xiàn)了商品本身的基本屬性,另外還能從使用者角度體現(xiàn)了商品的真實(shí)質(zhì)量。

用戶維度的特征。電商場(chǎng)景中用戶年齡、性別、收入水平等都是關(guān)鍵特征。男性和女性所偏重的物品之間存在較大差異;不同年齡段的用戶對(duì)物品的偏好也存在較大差異;不同消費(fèi)水平的用戶對(duì)物品的偏好也有很大差異。

應(yīng)用場(chǎng)景和應(yīng)用時(shí)機(jī)的特征。在國(guó)內(nèi)大多數(shù)地區(qū),衣服和鞋子是季節(jié)性商品,用戶對(duì)當(dāng)季商品的偏好會(huì)更大;衣服和鞋子也是具有區(qū)域性的商品,比如像杭州、蘇州等地區(qū),今年特別流行唐裝;衣服和鞋子還會(huì)和場(chǎng)合有關(guān)系,比如像聚會(huì)、上班以及去海邊游玩,這三種場(chǎng)合對(duì)衣服的訴求肯定會(huì)有所差異。

五、推薦算法

推薦算法

1、基于物品屬性相似的推薦

這種推薦策略的邏輯很簡(jiǎn)單,即“物以類聚”,依賴物品本身屬性地相似度來(lái)構(gòu)建推薦關(guān)系。圖中的各種分類就是一種相似性的體現(xiàn)。如女裝-》連衣裙這種分類,其實(shí)就是將在“連衣裙”這個(gè)維度上相似性非常高的物品聚合在一起。

像實(shí)際使用中以下幾種情況會(huì)導(dǎo)致該推薦方式失效。

1)用戶瀏覽的當(dāng)前物品本身就不是用戶的偏好,而是由于其他外部信息導(dǎo)致的,比如我出于測(cè)試目的點(diǎn)擊了某個(gè)物品或者手滑選擇了某個(gè)物品,那這類信息對(duì)于系統(tǒng)來(lái)說(shuō)是一種干擾信息,如果再基于該信息進(jìn)行推薦就存在問(wèn)題。

2)當(dāng)前所瀏覽或者收藏的物品或信息是用戶目標(biāo)物品,但一直推薦和已選物品/信息相似的,對(duì)用戶來(lái)說(shuō)是一種信息冗余,尤其是在用戶已經(jīng)購(gòu)買了該物品的情況下。比如我7月份買了華為p30手機(jī),基于該推薦方法就會(huì)一直再給我推薦手機(jī)甚至是華為p系列手機(jī),而像手機(jī)這種非易耗品,基本上短期內(nèi)不會(huì)更換,那這種推薦顯然是無(wú)效的。

所以,一方面由于用戶行為的不可控,完全基于物品/內(nèi)容本身屬性相似的推薦,風(fēng)險(xiǎn)較高、無(wú)法直接廣泛使用。另一方面由于當(dāng)前物品/信息在某些場(chǎng)景下已解決用戶問(wèn)題,再一直推薦相似物品,不但不會(huì)帶來(lái)轉(zhuǎn)化,甚至?xí)鹩脩舴锤小?/p>

但存在即合理,那么究竟基于內(nèi)容屬性相似的推薦在什么場(chǎng)景下使用比較合適呢?在冷啟動(dòng)時(shí),用戶首次登錄未留下用戶信息或者才瀏覽了為數(shù)不多的幾個(gè)產(chǎn)品時(shí),此時(shí)用戶信息匱乏,基于物品本身的屬性給用戶做推薦也許能帶來(lái)不錯(cuò)的效果。

2、基于用戶畫像的推薦

基于物品本身屬性的推薦,其實(shí)個(gè)性化程度很低,畢竟推薦候選集只跟物品本身有關(guān),與用戶關(guān)系不大,所以也沒(méi)什么個(gè)性化可言。而基于用戶畫像(或基于用戶標(biāo)簽)的推薦,更大程度上依賴于用戶屬性來(lái)推薦,這就體現(xiàn)了用戶的偏好信息,推薦候選集和用戶偏好關(guān)系較密切。

那么用戶畫像/興趣標(biāo)簽如何構(gòu)建呢?這是一個(gè)比較復(fù)雜的課題。一種方法是用戶自己告訴你,比如很多app在首次登錄時(shí),讓用戶選擇所喜歡的標(biāo)簽,其實(shí)就是讓用戶自己告訴你他的喜好,也就是讓用戶自己給自己打標(biāo)簽;第二種方法就是系統(tǒng)分析用戶累積的行為數(shù)據(jù),通過(guò)行為數(shù)據(jù)生成用戶的興趣標(biāo)簽。理論上看,這似乎是一種比較可行的做法,畢竟如果真把用戶的愛(ài)好都分析清楚了、給用戶做的推薦肯定是個(gè)性化的。

第一種方法是用戶自己給自己的畫像,這種方法在產(chǎn)品或者用戶冷啟動(dòng)時(shí)比較有效,但用戶提供的信息是當(dāng)時(shí)當(dāng)下的畫像,是一種靜態(tài)畫像,但用戶畫像其實(shí)是會(huì)隨時(shí)間變化的,如果讓用戶興趣變化了主動(dòng)刷新畫像顯然不現(xiàn)實(shí)。

第二種方法是系統(tǒng)基于用戶歷史行為分析用戶畫像,該方法實(shí)際使用中在以下場(chǎng)景會(huì)失效:

1)用戶在該平臺(tái)沒(méi)有行為數(shù)據(jù),那采用系統(tǒng)分析的方法此時(shí)無(wú)法構(gòu)建用戶畫像,除非讓用戶自己告訴你他的喜好。

2)并不是所有用戶行為都能夠用來(lái)表征其興趣偏好,也就是說(shuō)用戶在該平臺(tái)上留下的行為有可能存在一些干擾信息,這種情況下生成的用戶畫像可能是有偏差的。

3)用戶的興趣愛(ài)好并不是一直靜止不變的,是會(huì)隨時(shí)間的遷移而改變的,比如我今天刷小視頻喜歡看美食類的,可能下周我就會(huì)喜歡美妝類的。

也就是說(shuō),實(shí)際上需要通過(guò)用戶行為掌握用戶的真實(shí)興趣、興趣程度以及興趣遷移不是一件容易的事兒,更何況用戶實(shí)際選擇還會(huì)受很多意外因素影響,比如,我最近首次購(gòu)買打印機(jī),這在我購(gòu)物信息軌跡中是沒(méi)有的,那單純地通過(guò)我歷史行為構(gòu)建出的興趣期望能預(yù)測(cè)到我此次非常規(guī)的購(gòu)買行為顯然就不可行了。

3、協(xié)同過(guò)濾推薦算法

協(xié)同過(guò)濾推薦是推薦領(lǐng)域典型算法,協(xié)同過(guò)濾不研究物品本身屬性,甚至也不關(guān)注用戶的標(biāo)簽。那么它的機(jī)制又是怎樣的呢?

協(xié)同過(guò)濾推薦算法主要分兩大類:一類是基于用戶的協(xié)同過(guò)濾推薦,另外一類是基于物品的協(xié)同過(guò)濾推薦。

基于用戶的協(xié)同過(guò)濾推薦,簡(jiǎn)單地說(shuō),為用戶A推薦物品,那么需要參考A周邊的用戶都購(gòu)買了什么物品,而A暫時(shí)還未購(gòu)買甚至不知道的物品。從上面的描述可以知道,這個(gè)方法主要要做兩件事:1)如何限定“周邊”的范圍,即怎么判定哪些用戶和用戶A興趣相似,根據(jù)A用戶和其他用戶的歷史行為計(jì)算他們之間的相似度。2)在圈定了用戶A的鄰居后,篩選出A用戶鄰居們喜歡的但A還沒(méi)購(gòu)買甚至還未聽(tīng)說(shuō)過(guò)的物品推薦給A。該方法的困難在于:

1)像電商或者視頻網(wǎng)站用戶,動(dòng)不動(dòng)就上億的用戶量,兩兩計(jì)算相似度計(jì)算量太大,時(shí)間復(fù)雜度太高。但實(shí)際上這么多用戶中,兩兩之間有相似性的用戶較少,很多用戶兩兩之間并沒(méi)有相似性,也就是說(shuō)很多的相似計(jì)算是無(wú)用的,即相似度矩陣是稀疏矩陣。對(duì)于這種稀疏矩陣問(wèn)題,可以建立一個(gè)物品到用戶的倒排表,即對(duì)于每個(gè)物品建立對(duì)其有過(guò)行為的用戶表。

2)選擇多少個(gè)和A用戶相似的鄰居,對(duì)推薦效果影響較大。需要根據(jù)具體項(xiàng)目,比較不同鄰居數(shù)時(shí)推薦效果從而選出該值。

3)物品的流行度或熱度對(duì)推薦結(jié)果可能會(huì)存在影響。在實(shí)際評(píng)估算法效果時(shí),需要考慮物品的熱度,將熱度過(guò)高的產(chǎn)品扣除后再評(píng)估算法效果會(huì)更加靠譜。

基于用戶的協(xié)同過(guò)濾算法在一些網(wǎng)站中得到應(yīng)用,但該算法有一些比較難解決的問(wèn)題,除了上面提到的問(wèn)題,另外,基于用戶的協(xié)同過(guò)濾算法比較難對(duì)用戶做出解釋,推薦過(guò)程難以解釋清楚的推薦,可信度會(huì)降低。

而基于物品的協(xié)同過(guò)濾算法就能很好對(duì)推薦結(jié)果做出解釋,比如你經(jīng)常能看到“購(gòu)買了該商品的用戶還購(gòu)買了xxx”。那什么是基于物品的協(xié)同過(guò)濾算法呢?該算法不利用物品的內(nèi)容屬性計(jì)算物品間的相似度,主要通過(guò)分析用戶的行為記錄計(jì)算物品的相似度,即該算法認(rèn)為物品A和物品B具有很大相似度是因?yàn)橄矚gA的用戶大都也喜歡物品B。


基于物品的協(xié)同過(guò)濾


綜上,相對(duì)于基于用戶畫像的推薦,協(xié)同過(guò)濾推薦有一定幾率可以為用戶發(fā)現(xiàn)新物品,即并不嚴(yán)格依賴用戶的興趣。比如,家長(zhǎng)給孩子買輔導(dǎo)資料,去年買一年級(jí)的,今年買二年級(jí)的,明年買三年級(jí)的,這三年買的東西是一個(gè)循序漸進(jìn)的,并且是層層遞進(jìn)的,而不是同一個(gè)東西。那么如果僅基于用戶畫像的推薦,通過(guò)對(duì)該用戶歷史軌跡的研究,發(fā)現(xiàn)他當(dāng)前買的都是一年級(jí)的資料,而沒(méi)有二年級(jí)的資料特征。也就是說(shuō)該用戶的興趣偏好偏向于一年級(jí)資料,根據(jù)興趣標(biāo)簽,其實(shí)是很難推薦這種遞進(jìn)相關(guān)的信息。但是,如果基于協(xié)同用戶的推薦,就有能挖掘到這種遞進(jìn)關(guān)系。比如其他用戶的購(gòu)買軌跡都是一年級(jí)資料->二年級(jí)資料->三年級(jí)資料這種軌跡,這意味著三者之間存在潛在的邏輯關(guān)系,基于用戶協(xié)同,在了解到用戶已有一年級(jí)資料的基礎(chǔ)上,可為該用戶推薦二年級(jí)、三年級(jí)的資料。

在實(shí)際使用中,基于協(xié)同過(guò)濾的推薦方法在以下場(chǎng)景下會(huì)失效:

1)推薦質(zhì)量取決于歷史數(shù)據(jù),系統(tǒng)剛開始或者對(duì)于新用戶,推薦質(zhì)量會(huì)比較差,即有冷啟動(dòng)問(wèn)題;

2)可擴(kuò)展性問(wèn)題,比如新聞資訊領(lǐng)域,由于新聞的更新非???,可能每時(shí)每刻都有新內(nèi)容出現(xiàn),基于物品的協(xié)同過(guò)濾算法顯然就有些力不從心了,因?yàn)榛谖锲返膮f(xié)同過(guò)濾算法需要維護(hù)一張物品相似度的表,在物品更新很快的情況下,這張表也需要快速更新,這在技術(shù)上很難實(shí)現(xiàn)。絕大多數(shù)的表都是一天更新一次,顯然在新聞?lì)I(lǐng)域是不可接受的。

3)數(shù)據(jù)稀疏,比如淘寶用戶都是上億的,兩兩計(jì)算相似度,想想這個(gè)相似度矩陣就很大。但很多用戶之間其實(shí)沒(méi)有相似性,即這個(gè)相似度矩陣是個(gè)稀疏矩陣。

4、基于關(guān)聯(lián)規(guī)則的推薦

基于關(guān)聯(lián)規(guī)則的推薦算法是以關(guān)聯(lián)規(guī)則為基礎(chǔ),從大量用戶歷史數(shù)據(jù)中統(tǒng)計(jì)強(qiáng)關(guān)聯(lián)規(guī)則,是一種無(wú)監(jiān)督的機(jī)器學(xué)習(xí)算法。在關(guān)聯(lián)規(guī)則算法中,關(guān)鍵是如何找到最大頻繁項(xiàng)。業(yè)界主要做法有Apriori算法、FP-Growth樹和eclat。關(guān)聯(lián)規(guī)則的經(jīng)典應(yīng)用是購(gòu)物籃分析,比如經(jīng)典的啤酒和尿布的故事。早期的亞馬遜、京東、淘寶等購(gòu)物推薦場(chǎng)景中經(jīng)常使用,相對(duì)簡(jiǎn)單粗暴。該算法的優(yōu)點(diǎn)是能從大量行為數(shù)據(jù)中挖掘出無(wú)法直接感受到的規(guī)則,往往能給出意想不到的結(jié)果。但在實(shí)際使用中可能存在以下問(wèn)題:

1)難以進(jìn)行模型評(píng)估,一般通過(guò)行業(yè)經(jīng)驗(yàn)判斷結(jié)果是否合理。

2)關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)計(jì)算復(fù)雜度較高,是算法的瓶頸。

3)物品名稱的同義性問(wèn)題也是關(guān)聯(lián)規(guī)則的一個(gè)難點(diǎn)。

5、基于機(jī)器學(xué)習(xí)算法的推薦

推薦問(wèn)題,直觀上就是當(dāng)前有個(gè)物品x和用戶A,預(yù)估a物品是否適合推薦給用戶A。該問(wèn)題其實(shí)可以看作二分類問(wèn)題,分類結(jié)果要么適合、要么不適合。即在有足夠的用戶數(shù)據(jù)情況下,通過(guò)用戶歷史行為數(shù)據(jù)構(gòu)建預(yù)測(cè)模型y=f(x) ,預(yù)測(cè)用戶是否會(huì)對(duì)某物品感興趣。對(duì)于分類問(wèn)題,機(jī)器學(xué)習(xí)中有各種算法,比如LR 、SVM、隨機(jī)森林、 GBDT、貝葉斯、神經(jīng)網(wǎng)絡(luò)等等。機(jī)器學(xué)習(xí)算法的相關(guān)內(nèi)容連載中再詳細(xì)展開。

6、基于組合算法的推薦

由于各種推薦方法都有優(yōu)缺點(diǎn),所以在實(shí)際使用過(guò)程中,經(jīng)常采用組合推薦。研究和應(yīng)用最多的是基于物品屬性推薦和協(xié)同過(guò)濾推薦的組合。最簡(jiǎn)單的做法就是分別用基于內(nèi)容的方法和協(xié)同過(guò)濾推薦方法去產(chǎn)生一個(gè)推薦結(jié)果,然后用某方法組合其結(jié)果。盡管從理論上有很多種組合方法,但在某一具體問(wèn)題中并不見(jiàn)得都有效,組合推薦一個(gè)最重要原則就是組合后能規(guī)避或彌補(bǔ)各自推薦技術(shù)的弱點(diǎn)。

在組合方式上,有研究人員提出了七種組合思路:

1)加權(quán):加權(quán)多種推薦技術(shù)結(jié)果。

2)變換:根據(jù)問(wèn)題背景和實(shí)際情況要求變換采用不同的推薦技術(shù)。

3)混合:同時(shí)采用多種推薦技術(shù)并給出多種推薦結(jié)果為用戶提供參考。

4)特征組合:組合來(lái)自不同推薦數(shù)據(jù)源的特征,提供給另一種推薦算法用。

5)層疊:先用一種推薦技術(shù)產(chǎn)生一種粗糙的推薦結(jié)果,然后在此推薦結(jié)果的基礎(chǔ)上采用第二種推薦技術(shù)進(jìn)一步作出更精確的推薦。

6)特征擴(kuò)充:將一種推薦技術(shù)產(chǎn)生的附加特征信息,嵌入到另一種推薦技術(shù)的特征輸入中。

7)元級(jí)別:用一種推薦方法產(chǎn)生的模型作為另一種推薦方法的輸入。

六、冷啟動(dòng)問(wèn)題


冷啟動(dòng)機(jī)制


冷啟動(dòng)問(wèn)題主要分三類:

1、用戶冷啟動(dòng):用戶冷啟動(dòng)主要解決如何給新用戶做個(gè)性化推薦的問(wèn)題。當(dāng)新用戶到來(lái)時(shí),系統(tǒng)未收集到用戶的操作歷史,所以無(wú)法根據(jù)用戶的歷史行為對(duì)用戶進(jìn)行推薦。

2、物品冷啟動(dòng):物品冷啟動(dòng)主要解決如何將新加入的物品推薦給感興趣的人。

3、系統(tǒng)冷啟動(dòng):系統(tǒng)冷啟動(dòng)主要指的時(shí)如何在新開發(fā)的網(wǎng)站或者app上就給用戶提供個(gè)性化推薦。

對(duì)于如上幾種冷啟動(dòng)問(wèn)題有不同的解決方案,一般有如下解決方案:

1、熱度推薦,其實(shí)這是一種非個(gè)性化的推薦。給新用戶推薦熱門物品,待用戶在平臺(tái)上留下足跡后再切換為個(gè)性化推薦。

2、要求用戶在注冊(cè)時(shí)提供信息,注冊(cè)信息一般分3類:

1)人口統(tǒng)計(jì)學(xué)信息:包括用戶的年齡、性別、職業(yè)、民族、學(xué)歷、出生地、所在地等等

2)用戶興趣:讓用戶提供一些興趣標(biāo)簽

3)從其他網(wǎng)站導(dǎo)入用戶站外的行為信息,常用的做法是讓用戶通過(guò)社交賬號(hào)登錄,就可以在社交賬號(hào)獲取用戶的行為和社交數(shù)據(jù),以此數(shù)據(jù)分析用戶的興趣。

基于注冊(cè)信息的個(gè)性化推薦流程基本如下:

1)獲取用戶的注冊(cè)信息

2)根據(jù)用戶的注冊(cè)信息分析用戶,然后按照分析的用戶標(biāo)簽對(duì)用戶進(jìn)行分類

3)給用戶推薦他所屬分類中用戶喜歡的物品

3、用戶登錄時(shí)要求用戶反饋對(duì)物品的喜好

在新用戶第一次訪問(wèn)系統(tǒng)時(shí),不立即給用戶展示推薦結(jié)果,而是給用戶提供一些物品試探用戶的興趣,讓用戶反饋對(duì)這些物品的興趣,然后根據(jù)用戶反饋提供個(gè)性化推薦。該方法的核心是選擇什么樣的物品試探用戶的興趣,一般能夠用來(lái)啟動(dòng)用戶興趣的物品具有以下特點(diǎn):

1)比較熱門:如果要用戶反饋對(duì)物品的興趣,前提是用戶對(duì)該物品很熟悉。如果選擇一個(gè)冷門物品,很多用戶都不知道這個(gè)物品是什么,顯然這種試探就沒(méi)有意義。

2)具有代表性和區(qū)分度:?jiǎn)?dòng)用戶興趣的物品不能是大眾化或者老少皆宜的,因?yàn)檫@種物品試探不出用戶的興趣。

3)啟動(dòng)物品需要有多樣性:用戶的興趣可能非常多,需要提供具有多樣性的物品挖掘用戶盡可能多的興趣,通過(guò)多維興趣特征構(gòu)建用戶興趣模型。

4、引入專家經(jīng)驗(yàn)

為了在推薦系統(tǒng)建立時(shí)就能讓用戶得到比較好的體驗(yàn),有些系統(tǒng)會(huì)引入專家經(jīng)驗(yàn)。比較經(jīng)典的是pandora,這是一款個(gè)性化電臺(tái)應(yīng)用,非常好地建立音樂(lè)間相似性技術(shù)上比較有挑戰(zhàn)。音樂(lè)是多媒體資源,如果從分析音頻信息入手去計(jì)算歌曲之間地相似性,技術(shù)難度比較大。但如果僅僅是看專輯、歌手等信息去建立音樂(lè)地相似性,似乎又沒(méi)有什么意義。pandora為了解決這個(gè)問(wèn)題,引入音樂(lè)專家,從400多個(gè)維度對(duì)每首歌曲進(jìn)行標(biāo)注,構(gòu)建了每首歌地音樂(lè)基因。標(biāo)注完之后,每首歌都是一個(gè)400多維地向量,計(jì)算向量之間地相似度從而就可以了解歌曲之間地相似度。

七、展臺(tái)

在電商場(chǎng)景中,會(huì)在用戶路徑的很多節(jié)點(diǎn)中進(jìn)行推薦,這些路徑可以歸類為:購(gòu)買前、購(gòu)買中和購(gòu)買后。

推薦系統(tǒng)無(wú)處不在

以淘寶為例,從用戶打開app,在用戶視野所到之處推進(jìn)無(wú)處不在,梳理了下用戶購(gòu)物的可能路徑,如上圖所示,圖中綠底色標(biāo)示的用戶路徑中都有推薦的影子。進(jìn)入app首頁(yè),在首頁(yè)的banner中會(huì)看到推薦商品,不論是進(jìn)入各類別商品、還是通過(guò)搜索框搜索都會(huì)看到推薦商品;用戶點(diǎn)開某一個(gè)商品,進(jìn)入詳情頁(yè),在瀏覽詳情頁(yè)的過(guò)程中,會(huì)看到“店鋪推薦”、“穿搭推薦”、“看了又看”等;用戶將該商品收藏,在收藏夾中,用戶會(huì)看到“相似”;用戶將該商品加入購(gòu)物車,在購(gòu)物車后會(huì)看到“你可能還喜歡”;用戶下單后,會(huì)看到“你可能還喜歡”;此次購(gòu)物結(jié)束后,用戶打開我的訂單,在定單的“待付款”、“待發(fā)貨”、“待收獲”等頁(yè)面下,會(huì)看到“你可能還喜歡”。


以上分析了推薦系統(tǒng)的價(jià)值以及基本內(nèi)容,分析的還不夠深入,待各位大俠指正,后續(xù)進(jìn)一步完善。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容