很久了一直覺得個(gè)性化推薦這個(gè)東西是很高級(jí)且神秘的,直到這次為主題商店引入個(gè)性化算法,才算是有緣以管窺天,基本了解了個(gè)性化推薦的相關(guān)知識(shí)。
一、個(gè)性化推薦的意義與分類
故名思議,個(gè)性化推薦,自然是為了提高內(nèi)容產(chǎn)品的消費(fèi)的轉(zhuǎn)化而進(jìn)行的基于用于自身特點(diǎn)的推薦,希望經(jīng)過推薦提高內(nèi)容的消費(fèi)轉(zhuǎn)化率,讓用戶用的開心,內(nèi)容也得到最大程度的利用。為了給用戶推薦的更加準(zhǔn)確,因此就需要更加的了解用戶,這里的了解我分為了兩個(gè)類型:
一種是可視化的推薦,是標(biāo)簽化的了解,根據(jù)用戶的行為數(shù)據(jù),給用戶打標(biāo)簽,從而可視化的看出用戶的特點(diǎn);
一種是非可視化的推薦,是算法層面的了解,根據(jù)協(xié)同過濾,直接根據(jù)數(shù)據(jù)和數(shù)據(jù),用戶和用戶之間的關(guān)系進(jìn)行推薦,直接將算好的結(jié)果呈現(xiàn)給用戶,因此是非可視化的了解。
二、個(gè)性化推薦的實(shí)現(xiàn)規(guī)律
一般進(jìn)行個(gè)性化推薦現(xiàn)實(shí)可行的總體流程是:
1)數(shù)據(jù)收集層:通過用戶日志獲取用戶的歷史行為數(shù)據(jù),作為推薦的原始數(shù)據(jù)
2)數(shù)據(jù)計(jì)算層:根據(jù)用戶的歷史數(shù)據(jù)和推薦算法,計(jì)算出在當(dāng)前情況下最適合給用戶的內(nèi)容,作為備選數(shù)據(jù)
3)復(fù)合排序?qū)樱簩⒂?jì)算得出的備選內(nèi)容和現(xiàn)有的其他下發(fā)算法進(jìn)行歸一運(yùn)算,進(jìn)行同意排序運(yùn)算
4)展示下發(fā)層:將排序后的內(nèi)容,進(jìn)行下發(fā)展示
二、典型的個(gè)性化算法
因?yàn)闃?biāo)簽體系對于產(chǎn)品的上下游而言的好是顯而易見的,因此新產(chǎn)品直接就開始建立是最合適的。但是如果需要對舊產(chǎn)品引進(jìn)個(gè)性化推薦,其實(shí)更加建議從非可視化的推薦開始,這種方式的啟動(dòng)成本相對低一點(diǎn),再根據(jù)推薦的效果進(jìn)而引入標(biāo)簽體系。而輸入法正是從這個(gè)角度進(jìn)行的,以下就先分享下個(gè)性化的典型化算法:

根據(jù)上面的圖,就可以對個(gè)性化分為三個(gè)路線
1,基于內(nèi)容的相似推薦
? ? 這種推薦的思路是:根據(jù)用戶消費(fèi)過的內(nèi)容再推薦相似的內(nèi)容。
但是在非可視化,無標(biāo)簽的情況下,如何實(shí)現(xiàn)基于內(nèi)容的推薦呢?
正如下圖,如果A,B,C···用戶都喜歡了信息I,同時(shí)喜歡了I的用戶大多也喜歡III,就可以認(rèn)為I和III相似,就可以給喜歡了I的用戶推薦III。

2,基于用戶的相似推薦
? ? 這種推薦的似路是:算出用戶行為之間的關(guān)聯(lián)度,從而預(yù)測用戶的行為,將與用戶現(xiàn)在行為最接近的內(nèi)容推薦給用戶。
用戶A,消費(fèi)過:I,III,IV
用戶B,消費(fèi)過:II,III
用戶C,消費(fèi)過:I,II ,IV
在這三個(gè)數(shù)據(jù)量的情況下,給用戶D進(jìn)行推薦,用戶D消費(fèi)過I,因此可以計(jì)算出在此情況下的用戶行為的相關(guān)度,進(jìn)行推薦。
P(II | I)=1/3, P(III | I)=1/3,P(IV | I)=2/3,因此給用戶D進(jìn)行推薦的話,IV是首選。

3,基于標(biāo)簽的相似推薦
? ?這種推薦方式是基于用戶標(biāo)簽和內(nèi)容標(biāo)簽的匹配程度,按照用戶自身的屬性,計(jì)算出與用戶身份匹配度最高的內(nèi)容,然后機(jī)進(jìn)行排序和下發(fā)
四、模型的選擇
模型的選擇就是基于產(chǎn)品現(xiàn)行的的原始數(shù)據(jù)情況了,同時(shí)也可以根據(jù)現(xiàn)有的數(shù)據(jù)進(jìn)行基于用戶和基于內(nèi)容的結(jié)合。從而將算法中的協(xié)調(diào)、過濾兩個(gè)環(huán)節(jié)進(jìn)行拆分。
將協(xié)同和過濾進(jìn)行拆分的過程其實(shí)是依次解決了兩個(gè)問題:找誰協(xié)同?過濾什么?
這種方式實(shí)現(xiàn)起來的模型其實(shí)是這樣的:為了給用戶A做推薦,在一個(gè)推薦周期內(nèi),先根據(jù)行為的相似度,找好了B,C,D,作為協(xié)調(diào)用戶。然后再本次推薦周期內(nèi)將B,C,D的行為和A最新的行為進(jìn)行對比,再按照內(nèi)容進(jìn)行相關(guān)度計(jì)算,從而得出給A推薦的內(nèi)容。
最后,沒有最好的推薦算法,只有最合適自己產(chǎn)品的推薦算法,只有不斷地進(jìn)行嘗試,調(diào)教推薦引擎,才能最高效的讓自己的內(nèi)容利用率最大化。