最近,我司的O2O營銷系統(tǒng)考慮做推薦系統(tǒng),雖然不是我的功能,但是趁著放假,也了解了一下。
什么是推薦系統(tǒng)?
隨著信息技術(shù)和互聯(lián)網(wǎng)的發(fā)展,人們逐漸從信息匱乏的時(shí)代走入了信息過載的時(shí)代。在這個(gè)時(shí)代,無論是信息消費(fèi)者還是信息生產(chǎn)者都遇到很大的挑戰(zhàn);對于消費(fèi)者,從大量信息中找到自己感興趣的信息是一件非常困難的事情;對于信息生產(chǎn)者,讓自己的信息脫穎而出,受到廣大用戶的關(guān)注,也是一件非常困難的事情。推薦系統(tǒng)就是解決這一矛盾的重要工具。推薦系統(tǒng)的任務(wù)就是聯(lián)系用戶和信息,一方面幫助用戶發(fā)現(xiàn)對自己有價(jià)值的信息,另一方面讓信息能夠展現(xiàn)在對它感興趣的用戶面前,從而實(shí)現(xiàn)信息消費(fèi)在和信息生產(chǎn)者的雙贏。
這是我摘抄過來的一段話,對于推薦系統(tǒng)給出了比較簡單易懂的解釋。推薦的精髓在于,我想要的你都有,你給我的都是我想要的,其中,我就是用戶,你就是信息提供方。這樣完美的推薦的實(shí)現(xiàn),還需要一些時(shí)日,但是終歸要到來,現(xiàn)在想來還是挺可怕的,因?yàn)榭赡軝C(jī)器比我更了解我自己。
推薦系統(tǒng)的冷啟動(dòng)
本篇文章是寫給產(chǎn)品經(jīng)理看的,所以說,我們不討論算法,只說方法。
冷啟動(dòng)在整個(gè)推薦系統(tǒng)中,是一個(gè)非常重要而又非常難的一件事情,推薦系統(tǒng)一般都需要在大量的數(shù)據(jù)基礎(chǔ)過后才能比較準(zhǔn)確的進(jìn)行推薦,而一個(gè)新用戶剛使用APP的冷啟動(dòng)可能直接決定著這個(gè)用戶還會不會使用下去,所以冷啟動(dòng)是一件至關(guān)重要的事情。
冷啟動(dòng)在互聯(lián)網(wǎng)行業(yè)有著很多的通用的方法和經(jīng)驗(yàn),可以讓用戶更快更優(yōu)質(zhì)的去冷啟動(dòng)。那么冷啟動(dòng)主要關(guān)注的兩個(gè)方面是,推薦的內(nèi)容是否全面和內(nèi)容是否可靠有用。
總結(jié)一下方法如下。
第一、盡可能用用戶給你的信息,比如app music會選擇讓用戶主動(dòng)選擇一些流派或歌手,根據(jù)選擇結(jié)果進(jìn)行冷啟動(dòng),這樣會比較準(zhǔn)確。這種方法在很多APP第一次打開時(shí)都會用到。推薦關(guān)注人或者主題,都是這種原因。
第二、用戶的社交信息比較重要,比如今日頭條13-14年的時(shí)候做過引導(dǎo)用戶微博登陸,登陸后會去爬取用戶在微博上的一些信息,比如發(fā)的動(dòng)態(tài)、圖片、文章,贊過、轉(zhuǎn)發(fā)過的的內(nèi)容等數(shù)據(jù),通過這些數(shù)據(jù)進(jìn)行分析,比如在微博上轉(zhuǎn)發(fā)了某個(gè)女歌手的新聞,就會知道用戶喜歡這個(gè)女歌手,這種數(shù)據(jù)比較真實(shí)也有延續(xù)性,也符合用戶最近的思維,這種數(shù)據(jù)質(zhì)量比較好。
第三、有可能會涉及一些用戶隱私。某些應(yīng)用會上報(bào)其他app的信息,可以了解用戶安裝了哪些app、app中傳遞了哪些信息,可以了解到用戶喜歡哪些東西,是喜歡游戲、美食甚至是喜歡的內(nèi)容風(fēng)格,可以了解到用戶的喜好,用這些數(shù)據(jù)去服務(wù)冷啟動(dòng)會更好。所以說手機(jī)信息這塊還是很有用的,手機(jī)廠商其實(shí)已經(jīng)掌握了用戶的各種行為,但是有個(gè)缺點(diǎn)就是很多手機(jī)系統(tǒng)不會提供讀取用戶app安裝信息的服務(wù)。
最后、可以提供有獎(jiǎng)?wù)骷姆椒ǎナ占脩舻哪挲g和性別,或者其他的社會信息,這是一種短平快的方法,但是這種方法需要提供什么樣的誘惑,需要嘗試中去摸索可行性。
評論推薦
除了產(chǎn)品的推薦,在O2O中,用戶評論也是比較重要的,用戶去下線消費(fèi)與否很可能會因?yàn)橐粭l好的評論或者壞的評論而改變想法。對于評論,我們有兩點(diǎn)需要關(guān)注。
1、怎么樣去識別一個(gè)優(yōu)質(zhì)的評論
怎樣從海量的評論中找到好的、優(yōu)質(zhì)的評論,我們可以從以下兩個(gè)方面來嘗試。
1)通過評論內(nèi)容去直接分析。字?jǐn)?shù)較多的、使用高級冷僻詞匯的一些評論質(zhì)量相對較好,這部分可以通過算法去識別出來。其中,需要去過濾掉有過多重復(fù)詞、違禁詞的評論。那通過這種方法可以去簡單去提取出一些相對有用的評論。
2)從一個(gè)評論的用戶屬性去出發(fā)。一般來說,哪些用戶會發(fā)表的評論比較高質(zhì)量呢?
a.一種可能是學(xué)歷,我覺得學(xué)歷是一個(gè)相當(dāng)重要一個(gè)點(diǎn)。因?yàn)閷W(xué)歷高的話你所使用的詞匯可能也會比較好,包括你的思考相對說完整性較好,而不會出現(xiàn)像小學(xué)生那種好好好、贊贊贊等這種相對來說比較水的一些評論互動(dòng)。再來經(jīng)過編輯篩選就更加方便了。
b.第二種就是我們可以通過一些歷史統(tǒng)計(jì),比如說我發(fā)現(xiàn)他之前發(fā)表過一個(gè)評論可能得到點(diǎn)贊數(shù)都特別多,也可以幫助我們識別出來他現(xiàn)在發(fā)的一些最新評論是不是也是優(yōu)質(zhì)做一個(gè)參考。
c.第三種可以通過一個(gè)用戶他平時(shí)在我們平臺上面的一些行為來確定。比如說一個(gè)用戶,如果真的很懂美食,那可能在我們這邊是相對活躍的。我們可以通過一些統(tǒng)計(jì)歷史性過于發(fā)現(xiàn)他活躍的一些特征。提高一定的權(quán)重。
d.第四種,這種用戶本身等級都較高,在我們的平臺,等級較高的用戶不管是文化程度還是收入都比較高,這類用戶的評論應(yīng)該更加受到重視。
2、假如識別出來之后要怎么給他們設(shè)置前置規(guī)則
確實(shí)很多評論系統(tǒng)會有這個(gè)問題,假如一個(gè)優(yōu)質(zhì)評論比較早發(fā)布的話,那他一直被置頂?shù)膸茁试絹碓礁摺?br>
1)其實(shí)如果我們在算法上面做一個(gè)衰減因子。當(dāng)隨著時(shí)間衰退,這個(gè)因子變得越越大的時(shí)候。在打分上面,我們把熱度再乘以這個(gè)因子,那就會把這個(gè)分?jǐn)?shù)拉低。這樣子一些剛剛上線了一些質(zhì)量比較好的評論,在短時(shí)間獲得大量贊的評論,可能會超過之前的評論,從而排序會出現(xiàn)在更靠前。
2)另外,可以嘗試在評論區(qū)里面開辟一個(gè)熱門評論區(qū)。由編輯精選的一些優(yōu)質(zhì)的評論,去不停地滾動(dòng),去嘗試推薦這些評論。比如說達(dá)到曝光量一萬的時(shí)候,或者達(dá)到一定的數(shù)值,這個(gè)數(shù)值可以是點(diǎn)贊數(shù),也可以是其他的關(guān)鍵行為。如果他達(dá)到了我們的一個(gè)預(yù)期值。那他可以繼續(xù)留在這里,再把一些不滿足的評論給踢掉,換其他一些優(yōu)質(zhì)評論上來。這樣子就可以保證有比較多的新增評論可以在評論區(qū)里面不斷被曝光。而且如果他真的寫得好的話,其實(shí)可以他曝光之后可以得到持續(xù)置頂。這樣子也有助于整個(gè)熱門評論區(qū)評論的更新,以及內(nèi)容質(zhì)量的相對保證。