在社會化網(wǎng)絡(luò)中使用深度學(xué)習(xí)進行信任感知推薦

On Deep Learning for Trust-Aware Recommendations in Social Networks
文章鏈接:https://www.researchgate.net/publication/295243846_On_Deep_Learning_for_Trust-Aware_Recommendations_in_Social_Networks?_sg=Obs_flkGvZ6OZbMpoiPuIfFH9ydcZAxNAz_av3xcdlPVorfBfdH9j90lLCKTyrTF55s3rqHrM__VzV8G5Prb1A

摘要

隨著社會化網(wǎng)絡(luò)的產(chǎn)生,基于社會化網(wǎng)絡(luò)的推薦方法也越來越多,這種方法的好處是能夠良好的處理冷啟動問題。此外,對于社會化網(wǎng)絡(luò),用戶信任信息在推薦系統(tǒng)可靠性上扮演重要角色,盡管矩陣分解的方法在學(xué)術(shù)推薦系統(tǒng)中廣泛使用,這種推薦極大程度上依賴于用戶和項目潛在特征矩陣的初始化。為了解決這一挑戰(zhàn),我們提出一種全新的基于信任的社會化推薦方法。我們試圖利用深度學(xué)習(xí)來決定在矩陣分解當(dāng)中的初始化問題,用于社會化信任感知推薦,,并且識別在不同社區(qū)下的用戶信任關(guān)系的影響程度。推薦過程分為兩部分:使用深度學(xué)習(xí)的初始化過程和融合用戶興趣偏好以及在不同社區(qū)群影響下的信任用戶的興趣偏好。在真是的社交數(shù)據(jù)集上進行了實驗,證明是有效的。

介紹

仍存在的主要問題:

數(shù)據(jù)稀疏性
冷啟動問題
可信賴性問題

矩陣分解技術(shù)是通過歷史評分和信任關(guān)系來學(xué)習(xí)用戶和項目的潛在因子,矩陣分解技術(shù)被認(rèn)為是一種精確的模型化學(xué)習(xí)過程,通過使用訓(xùn)練數(shù)據(jù)建立模型。確切的說,更具體地說,它確實是一個優(yōu)化確定模型參數(shù)的問題,以最佳逼近地面真理與預(yù)測。對于一個優(yōu)化問題,有時是初始化的一個優(yōu)化質(zhì)量的關(guān)鍵問題。因子這就鼓勵我們解決這個矩陣分解上的關(guān)鍵問題,試圖同時解決這兩個問題。

首先,目前的通常對用戶和項目的潛在特征向量初始化的時候是簡單機制的,例如隨機和0初始化,實際上,從優(yōu)化的角度來看,基于矩陣分解的方法是敏感的,對于用戶和項目特征矩陣的初始化,由于在MF的最小化程序是非凸的。一個好的初始化能夠產(chǎn)生最好的局部最小化,提升效率和精度。

在決定初始化用戶和項目潛在特征向量時顯而易見顯然應(yīng)該與學(xué)習(xí)算法相一致應(yīng)用.用戶潛在因子和項目矩陣的學(xué)習(xí)是在預(yù)測評分和實際評分R之間取得最小的損失函數(shù)。由于用戶和項目都是高維的??赡艽嬖谝唤M局部全損失函數(shù)空間中的最優(yōu)值,如何選擇最佳的初始化會影響到矩陣的聚合程度。如果,我們得到用戶項目潛在特征矩陣在一個低維空間中,將會更加容易處理初始化難的問題。為了解決這個問題,我們使用深度學(xué)習(xí)的方法,,他是一種有效的非線性降維的方法。的通過多層限制功能的限制Boltzmann機器將高維數(shù)據(jù)抽象到潛在特征RBMS

第二點,目前的模型沒有考慮用戶信任網(wǎng)絡(luò)多樣性,例如用戶會在不同的領(lǐng)域主題下對不同的好友產(chǎn)生不同程度的信任。人們往往根據(jù)他們在社會關(guān)系中的社會關(guān)系,形成不同的社區(qū)一個被稱為社區(qū)效應(yīng)的社會網(wǎng)絡(luò)。在這種社區(qū)關(guān)系下,不論是顯式或隱式,都能夠融合進社會化網(wǎng)絡(luò)規(guī)則當(dāng)中。直觀的來看,根據(jù)與目標(biāo)用戶的相似程度,來自朋友當(dāng)中不同子集朋友圈的推薦的貢獻程度應(yīng)當(dāng)是不同的。也就是說,在一個社區(qū)中的用戶相比于其他社區(qū)更趨向于本社區(qū)內(nèi)部的相互信任,并且共享共同的偏好。因此,社區(qū)影響極大的影響著在社會化推薦過程中的推薦效果。

信任感知推薦

使用深度學(xué)習(xí)的自動化編碼來學(xué)習(xí)初始化用戶項目的潛在特征值,然后使用學(xué)習(xí)得到的特征值向量構(gòu)建最小的目標(biāo)函數(shù),對于目標(biāo)函數(shù),我們考慮目標(biāo)用戶的特點和他們信任的朋友的推薦。此外,信任感知的正則化項還加入了描述信任傳播。

A使用深度學(xué)習(xí)自動化編碼的預(yù)處理階段

由于矩陣分解是非凸的最優(yōu)化問題,不保證都比矩陣(P和Q)是最佳的決定。對應(yīng)于不同的初始P和Q值MF可以收斂不同的局部最優(yōu)。我們分析了如何使用深自編碼來pretrain評分矩陣和學(xué)習(xí)用戶和項目的潛在特征的初始值。

評分矩陣


Paste_Image.png

每一行代表用戶的歷史對每項的評分,因此我們定義用戶向量
Un×m =[U1, . . . , Ui, . . . , Um] =R^T ,
其中


Paste_Image.png

特點:高維,稀疏

在對準(zhǔn)確的特征向量進行調(diào)查時MF模型中,我們可以觀察到類似的用戶(例如,用戶為相同的項目評分類似的分?jǐn)?shù))有類似的用戶特征向量?;谶@一觀察,我們可以直觀地得出這樣的結(jié)論,if the initialization of feature vectors characterized
the similarities of users and items more precisely,
因此,我們試圖獲得初始值

自動化編碼是一種人工神經(jīng)網(wǎng)絡(luò),其目的在于學(xué)習(xí)對高維數(shù)據(jù)的壓縮。Hinton and Salakhutdinov提出了一種訓(xùn)練的預(yù)處理技術(shù)使用多層深度自動編碼,使用使用一個反向傳播技術(shù)微調(diào)

Paste_Image.png

包含一個encode網(wǎng)絡(luò)和一個decode網(wǎng)絡(luò),encode網(wǎng)絡(luò)的目標(biāo)是將高維編碼轉(zhuǎn)換為低維編碼,decode網(wǎng)絡(luò)可被視為是該過程的逆過程。是重建從代碼的原始數(shù)據(jù)。鏈接的一部分兩個網(wǎng)絡(luò)被稱為代碼層,這是核心的整個系統(tǒng),并確定了內(nèi)在維度原始數(shù)據(jù)。
深度自動化解碼的主要過程是使用RBM學(xué)習(xí)兩個網(wǎng)絡(luò)的權(quán)重開始。然后使用反向傳播的誤差衍生工具來訓(xùn)練通過最小化兩個網(wǎng)絡(luò)之間的偏差原始數(shù)據(jù)及其重構(gòu)。由于RBM是僅能用于二值數(shù)據(jù),而評分?jǐn)?shù)據(jù)不能理想的適用,因此使用連續(xù)RBM(CRBM)來預(yù)處理權(quán)重。

CRBM是由可見層和隱藏層組成,分別連接輸入輸出數(shù)據(jù)
將一個用戶向量做輸入輸出Un×m和U?‘p ×m,n-dimensional user vector能夠encode成為p-dimensional vectors.n visible units可見單元vi和p hidden units隱藏單元h j ,,定義其之間權(quán)重且有wi j = w j i

Paste_Image.png
Paste_Image.png
Paste_Image.png
Paste_Image.png
Paste_Image.png

CRBM的主要encoding階段如下:

最后multiple CRBMs to encode the
n-dimensional user vectors to the final k-dimensional vectors

B社會化信任集成

the trust values are given in a matrix T = [Tu,v]m×m .
the first we do is to propose a new model of trust degree no
matter the trust values are assigned explicitly or not.

preference similarity to model
trust degree Tu,v將目標(biāo)用戶偏好融入信任度模型當(dāng)中

Paste_Image.png

trust(u,v)是由用戶u指派的信任值0,1
Su即與用戶u直接連接的用戶集。請注意,這個方程只適用于兩個直接鏈接的用戶。對于不使用的用戶鏈接直接,我們使用乘法作為信任傳播計算信任度

Paste_Image.png

C正則化社區(qū)效應(yīng)

如前所述,社交網(wǎng)絡(luò)表現(xiàn)出強烈的群落的影響。社交網(wǎng)絡(luò)中的用戶有一種傾向緊密連接的形式組。組也所謂的社區(qū)集群,集團在不同的上下文中。此外,一組中的人往往彼此信任和與彼此有共同的偏好比那些更多的在其他組。因此,在這一節(jié)中,我們將討論如何納入信任社會網(wǎng)絡(luò)中的社區(qū)效應(yīng)作為正則化項的修改提出了MF模型細(xì)節(jié)。

圖形挖掘技術(shù)已被廣泛用于社會網(wǎng)絡(luò)中的社區(qū)檢測,因為它們是有效的在識別隱藏在基礎(chǔ)數(shù)據(jù)中的組。社區(qū)檢測的一個重要類型是識別基于網(wǎng)絡(luò)中的行動者之間的可達性集團。受社會現(xiàn)有的社區(qū)結(jié)構(gòu)n-集團,在社會學(xué)學(xué)科中,我們提出的n-trust-clique(集團)識別派系在一個基于信任關(guān)系的社交網(wǎng)絡(luò)中用戶和開發(fā)一個算法來檢測集團TrustCliques。我們選擇n-clique的原因是這種方法有助于檢測重疊社區(qū)。此外,它是值得注意,我們不直接適用于n-clique原因在社交網(wǎng)絡(luò)上,是鏈接信息本身會導(dǎo)致檢測精度低,而信任信息有助于保證良好的性能。

社區(qū)檢測的主要定義

n-clique是其中一個最大的子圖,每一對的最大距離節(jié)點的不大于n。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容