CS224W-圖神經(jīng)網(wǎng)絡(luò) 筆記3.2:Motifs and Structural Roles in Networks - 網(wǎng)絡(luò)的結(jié)構(gòu)(Structural Roles)

本文總結(jié)之日CS224W Winter 2021只更新到了第四節(jié),所以下文會參考2021年課程的PPT并結(jié)合2019年秋季課程進行總結(jié)以求內(nèi)容完整
課程主頁:CS224W: Machine Learning with Graphs
視頻鏈接:【斯坦福】CS224W:圖機器學(xué)習(xí)( 中英字幕 | 2019秋)

1 引言

工作中, 我們因為所處的崗位不同,公司中扮演的角色(Role)也不盡相同。而在網(wǎng)絡(luò)中,節(jié)點的拓撲結(jié)構(gòu),決定了節(jié)點的角色也是不一樣的。這就是本節(jié)要研究的內(nèi)容——Structural Roles。

圖片

2 一些新概念(what)

    1. 角色(Role):具有相似結(jié)構(gòu)特征的節(jié)點集合,不要求彼此相連。
    1. 社區(qū)(communities ):結(jié)構(gòu)上,內(nèi)部連通,內(nèi)部可達的子圖。

角色(Roles) 和 社區(qū)(communities )之間還是有明顯區(qū)別。兩者概念上是互補。

例如,對于計算機學(xué)院的社交網(wǎng)絡(luò)而言:

  • 角色Roles:有教員、工作人員、學(xué)生
  • 社區(qū):有AI研究室、信息研究室、理論研究室等
圖片
    1. 結(jié)構(gòu)等價(Structural equivalence):若節(jié)點u和節(jié)點v與所有其他節(jié)點擁有相同的關(guān)系,則稱節(jié)點u和節(jié)點v結(jié)構(gòu)等價。

換句話說:對所有的其他節(jié)點集 ??, 當且僅當(iff/if and only)節(jié)點 ?? 和 ??之間的連接,等同于節(jié)點 ?? 和 ??之間的連接。如下圖的 結(jié)構(gòu)等價的節(jié)點4和節(jié)點5(6/7也是一組):

圖片

2.1 為什么Roles很重要?(why)

因為有用!且應(yīng)用廣泛!

圖片

2.2 怎么找到Structural Roles?(how)

2.2.1 通過 RolX 方法[1]

簡單來說,就是遞歸抽取節(jié)點特征,然后做無監(jiān)督的聚類。

該方法有以下特點:

  • 無監(jiān)督學(xué)習(xí)方法
  • 無需先驗知識
  • 為每個節(jié)點分配不同Roles混合而成的成員關(guān)系
  • 復(fù)雜度隨著網(wǎng)絡(luò)中的邊的數(shù)量線性增長

2.2.2 流程說明:

RolX 方法具體流程圖如下:大致兩個階段:

  1. 遞歸特征抽?。≧ecursive feature extraction)
  2. 角色抽取(Role Extraction)
圖片
2.2.2.1 遞歸特征抽取

目的是將節(jié)點轉(zhuǎn)化為特征向量,該特征向量包含了該節(jié)點本身、節(jié)點的鄰居節(jié)點的向量的信息,然后使用它遞歸生成新的特征。

基礎(chǔ)特征

  • (自身和鄰居)基礎(chǔ)特征特征工程思路總結(jié)

    • 對有向圖,包括入度、出度、總度數(shù)
    • 對加權(quán)圖:包括加權(quán)的各個度特征,即權(quán)重聚合
    • 鄰居的平均聚類系數(shù)
    • egonet的內(nèi)部邊數(shù),指向egonet邊數(shù),指出邊數(shù),總邊數(shù)等。

egonet: 某節(jié)點和它的鄰居,以及這些節(jié)點之間的所有邊構(gòu)成的誘導(dǎo)子圖。

圖片
2.2.2.2 算法步驟
  1. 以基礎(chǔ)特征集作為開始

  2. 使用當前節(jié)點特征集生成新特征

    • 尋找高度相關(guān)的特征對

    • 當兩個特征的相關(guān)性超過用戶定義的閾值時,刪除其中一個特征

    • 使用mean和sum兩種聚合函數(shù)

    • 剪枝操作

      隨著每次遞歸迭代,生成特征的數(shù)量呈指數(shù)增長 (2^k)。故需要使用剪枝來減少特征數(shù)量

    • 重復(fù)2

2.2.2.3 角色抽取

RolX 對特征矩陣進行非負矩陣分解,得到最終結(jié)果。

  • 最小描述長度進行特征篩選(MDL:principle of minimum description length)。
  • KL散度評估相似度。

2.3 應(yīng)用舉例

老師舉了論文合作者網(wǎng)絡(luò)角色挖掘的例子。

圖片

3 總結(jié)

本節(jié),介紹的RolX思想上雖然比較好理解,但是知和行之間還是有不小的差距。計劃通過代碼運行,加深理解,同時看能不能在實際業(yè)務(wù)中運用。論文為資料5,供參考。

4 參考文章

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容