本文介紹的Graphx的圖上算法都是基于Pregel模型實(shí)現(xiàn)的。
用戶圖計(jì)算的場(chǎng)景:
- 基于度分布的中樞節(jié)點(diǎn)發(fā)現(xiàn)
- 基于最大連通圖的社區(qū)發(fā)現(xiàn)(聚類)
- 基于三角形計(jì)數(shù)的關(guān)系衡量
- 基于隨機(jī)游走的用戶屬性傳播(聚類)
該系列文章主要針對(duì)Spark的Graphx組件中提供的6項(xiàng)圖算法進(jìn)行源碼的簡(jiǎn)要學(xué)習(xí)和筆記記錄,有不對(duì)的地方歡迎指正呀~
【1】三角形計(jì)數(shù)TriangleCount
【2】PageRank
【3】標(biāo)簽傳播LabelProgagation
【4】最短路徑ShortestPaths
【5】連通分量ConnectedComponents
【6】強(qiáng)連通分量StronglyConnectedComponents