簡介
????k-團滲透算法(CPM)[1]是第一個能夠發(fā)現(xiàn)重疊社區(qū)的算法,重疊社區(qū)指的是結點可以同時屬于多個社區(qū)。重疊社區(qū)在社交網(wǎng)絡中是十分常見的,因為每個人都有著多種多樣的社交關系。

算法
????網(wǎng)絡中的最大團指的是,團中任意兩個結點之間都有邊連接,并且它不被其他的團所包含。CPM算法的想法非常簡單,首先它找出網(wǎng)絡中所有大小至少為k的最大團。然后構建一個團圖,每個最大團都是團圖中的一個結點,如果兩個團c1與c2共享min(c1,c2)-1個鄰居的話,它們在新圖中的結點之間就存在邊。最后團圖中的每個連通單元就是一個結點的社區(qū),而它可能是重疊的。
代碼參見
并行化
挖掘最大團的過程可以改造為map reduce格式的,詳細過程請見[3]
參考文獻
1: Uncovering the overlapping community structure of complex networks in nature and society
2: The worst-case time complexity for generating all maximal cliques
and computational experiments
3: Efficient Dense Structure Mining using MapReduce