第二課- 網(wǎng)絡(luò)的屬性和隨機圖模型

網(wǎng)絡(luò)的4大關(guān)鍵屬性

  • 度分布(Dgree distribution:p(k))
  • 路徑長度(Path length:h)
  • 聚合系數(shù)(Clustering coefficient:C)
  • 聯(lián)通模塊(Connected components:s)

以上4個屬性主要針對無向圖,如果以下筆記有特別針對有向圖時,會主動提出

度分布

p(k)=N_k/N

N_k = 度為k的節(jié)點數(shù),N = 總節(jié)點數(shù)

dgree distribution.PNG

對于有向圖我們分為出度和入度分布

路徑長度

距離:兩點間的最短路徑(如果兩點之間不連接,通常將距離定義為infinite)
直徑:圖中兩點的最大距離
平均路徑長度:針對無向圖和有向圖中的強連通圖(強連通圖代表任意兩點間存在路徑)

\overline h = \frac{1}{2E_{max}}\sum_{i, j\neq i}h_{ij}

path length.PNG

聚合系數(shù)

clustering coefficient.PNG

e_i代表節(jié)點i的鄰居間存在的邊的數(shù)量,k_i(k_i-1)/2代表節(jié)點i的鄰居間可能存在的再大的邊的數(shù)量,將這兩個量相除就得到了聚合系數(shù)C_i \in [0,1]

聯(lián)通模塊

connectivity.PNG

隨機圖模型

本課程主要介紹了G_{np}模式(還有了G_{nm}課程沒有詳細介紹):對于擁有n個節(jié)點的無向圖,每兩個點間存在邊的概率為p。對于給定的兩個參數(shù)n和p,相同的參數(shù)可能會產(chǎn)生不同的圖。

Gnp.PNG

那么Gnp模型的四種網(wǎng)絡(luò)屬性又是怎么樣的呢?先上結(jié)論。

  • Degree distribution:p(k)=C_{n-1}^kp^k(1-p)^{n-1-k}
  • Path length:O(logn)
  • Clustering coefficient:C=p=\overline k/n
  • Connected components:暫略

度分布

Gnpdegree distribution.PNG

p(k)表示度為k的概率,該該公式可以理解為對于節(jié)點i從剩下的n-1個節(jié)點中選擇k個節(jié)點(假設(shè)該節(jié)點的degree為k),則p^k表示節(jié)點i與這k個節(jié)點間存在邊,(1-p)^{n-1-k}表示和剩下的那些節(jié)點不相連。這部分涉及概率論中隨機變量(k)和二項分布的相關(guān)知識。由于p(k)為二項分布,所以很容易得到了k的數(shù)學(xué)期望和方差。
slide中還提到,根據(jù)概率論中的另一個知識——大數(shù)定律,隨著隨機圖的規(guī)模越來越大,節(jié)點的度越來越集中在平均度附近。

路徑長度

這里Jure引入了擴展系數(shù)\alpha來證明隨機網(wǎng)絡(luò)的路徑長度。直接給了結(jié)果,即一個有n個節(jié)點的網(wǎng)絡(luò),如果有擴展系數(shù)為\alpha,則網(wǎng)絡(luò)的路徑長度的期望是:O(logn/\alpha),這是一個和\alpha有關(guān)的值。
對于隨機網(wǎng)絡(luò),路徑長度的期望就是O(logn/log(np))。對于固定的\overline k = np,分母變成了常數(shù),所以就是O(logn)級別。模擬實驗的結(jié)果如下,也證明了這個結(jié)論。

Gnp_Clustering coeffcient.png

聚合系數(shù)

Gnp_Clustering coefficient.PNG

由于點之間存在邊的概率為p,所以給出了e_i的數(shù)學(xué)期望,最后計算得到聚合系數(shù)的期望E[C_i] \approx \overline k/n。這一步由之前的度分布中\overline k=p(n-1)得到。
另外slide中還提到隨即圖模型的聚合系數(shù)很小,如果我們生成越來越大的圖,并且固定平均度,聚合系數(shù)會越來越小。

聯(lián)通模塊

connectivity.PNG

由上圖可知圖的聯(lián)通性會隨著p的改變而改變

exp.PNG

隨著p值越來越大,節(jié)點的平均度也越來越大,最終最大聯(lián)通塊中囊括了圖中大部分的節(jié)點。

sumary

將實際的圖與隨機圖進行了比較,并給出了為什么我們要使用隨即圖的原因。


sumary1.PNG
summary2.PNG

小世界圖模型

隨機網(wǎng)絡(luò)是很簡單的圖模型,可以作為一個基準(zhǔn)。但是更實際的模型有很多,其中小世界圖模型非常有名。其核心思想就是,雖然隨機網(wǎng)絡(luò)的平均路徑是比較短的,但聚合系數(shù)非常的低,這是由于隨機網(wǎng)絡(luò)假定的是大家都隨機的和世界上其他人交朋友。但真實的網(wǎng)絡(luò)的聚合系數(shù)都是很高的,節(jié)點的本地結(jié)構(gòu)化非常明顯。那么我們能否通過某種方式來產(chǎn)生這樣的圖——高聚合系數(shù)、低平均路徑長度(或者就是低圖直徑)。


litle world.PNG

一種構(gòu)造高聚合系數(shù)、低平均路徑長度圖的方式:

  1. 先構(gòu)造一個左邊的圖
  2. 對每一條邊,以概率p將該邊的一個端點改為另一個隨機節(jié)點


    rewoire.PNG

Kronecker網(wǎng)絡(luò)模型

Kroneck乘法:


knc1.PNG

隨機Kronecker模型構(gòu)造法:

  1. 構(gòu)造一個NXN的概率矩陣\theta_1
  2. 使用Kronecker乘法k次,生成矩陣\theta_k
  3. \theta_k中每個元素代表一個概率值,即兩個節(jié)點間生成邊的概率
  4. 然后按照這個概率產(chǎn)生實際的鄰接矩陣,就生成了一個大圖
knc2.PNG

由于上面的方式要計算NXN次才能得出目標(biāo)矩陣,說是這樣速度太慢了,又說了一種快速的方式,不過沒怎么看懂,如果以后用到了再說吧。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容