devp2p 路由表(Table)初始化筆記

路由表初始化

devp2p 中路由表被存儲在 leveldb 中,啟動時會加載到 Table 結(jié)構(gòu)體中

  • 代碼位置 p2p/discover/table.go

很容易可以找到調(diào)用 p2p/Server.Start 方法的地方,假設(shè)啟動前已經(jīng)設(shè)置好 bootnode 并且沒有啟用 nodiscover 開關(guān),那么會按照這個時序圖標(biāo)注的關(guān)鍵路徑一直調(diào)用到 Taboe.loop(),整個填表的過程都在 loop() 函數(shù)中,具體初始化行為在 Table.doRefres 函數(shù)進(jìn)行初始化,其關(guān)鍵調(diào)用路徑如下:

p2p/server.go:Server

Table.doRefresh 函數(shù)

看個大概意思就可以,以太坊對此更新比較頻繁,大體意思不變,不用每行都讀,很可能下一個版本就對不上了

func (tab *Table) doRefresh(done chan struct{}) {
    defer close(done)
    // 這里 seednodes 當(dāng)?shù)谝淮螁訒r會是 bootnodes,因為 db 里沒有歷史記錄
    tab.loadSeedNodes()
    // 這個 lookup 如果不成功,就會阻塞在這里,除非 bootnode 死掉了,否則一定成功
    // 查詢自己的目的是在 tab 為空時把 bootnode 填進(jìn)去 
    tab.lookup(tab.self.ID, false) 
    // 隨機(jī)的再去 Query 幾個節(jié)點,這是 KAD DHT 的經(jīng)典做法
    for i := 0; i < 3; i++ {
        var target NodeID
        crand.Read(target[:])
        tab.lookup(target, false)
    }
}

K桶 與 邏輯距離

計算節(jié)點邏輯距離來定位桶號,這幾乎是 KAD DHT 唯一的精髓所在了,看看以太坊是怎么做的,以太坊只分了 17 個桶,每個桶有 16 個位置,也就是說以太坊的 DHT 中就只有17 * 16 = 272 個節(jié)點信息

  • 代碼位置 :p2p/enode/node.go
// LogDist returns the logarithmic distance between a and b, log2(a ^ b).
func LogDist(a, b ID) int {
    lz := 0
    for i := range a {
        x := a[i] ^ b[i]
        if x == 0 {
            lz += 8
        } else {
            lz += bits.LeadingZeros8(x)
            break
        }
    }
    return len(a)*8 - lz
}

這里的 x = a[i] ^ b[i] , 為什么 x==0 時計數(shù)器 lz 要加 8 呢?這是因為 a[i]b[i] 的單位都是 byte1byte == 8bit ,所以在這里 lz 是一個 bit 計數(shù)器,用異或計算邏輯距離就是計算前導(dǎo) 0 的個數(shù),單位是 bit ,通常 {byte | 0 <= byte <= 255 } 所以當(dāng) x != 0 時,又用 bits.LeadingZeros8(x) 取了 x 的前導(dǎo) 0 個數(shù)并累加,例如當(dāng) x == 17byte(17) == bit[0,0,0,1,0,0,0,1] ,前導(dǎo) 03 所以此時 else 會執(zhí)行 lz += 3
最后的 len(a)*8 - lz 是把一樣的 bit 總數(shù)減掉,剩下的就是不同的 bit 數(shù)量,演算一下結(jié)果約等于 log2(a^b)

  • 代碼位置 :p2p/discover/table.go
// bucket returns the bucket for the given node ID hash.
func (tab *Table) bucket(id enode.ID) *bucket {
    d := enode.LogDist(tab.self().ID(), id)
    if d <= bucketMinDistance {
        return tab.buckets[0]
    }
    return tab.buckets[d-bucketMinDistance-1]
}

唯一用到了 LogDist 函數(shù)的地方是 Table.bucket 函數(shù),在這里 ID32byte 桶最小距離 bucketMinDistance == 239 ,那么 d <= 239 則返回 buckets[0] 就代表著只要有從左到右 16 bit 以上相同的就放到第一個桶里,因為 (256-16)-239-1 = 0,其余的最大也就是 32 * 8 = 256 個不同的 bit,256 - 239 - 1 = 16 正好可以放到最后一個桶里,桶的尺寸是 17[0-16],

這兩個函數(shù)十分重要,在我們關(guān)注的這部分代碼中,在 doRefreshtab.loadSeedNodes() 中被使用,這里如果 db 中的數(shù)據(jù)非空,最多會拿出 30 個 種子節(jié)點,再加上全部的 bootnodes 節(jié)點,就組成了本次的種子節(jié)點集合

lookup

這里就不講太具體的代碼了,因為 v1.8.xv1.9.x 甚至連接口都變了,不過大體邏輯還是差不太多的,挑一些關(guān)鍵代碼和思路進(jìn)行簡單介紹

DistCmp 邏輯距離比較

這是其中一個關(guān)鍵方法,用來判斷兩個 ID 在桶里的順序

func DistCmp(target, a, b ID) int {
    for i := range target {
        da := a[i] ^ target[i]
        db := b[i] ^ target[i]
        if da > db {
            return 1
        } else if da < db {
            return -1
        }
    }
    return 0
}

這里邏輯比較簡單,target 是目標(biāo),ab 是競爭關(guān)系,按照每個 bytetarget 進(jìn)行異或,最后誰的結(jié)果大,誰的距離就遠(yuǎn),結(jié)果小的距離就近一些,因為結(jié)果越大說明前導(dǎo) 0 越少,也就是邏輯距離越遠(yuǎn)了

closest

這個函數(shù)是在本地K桶中尋找距離目標(biāo)節(jié)點邏輯距離最近的一組節(jié)點信息

  • 完整的函數(shù)簽名如下:
func (tab *Table) closest(target enode.ID, nresults int, checklive bool) *nodesByDistance

這里 diss 一下以太坊的處理邏輯,這個函數(shù)中會去遍歷整個桶,然后用 DistCmp 去篩選出與 target 邏輯距離較近的一組節(jié)點,這個地方?jīng)]有 libp2p 處理的優(yōu)雅 ??
重要的函數(shù)是 nodesByDistance.pushclosest 的結(jié)果就是在這個函數(shù)中產(chǎn)生的

func (h *nodesByDistance) push(n *node, maxElems int) {
    ix := sort.Search(len(h.entries), func(i int) bool {
        return enode.DistCmp(h.target, h.entries[i].ID(), n.ID()) > 0
    })
    if len(h.entries) < maxElems {
        h.entries = append(h.entries, n)
    }
    if ix == len(h.entries) {
        // farther away than all nodes we already have.
        // if there was room for it, the node is now the last element.
    } else {
        copy(h.entries[ix+1:], h.entries[ix:])
        h.entries[ix] = n
    }
}

可以看到這里將 closest 中傳遞的 target 放入了 nodesByDistance 對象中,并作為目標(biāo)傳遞給 DisCmp 函數(shù)來比較已經(jīng)生成的 h.entries 集合中有沒有比傳入的 ntarget 更遠(yuǎn)的節(jié)點,如果找到了就用 n 去替換這個節(jié)點,最開始的邏輯是無條件先填滿 h.entries 集合,然后再去逐個替換,也就是說只要桶中的數(shù)據(jù)超過 16 條那 closest 方法的返回值永遠(yuǎn)都是 16 條記錄

lookupWorker

func (t *UDPv4) lookup(targetKey encPubkey) []*node {
    ......
    result = t.tab.closest(target, bucketSize, false)
    ......
    go t.lookupWorker(n, targetKey, reply)
    ......  
    return result.entries
}

接下來由 3 個協(xié)程對 closest 結(jié)果集中的前三個節(jié)點,也就是向本地與 target 邏輯距離最近的三個節(jié)點發(fā)送 findnode 請求并等待 reply,再將返回的結(jié)果插入到 target 所在的桶中,至此即完成 lookup

Table.loop 函數(shù)

可以看到 loop 一啟動就用一個協(xié)程去執(zhí)行了 doRefresh 函數(shù),然后進(jìn)入一個循環(huán)的 select{} 代碼塊,阻塞等待下一個任務(wù),其中 refresh 這個 Ticker 為 30 分鐘,所以每 30 分鐘還會周期性的執(zhí)行 doRefresh 函數(shù),并且查詢的目標(biāo)為隨機(jī),還有一個觸發(fā)條件就是主動產(chǎn)生 refreshReq 請求,這個請求會從 dialTask.Do 函數(shù)中調(diào)用 dailTask.resolve(srv) 中觸發(fā)


// loop schedules runs of doRefresh, doRevalidate and copyLiveNodes.
func (tab *Table) loop() {
    var (
        refresh        = time.NewTicker(refreshInterval)
        ......
    // Start initial refresh.
    go tab.doRefresh(refreshDone)
    ......
    for {
        select {
        case <-refresh.C:
            tab.seedRand()
            if refreshDone == nil {
                refreshDone = make(chan struct{})
                go tab.doRefresh(refreshDone)
            }
        case req := <-tab.refreshReq:
            waiting = append(waiting, req)
            if refreshDone == nil {
                refreshDone = make(chan struct{})
                go tab.doRefresh(refreshDone)
            }
        ......
        // 這個定時任務(wù)是 10秒 執(zhí)行一次,用來判定節(jié)點狀態(tài)
        case <-revalidate.C:
            revalidateDone = make(chan struct{})
            go tab.doRevalidate(revalidateDone)
        ......
    }
    ......
}

Table.doRevalidate

這個函數(shù)很重要,因為節(jié)點數(shù)據(jù)進(jìn)桶之前并沒有進(jìn)行過狀態(tài)交驗

discoverTask

在啟動節(jié)點后,每一個連接任務(wù)都會判斷如果 peers 少于 25(默認(rèn)25),就要增加一個 discoverTask ,用來執(zhí)行 srv.ntab.LookupRandom() ,目的是隨機(jī) findnode 以便填充路由表

強(qiáng)行總結(jié)

相比于優(yōu)雅的 libp2p 以太坊的 DHT 實在是簡陋,甚至有點丑陋,無心再往下看了。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • Python從頭實現(xiàn)以太坊系列索引:一、Ping二、Pinging引導(dǎo)節(jié)點三、解碼引導(dǎo)節(jié)點的響應(yīng)四、查找鄰居節(jié)點五...
    JonHuang閱讀 2,389評論 3 9
  • feisky云計算、虛擬化與Linux技術(shù)筆記posts - 1014, comments - 298, trac...
    不排版閱讀 4,379評論 0 5
  • 以太坊(Ethereum ):下一代智能合約和去中心化應(yīng)用平臺 翻譯:巨蟹 、少平 譯者注:中文讀者可以到以太坊愛...
    車圣閱讀 3,928評論 1 7
  • 1.JQuery 基礎(chǔ) 改變web開發(fā)人員創(chuàng)造搞交互性界面的方式。設(shè)計者無需花費時間糾纏JS復(fù)雜的高級特性。 1....
    LaBaby_閱讀 1,513評論 0 2
  • 幼兒園低年級(3歲~8歲)繪本全八冊 痂能揭掉嗎? 肚臍能不能摳?放屁是怎么回事?腳掌為什么跟手掌不一樣?燙...
    不辣的媽Joe閱讀 1,425評論 0 1

友情鏈接更多精彩內(nèi)容