RDD依賴關(guān)系

Spark中RDD的高效與DAG圖有著莫大的關(guān)系,在DAG調(diào)度中需要對計算過程劃分stage,而劃分依據(jù)就是RDD之間的依賴關(guān)系

窄依賴:一個父RDD的一個分區(qū)只會對應(yīng)于一個子RDD的一個分區(qū)。

? ? ? ? ? ? ? ? ? 下圖: 父對子是一對一的算子

? ? ? ? ? ? ? ? ? ? 1> Map/Filter ;

? ? ? ? ? ? ? ? ? ? 2>對輸入進(jìn)行協(xié)同劃分的join

寬依賴:一個父RDD的一個分區(qū)對應(yīng)于一個子RDD的多個分區(qū)

? ? ? ? ? ? ? ? ? 下圖:父對子是一對多的算子

? ? ? ? ? ? ? ? ? ? 1> groupByKey;

? ? ? ? ? ? ? ? ? ? 2>未經(jīng)過協(xié)同劃分的 join


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容