2020-10-15-Flink-2(任務(wù)調(diào)度原理 批/流處理系統(tǒng) )

1


image.png
image.png
image.png
image.png
image.png

多個(gè)節(jié)點(diǎn)(服務(wù)器)每個(gè)job執(zhí)行的結(jié)果,最終是怎么進(jìn)行匯總的?

Flink任務(wù)提交后,Client向HDFS上傳Flink的Jar包和配置
向Yarn ResourceManager提交任務(wù),ResourceManager分配Container資源
通知對(duì)應(yīng)的NodeManager啟動(dòng)ApplicationMaster,ApplicationMaster啟動(dòng)后加載Flink的Jar包和配置構(gòu)建環(huán)境,創(chuàng)建Dispatcher和ResourceManager
Client向Dispatcher提交job
Dispatcher為job啟動(dòng)一個(gè)JobManager
JobManager向ResourceManager申請(qǐng)slot
ResourceManager向資源調(diào)度平臺(tái)(Yarn)申請(qǐng)資源啟動(dòng)TaskManager
資源調(diào)度平臺(tái)分配資源(Yarn Container)后,由ApplicationMaster通知資源所在節(jié)點(diǎn)的NodeManager啟動(dòng)TaskManager
NodeManager加載Flink的Jar包和配置構(gòu)建環(huán)境并啟動(dòng)TaskManager,啟動(dòng)后直接向JobManager注冊(cè)自己
JobManager資源足夠后運(yùn)行job后,向taskManager的slot中deploy 任務(wù)

image.png

7.(slot占據(jù)內(nèi)存)


image.png
image.png
image.png
image.png
image.png
image.png

流處理系統(tǒng)與批處理系統(tǒng)最大不同在于節(jié)點(diǎn)間的數(shù)據(jù)傳輸方式

流處理系統(tǒng),其節(jié)點(diǎn)間數(shù)據(jù)傳輸?shù)臉?biāo)準(zhǔn)模型是:當(dāng)一條數(shù)據(jù)被處理完成后,序列化到緩存中,然后立刻通過(guò)網(wǎng)絡(luò)傳輸?shù)较乱粋€(gè)節(jié)點(diǎn),由下一個(gè)節(jié)點(diǎn)繼續(xù)處理。

批處理系統(tǒng),其節(jié)點(diǎn)間數(shù)據(jù)傳輸?shù)臉?biāo)準(zhǔn)模型是:當(dāng)一條數(shù)據(jù)被處理完成后,序列化到緩存中,并不會(huì)立刻通過(guò)網(wǎng)絡(luò)傳輸?shù)较乱粋€(gè)節(jié)點(diǎn),當(dāng)緩存寫(xiě)滿(mǎn),就持久化到本地硬盤(pán)上,當(dāng)所有數(shù)據(jù)都被處理完成后,才開(kāi)始將處理后的數(shù)據(jù)通過(guò)網(wǎng)絡(luò)傳輸?shù)较乱粋€(gè)節(jié)點(diǎn)。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容