關(guān)于MapReduce的三大階段、八大步驟

mapreduce的三大階段:

map階段:并行處理的階段
shuffle階段:從離開Mapper開啟到進(jìn)入Reduce之前的階段
reduce階段:匯總整理的階段
mapreduce的八大步驟

設(shè)置MapReduce的輸入InputFormat類型,默認(rèn)為TextInputFormat
自定義map函數(shù),得到TextInputFormat的k1,v1;經(jīng)過(guò)處理后傳出k2,v2
分區(qū)--默認(rèn)根據(jù)k2決定map中的數(shù)據(jù)該發(fā)送到哪個(gè)reduce中
排序--默認(rèn)根據(jù)k2進(jìn)行字典排序
規(guī)約--默認(rèn)沒(méi)有此階段,是優(yōu)化手段,可以提前合并
分組--相同k2的value會(huì)放到同一個(gè)集合中
自定義reduce函數(shù),講分組得到的k2,v2轉(zhuǎn)成k3,v3輸出
設(shè)置輸出的OutputFormat,默認(rèn)采用TextOutputFormat,將結(jié)果輸出到一個(gè)純文本文件中
————————————————
版權(quán)聲明:本文為CSDN博主「東城龐太師」的原創(chuàng)文章,遵循CC 4.0 BY-SA版權(quán)協(xié)議,轉(zhuǎn)載請(qǐng)附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/u011110301/article/details/104116052

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容